Solucionar problemas do conector de formato ORC no Azure Data Factory e no Azure Synapse

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

Este artigo apresenta sugestões para solucionar problemas comuns do conector de formato ORC no Azure Data Factory e no Azure Synapse.

Código de erro: OrcJavaInvocationException

  • Mensagem: An error occurred when invoking Java, message: %javaException;.

  • Causas e recomendações: causas diferentes podem levar a esse erro. Marque a lista abaixo para obter a possível análise de causa e a recomendação relacionada.

    Análise da causa Recomendação
    Quando a mensagem de erro contém as strings "java.lang.OutOfMemory", "Java heap space" e "doubleCapacity", geralmente é um problema de gerenciamento de memória em uma versão antiga do tempo de execução de integração. Se você estiver usando o Integration Runtime hospedado automaticamente, recomendamos que você atualize para a versão mais recente.
    Quando a mensagem de erro contém a sequência "java.lang.OutOfMemory", o tempo de execução de integração não tem recursos suficientes para processar os arquivos. Limite as execuções simultâneas no runtime de integração. Para IR auto-hospedado, expanda para uma máquina poderosa com memória igual ou maior que 8 GB.
    Quando a mensagem de erro contém a string "NullPointerReference", a causa pode ser um erro temporário. Repita a operação. Se o problema persistir, contate o Suporte.
    Quando a mensagem de erro contém a string "BufferOverflowException", a causa pode ser um erro temporário. Repita a operação. Se o problema persistir, contate o Suporte.
    Quando a mensagem de erro contém a string "java.lang.ClassCastException: org.apache.hadoop.hive.serde2.io.HiveCharWritable não pode ser convertida em org.apache.hadoop.io.Text", a causa pode ser um tipo problema de conversão dentro do Java Runtime. Normalmente, isso significa que os dados de origem não podem ser bem tratados no Java Runtime. Esse é um problema de dados. Tente usar uma cadeia de caracteres em vez de char ou varchar em dados de formato ORC.

Código de erro: OrcDateTimeExceedLimit

  • Mensagem: The Ticks value '%ticks;' for the datetime column must be between valid datetime ticks range -621355968000000000 and 2534022144000000000.

  • Causa: se o valor de data e hora for '0001-01-01 00:00:00', pode ser causado pelas diferenças entre o calendário Juliano e o calendário Gregoriano.

  • Recomendação: verifique o valor de tiques e evite usar o valor de datetime '0001-01-01 00:00:00'.

Para obter mais ajuda com a solução de problemas, experimente estes recursos: