Problema conhecido - as instruções de importação do PySpark falham para arquivos .jar instalados através do ambiente

Você pode carregar um arquivo de biblioteca personalizado com um formato .jar em um ambiente de malha. Embora o carregamento e a publicação do ambiente sejam bem-sucedidos, o comando import falha na sessão do PySpark.

Estado: Corrigido: 7 de novembro de 2024

Experiência do produto: Engenharia de dados

Sintomas

Em uma sessão do PySpark, a instrução import library falha com um erro Class not found . A biblioteca personalizada com um formato .jar foi instalada através de um ambiente.

Soluções e soluções alternativas

Para contornar esse problema, você pode usar o seguinte comando para instalar a biblioteca na sessão do bloco de anotações: %%configure -f { "conf": { "spark.jars": <>", } } Como alternativa, você pode alternar de uma sessão PySpark para uma sessão Scala, se aplicável.