DatabricksCluster Classe
Define informações de cluster do Databricks para uso em um DatabricksSection.
Inicializar.
- Herança
-
azureml._base_sdk_common.abstract_run_config_element._AbstractRunConfigElementDatabricksCluster
Construtor
DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)
Parâmetros
Nome | Description |
---|---|
existing_cluster_id
|
Uma ID de um cluster interativo existente no workspace do Databricks. Se esse parâmetro for especificado, nenhum dos outros deverá ser. Valor padrão: None
|
spark_version
|
A versão do Spark para o cluster de execução do Databricks. Exemplo: "10.4.x-scala2.12". Valor padrão: None
|
node_type
|
Os tipos de nó de VM do Azure para o cluster de execução do Databricks. Exemplo: "Standard_D3_v2". Valor padrão: None
|
instance_pool_id
|
A ID do pool de instâncias ao qual o cluster precisa ser anexado. Valor padrão: None
|
num_workers
|
O número de trabalhadores para um cluster de execução do Databricks. Se esse parâmetro for especificado, os parâmetros Valor padrão: None
|
min_workers
|
O número mínimo de trabalhadores para um cluster do Databricks com dimensionamento automático. Valor padrão: None
|
max_workers
|
O número de trabalhadores para um cluster de execução do Databricks com dimensionamento automático. Valor padrão: None
|
spark_env_variables
|
dict(<xref:{str:str}>)
As variáveis de ambiente do Spark para o cluster de execução do Databricks. Valor padrão: None
|
spark_conf
|
dict(<xref:{str:str}>)
A configuração do Spark para o cluster de execução do Databricks. Valor padrão: None
|
init_scripts
|
Preterido. O Databricks anunciou que o script de inicialização armazenado no DBFS interromperá o trabalho após 1º de dezembro de 2023. Para atenuar o problema, use scripts de inicialização globais no databricks após https://video2.skills-academy.com/azure/databricks/init-scripts/global 2) comente a linha de init_scripts na etapa do AzureML databricks. Valor padrão: None
|
cluster_log_dbfs_path
|
O caminho do DBFS para o qual os logs de clusters precisam ser entregues. Valor padrão: None
|
permit_cluster_restart
|
se existing_cluster_id for especificado, esse parâmetro informará se o cluster pode ser reiniciado em nome do usuário. Valor padrão: None
|
Métodos
validate |
Validar os detalhes do cluster do Databricks especificados. Validar verifica os tipos de parâmetros fornecidos, bem como se a combinação correta de parâmetros foi fornecida. Por exemplo, você precisa especificar |
validate
Validar os detalhes do cluster do Databricks especificados.
Validar verifica os tipos de parâmetros fornecidos, bem como se a combinação correta de parâmetros foi fornecida. Por exemplo, você precisa especificar existing_cluster_id
ou o restante dos parâmetros de cluster. Para saber mais, confira as definições de parâmetro do construtor.
validate()
Exceções
Tipo | Description |
---|---|
class:azureml.exceptions.UserErrorException
|