evento
Obtenha a certificação no Microsoft Fabric — gratuitamente!
19/11, 23 - 10/12, 23
Por um tempo limitado, a equipe da Comunidade do Microsoft Fabric está oferecendo vouchers de exame DP-600 gratuitos.
Prepare-se agoraEste browser já não é suportado.
Atualize para o Microsoft Edge para tirar partido das mais recentes funcionalidades, atualizações de segurança e de suporte técnico.
Importante
Este recurso está na visualização pública nas seguintes regiões: centralus
, eastus
, eastus2
, northcentralus
e westus
.
Este artigo descreve como criar e configurar uma execução usando a API Mosaic AI Model Training (anteriormente Foundation Model Training) e, em seguida, revisar os resultados e implantar o modelo usando a interface do usuário Databricks e o Mosaic AI Model Serving.
centralus
, eastus
, eastus2
, northcentralus
, westcentralus
, westus
, . westus3
Consulte Preparar dados para o treinamento do Mosaic AI Model.
Use o seguinte para instalar o databricks_genai
SDK.
%pip install databricks_genai
Em seguida, importe a foundation_model
biblioteca:
dbutils.library.restartPython()
from databricks.model_training import foundation_model as fm
Crie uma corrida de treinamento usando a função Mosaic AI Model Training create()
. Os seguintes parâmetros são necessários:
model
: o modelo que você quer treinar.train_data_path
: a localização do conjunto de dados de treinamento em.register_to
: o catálogo e o esquema do Catálogo Unity onde você deseja salvar os pontos de verificação.Por exemplo:
run = fm.create(model='meta-llama/Meta-Llama-3.1-8B-Instruct',
train_data_path='dbfs:/Volumes/main/my-directory/ift/train.jsonl', # UC Volume with JSONL formatted data
register_to='main.my-directory',
training_duration='1ep')
run
O tempo necessário para concluir uma execução de treinamento depende do número de tokens, do modelo e da disponibilidade da GPU. Para um treinamento mais rápido, o Databricks recomenda que você use computação reservada. Entre em contato com sua equipe de conta Databricks para obter detalhes.
Depois de iniciar sua execução, você pode monitorar o status dela usando get_events()
.
run.get_events()
Siga estas etapas para exibir os resultados na interface do usuário do Databricks:
LanguageCrossEntropy
Calcula entropia cruzada em saídas de modelagem de linguagem. Uma pontuação mais baixa é melhor.LanguagePerplexity
Mede o quão bem um modelo de linguagem prevê a próxima palavra ou caractere em um bloco de texto com base em palavras ou caracteres anteriores. Uma pontuação mais baixa é melhor.TokenAccuracy
Calcula a precisão no nível do token para modelagem de linguagem. Uma pontuação mais alta é melhor.Consulte O que é Mosaic AI Agent Evaluation?.
A execução de treinamento registra automaticamente seu modelo no Catálogo Unity após sua conclusão. O modelo é registrado com base no que você especificou no register_to
campo no método run create()
.
Para implantar o modelo para servir, siga estas etapas:
evento
Obtenha a certificação no Microsoft Fabric — gratuitamente!
19/11, 23 - 10/12, 23
Por um tempo limitado, a equipe da Comunidade do Microsoft Fabric está oferecendo vouchers de exame DP-600 gratuitos.
Prepare-se agora