Visão geral do Copilot para Ciência de Dados e Engenharia de Dados (versão prévia)

Importante

Esse recurso está em preview.

O Copilot para Ciência de Dados e Engenharia de Dados é um assistente de IA que ajuda a analisar e visualizar dados. Ele funciona com tabelas e arquivos do Lakehouse, conjuntos de dados do Power BI e dataframes pandas/spark/fabric, fornecendo respostas e snippets de código diretamente no notebook. A maneira mais eficaz de usar o Copilot é adicionando seus dados como um dataframe. Você pode fazer perguntas no painel de chat e a IA fornece respostas ou código para copiar em seu notebook. Ele entende o esquema e os metadados de seus dados e, se os dados forem carregados em um dataframe, ele também terá reconhecimento dos dados dentro do enquadramento de dados. Você pode pedir ao Copilot para fornecer insights sobre dados, criar código para visualizações ou fornecer código para transformações de dados e reconhecer nomes de arquivo para uma referência fácil. O Copilot simplifica a análise de dados eliminando a codificação complexa.

Observação

Introdução ao Copilot para Ciência de Dados e Engenharia de Dados para Ciência de Dados do Fabric

Com o Copilot para Ciência de Dados e Engenharia de Dados, você pode conversar com um assistente de IA que pode ajudá-lo a lidar com suas tarefas de análise e visualização de dados. Você pode fazer as perguntas ao Copilot sobre tabelas do lakehouse, conjuntos de dados do Power BI ou dataframes do Pandas/Spark dentro de notebooks. O Copilot responde em linguagem natural ou snippets de código. O Copilot também pode gerar código específico de dados para você, dependendo da tarefa. Por exemplo, o Copilot para Ciência de Dados e Engenharia de Dados pode gerar código para:

  • Criação de gráfico
  • Filtrando dados
  • Aplicação de transformações
  • Modelos de machine learning

Primeiro, selecione o ícone Copilot na faixa de opções do notebook. O painel de chat do Copilot é aberto e uma nova célula aparece na parte superior do notebook. Essa célula deve ser executada sempre que uma sessão do Spark for carregada em um notebook do Fabric. Caso contrário, a experiência do Copilot não funcionará corretamente. Estamos no processo de avaliar outros mecanismos para lidar com essa inicialização necessária em versões futuras.

Captura de tela mostrando a faixa de opções do Copilot.

Execute a célula no topo do notebook, com este código:

#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics

Depois que a célula for executada com êxito, você poderá usar o Copilot. Você deve executar novamente a célula na parte superior do notebook sempre que a sessão no notebook for encerrada.

Captura de tela mostrando a execução bem-sucedida da célula.

Para maximizar a eficácia do Copilot, carregue uma tabela ou conjunto de dados como um dataframe em seu notebook. Dessa forma, a IA pode acessar os dados e entender sua estrutura e conteúdo. Em seguida, comece a conversar com a IA. Selecione o ícone de chat na barra de ferramentas do notebook e digite sua pergunta ou solicitação no painel de chat. Por exemplo, você pode perguntar:

  • "Qual é a idade média dos clientes neste conjunto de dados?"
  • "Mostre um gráfico de barras de vendas por região"

E muito mais. O Copilot fornece uma resposta ou código que você pode copiar e colar no seu notebook. O Copilot para Ciência de Dados e Engenharia de Dados é uma maneira conveniente e interativa de explorar e analisar seus dados.

Ao usar o Copilot, você também pode invocar os comandos magic dentro de uma célula do notebook para obter a saída diretamente no notebook. Por exemplo, para respostas de linguagem natural, você pode fazer perguntas usando o comando "%%chat", como:

%%chat
What are some machine learning models that may fit this dataset?

Captura de tela mostrando a geração de código.

ou

%%code
Can you generate code for a logistic regression that fits this data?

Captura de tela mostrando a geração de código de regressão logística.

O Copilot para Ciência de Dados e Engenharia de Dados também tem o reconhecimento de metadados e esquema de tabelas no lakehouse. O Copilot pode fornecer informações relevantes no contexto de seus dados em um lakehouse anexado. Por exemplo, você pode perguntar:

  • "Quantas tabelas há no lakehouse?"
  • "Quais são as colunas dos clientes da tabela?"

O Copilot responde com as informações relevantes, caso você tenha adicionado o lakehouse ao notebook. O Copilot também tem reconhecimento dos nomes dos arquivos adicionados a qualquer lakehouse anexado ao notebook. Você pode consultar esses arquivos pelo nome em seu chat. Por exemplo, se você tiver um arquivo chamado sales.csv em seu lakehouse, poderá pedir para "Criar um dataframe de sales.csv". O Copilot gera o código e o exibe no painel de chat. Com o Copilot para notebooks, você pode acessar e consultar facilmente seus dados de diferentes fontes. Você não precisa da sintaxe de comando exata para fazer isso.

Dicas

  • "Limpe" sua conversa no painel de chat do Copilot com a vassoura localizada na parte superior do painel de chat. O Copilot mantém o conhecimento de quaisquer entradas ou saídas durante a sessão, mas isso ajuda se você achar que o conteúdo atual causa distração.
  • Use a biblioteca de chat magics para definir as configurações sobre o Copilot, incluindo configurações de privacidade. O modo de compartilhamento padrão é projetado para maximizar o compartilhamento de contexto ao qual Copilot tem acesso, então limitar as informações fornecidas a copilot pode impactar diretamente e significativamente a relevância das suas respostas.
  • Quando o Copilot é iniciado pela primeira vez, ele oferece um conjunto de prompts úteis que podem ajudá-lo a começar. Eles podem ajudar a iniciar sua conversa com o Copilot. Para fazer referência aos prompts posteriormente, você pode usar o botão de brilho na parte inferior do painel de chat.
  • Você pode "arrastar" a barra lateral do chat copilot para expandir o painel de chat, para visualizar o código mais claramente ou para melhorar a legibilidade das saídas na sua tela.

Limitações

Atualmente, os recursos do Copilot na experiência de Ciência de Dados estão no escopo dos notebooks. Esses recursos incluem o painel de chat do Copilot, os comandos magic do IPython que podem ser usados dentro de uma célula de código e sugestões automáticas de código conforme você digita em uma célula de código. O Copilot também pode ler modelos semânticos do Power BI usando uma integração de link semântico.

O Copilot tem dois usos principais pretendidos:

  • Primeiro, você pode pedir ao Copilot para examinar e analisar dados em seu notebook (por exemplo, primeiro carregando um DataFrame e, em seguida, perguntando ao Copilot sobre dados dentro do DataFrame).
  • Segundo, você pode pedir ao Copilot para gerar uma série de sugestões sobre seu processo de análise de dados, como quais modelos preditivos podem ser relevantes, código para executar diferentes tipos de análise de dados e documentação para um notebook concluído.

Tenha em mente que a geração de código com bibliotecas de rápido desenvolvimento ou recém-lançadas pode incluir imprecisões ou fabricações.