Übersicht über Copilot für Data Science und Datentechnik (Vorschau)

Wichtig

Dieses Feature befindet sich in Vorschau.

Copilot für Data Science- und Datentechnik ist ein KI-Assistent, mit dem Daten analysiert und visualisiert werden können. Es funktioniert mit Lakehouse-Tabellen und -Dateien, Power BI-Datasets und Pandas/Spark/Fabric-Datenframes, die Antworten und Codeausschnitte direkt im Notebook bereitstellen. Die effektivste Methode der Verwendung von Copilot besteht darin, Ihre Daten als Datenframe hinzuzufügen. Sie können Ihre Fragen im Chatbereich stellen, und die KI stellt Antworten oder Code bereit, den Sie in Ihr Notebook kopieren können. Copilot versteht das Schema und die Metadaten Ihrer Daten, und wenn Daten in einen Datenframe geladen werden, kennt er auch die Daten innerhalb des Datenframes. Sie können Copilot bitten, Einblicke in Daten bereitzustellen, Code für Visualisierungen zu erstellen oder Code für Datentransformationen bereitzustellen und Dateinamen für einfache Verweise zu erkennen. Copilot optimiert die Datenanalyse, indem komplexe Codierungen eliminiert werden.

Hinweis

Einführung in Copilot für Data Science und Datentechnik für Fabric Data Science

Mit Copilot für Data Science und Datentechnik können Sie mit einem KI-Assistenten chatten, der Sie bei Ihren Datenanalyse- und Visualisierungsaufgaben unterstützt. Sie können Copilot Fragen zu Lakehouse-Tabellen, Power BI-Datasets oder Pandas/Spark-Datenframes in Notebooks stellen. Copilot antwortet in natürlicher Sprache oder Codeausschnitten. Copilot kann auch datenspezifischen Code für Sie generieren, je nach Aufgabe. Beispielsweise kann Copilot für Data Science und Datentechnik Code für Folgendes generieren:

  • Diagrammerstellung
  • Filtern von Daten
  • Anwenden von Transformationen
  • Machine Learning-Modelle

Wählen Sie zuerst im Menüband „Notebooks“ das Symbol für Copilot aus. Der Copilot-Chatbereich wird geöffnet, und oben im Notizbuch wird eine neue Zelle angezeigt. Diese Zelle muss jedes Mal ausgeführt werden, wenn eine Spark-Sitzung in einem Fabric-Notebook geladen wird. Andernfalls funktioniert die Copilot-Erfahrung nicht ordnungsgemäß. Wir sind dabei, andere Mechanismen für die Handhabung dieser erforderlichen Initialisierung in zukünftigen Versionen zu evaluieren.

Screenshot des Copilot-Bands.

Führen Sie die Zelle oben im Notebook mit diesem Code aus:

#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics

Nachdem die Zelle erfolgreich ausgeführt wurde, können Sie Copilot verwenden. Sie müssen die Zelle am oberen Rand des Notebooks jedes Mal erneut ausführen, wenn Ihre Sitzung im Notebook geschlossen wird.

Screenshot zeigt erfolgreiche Ausführung der Zelle.

Um die Effektivität von Copilot zu maximieren, laden Sie eine Tabelle oder ein Dataset als Datenframe in Ihrem Notebook. Auf diese Weise kann die KI auf die Daten zugreifen und deren Struktur und Inhalt verstehen. Beginnen Sie dann, mit der KI zu chatten. Wählen Sie das Chatsymbol in der Notebooksymbolleiste aus, und geben Sie Ihre Frage oder Anforderung in den Chatbereich ein. Sie können beispielsweise Folgendes fragen:

  • „Was ist das durchschnittliche Alter der Kund*innen in diesem Dataset?“
  • „Zeige ein Balkendiagramm der Umsätze nach Region an!“

Sowie weitere Möglichkeiten Copilot reagiert mit der Antwort oder dem Code, und Sie können diese Antwort oder diesen Code in Ihr Notebook einfügen. Copilot für Data Science und Datentechnik ist eine bequeme, interaktive Möglichkeit, Ihre Daten zu erkunden und zu analysieren.

Während Sie Copilot verwenden, können Sie auch die Magic-Befehle innerhalb einer Notebookzelle aufrufen, um die Ausgabe direkt im Notebook zu erhalten. Für Antworten in natürlicher Sprache können Sie beispielsweise mit dem Befehl „%%chat“ Fragen stellen, z. B.:

%%chat
What are some machine learning models that may fit this dataset?

Screenshot zeigt Codegenerierung.

or

%%code
Can you generate code for a logistic regression that fits this data?

Screenshot der Generierung des Codes für die logistische Regression.

Copilot für Data Science und Datentechnik verfügt auch über Schema- und Metadatenbewusstsein für Tabellen im Lakehouse. Copilot kann relevante Informationen im Kontext Ihrer Daten in einem angefügten Lakehouse bereitstellen. Sie können beispielsweise Folgendes fragen:

  • „Wie viele Tabellen befinden sich im Lakehouse?“
  • „Was sind die Spalten der Tabelle für Kunden?“

Copilot antwortet mit den relevanten Informationen, wenn Sie das Lakehouse zum Notebook hinzugefügt haben. Copilot hat auch das Bewusstsein für die Namen der Dateien, die jedem Lakehouse hinzugefügt werden, das an das Notebook angefügt ist. Sie können in Ihrem Chat auf diese Dateien mit ihrem Namen verweisen. Wenn Sie beispielsweise eine Datei mit dem Namen sales.csv in Ihrem Lakehouse haben, können Sie auffordern: „Erstelle einen Datenrahmen aus sales.csv.“ Copilot generiert den Code und zeigt ihn im Chatbereich an. Mit Copilot für Notebooks können Sie ganz einfach auf Ihre Daten aus verschiedenen Quellen zugreifen und diese abfragen. Sie benötigen dafür nicht die genaue Befehlssyntax.

Tipps

  • „Löschen“ Sie Ihre Unterhaltung im Copilot-Chatpanel mit dem Besen, der sich oben im Chatbereich befindet. Copilot behält das Wissen über alle Eingaben oder Ausgaben während der Sitzung bei, aber das hilft, wenn Sie den aktuellen Inhalt als störend empfinden.
  • Verwenden Sie die Chat-Magics-Bibliothek, um Einstellungen zu Copilot zu konfigurieren, einschließlich Datenschutzeinstellungen. Der standardmäßige Freigabemodus ist so konzipiert, dass Copilot Zugriff auf die maximale Kontextfreigabe hat, sodass das Einschränken der Informationen, die copilot bereitgestellt werden, die Relevanz der Antworten direkt und erheblich beeinflussen kann.
  • Wenn Copilot zum ersten Mal startet, bietet es eine Reihe hilfreicher Eingabeaufforderungen, die Ihnen bei den ersten Schritten helfen können. Sie können Sie dabei unterstützen, Ihre Unterhaltung mit Copilot zu starten. Um später auf Eingabeaufforderungen zu verweisen, können Sie die funkelnde Schaltfläche am unteren Rand des Chatbereichs verwenden.
  • Sie können die Randleiste des copilot-Chats ziehen, um den Chatbereich zu erweitern, Code klarer anzuzeigen oder die Lesbarkeit der Ausgaben auf dem Bildschirm zu verbessern.

Begrenzungen

Die Copilot-Funktionen in der Data Science-Erfahrung sind derzeit auf Notebooks beschränkt. Zu diesen Funktionen gehören das Copilot-Chatfenster, IPython-Magic-Befehle, die innerhalb einer Codezelle verwendet werden können, und automatische Code-Vorschläge, während Sie eine Codezelle eingeben. Copilot kann auch semantische Power BI-Modelle lesen, indem es einen semantischen Link integriert.

Copilot hat zwei Hauptverwendungszwecke:

  • Erstens können Sie Copilot bitten, die Daten in Ihrem Notebook zu untersuchen und zu analysieren (indem Sie z. B. zuerst einen DataFrame laden und dann Copilot nach den Daten im DataFrame fragen).
  • Zweitens können Sie Copilot bitten, eine Reihe von Vorschlägen zu Ihrem Datenanalyseprozess zu generieren, z. B. welche Vorhersagemodelle relevant sein könnten, Code zur Durchführung verschiedener Arten von Datenanalysen und Dokumentation für ein vollständiges Notebook.

Denken Sie daran, dass die Codegenerierung mit schnelllebigen oder kürzlich veröffentlichten Bibliotheken Ungenauigkeiten oder Verfälschungen enthalten kann.