Was ist der Databricks-Assistent?

Der Databricks-Assistent fungiert als KI-basierter Begleitprogrammierer und Support-Agent, der das Erstellen von Notebooks, Abfragen und Dateien effizienter macht. Mit seiner Hilfe können Sie Fragen schnell beantworten, indem Code und Abfragen generiert, optimiert, vervollständigt, erläutert und korrigiert werden.

Diese Seite enthält allgemeine Informationen zum Assistenten. Wenn Sie Fragen zu Datenschutz und Sicherheit haben, lesen Sie den Artikel Datenschutz und Sicherheit.

Wie kann Databricks-Assistent helfen?

Der Databricks-Assistent kann bei den folgenden Aufgaben helfen:

Der Assistent verwendet Unity Catalog-Metadaten, um Ihre Tabellen, Spalten, Beschreibungen und beliebten Datenressourcen in Ihrem Unternehmen zu verstehen und personalisierte Antworten zu geben.

Der vom Databricks-Assistenten generierte Code ist für die Ausführung in einer Databricks-Computeumgebung vorgesehen. Er ist für die Erstellung von Code in von Databricks unterstützten Programmiersprachen, Frameworks und Dialekten optimiert. Er ist nicht als universeller Programmierassistent gedacht. Der Assistent verwendet häufig Informationen aus Databricks-Ressourcen, z. B. die Website der Databricks-Dokumentation oder Wissensdatenbank, um Benutzerabfragen besser zu beantworten. Es schneidet dann am besten ab, wenn sich die Benutzerfrage auf Fragen bezieht, die sich mithilfe von Wissen aus der Databricks-Dokumentation, dem Unity-Katalog und dem Benutzercode im Arbeitsbereich beantworten lassen.

Abrufen von Codierungshilfe vom Databricks-Assistenten

Um auf den Databricks-Assistenten zuzugreifen, klicken Sie auf das Assistenten-Symbol Symbol für den Hilfeassistenten im Produkt – Farbe auf der linken Seitenleiste des Notebooks, des Datei-Editors, des SQL-Editors oder der Dashboardregisterkarte Daten.

Symbol und Bereichsspeicherort des Databricks-Assistenten

Der Bereich „Assistent“ kann auf der linken oder rechten Seite des Bildschirms geöffnet werden.

Benutzer und Benutzerinnen sollten den vom Assistenten generierten Code immer überprüfen, bevor sie ihn ausführen, da er manchmal Fehler enthalten kann.

Erstellen von Datenvisualisierungen mithilfe des Databricks-Assistenten

Sie können den Databricks-Assistenten beim Entwerfen von Dashboards verwenden. Während Sie Visualisierungen für ein vorhandenes Dashboarddataset erstellen, fordern Sie den Assistenten mit Fragen auf, um Antworten in Form von generierten Diagrammen zu erhalten. Um den Assistenten in einem Dashboard zu verwenden, erstellen Sie zuerst ein oder mehrere Datasets, und fügen Sie dann dem Canvas ein Visualisierungswidget hinzu. Das Visualisierungs-Widget enthält eine Eingabeaufforderung zur Beschreibung Ihres neuen Diagramms. Geben Sie eine Beschreibung des Diagramms ein, das Sie anzeigen möchten, und der Assistent wird es generieren. Sie können das Diagramm genehmigen oder ablehnen oder die Beschreibung ändern, um etwas Neues zu generieren.

Details und Beispiele für die Verwendung des Assistenten mit Dashboards finden Sie unter Erstellen von Visualisierungen mit dem Databricks-Assistenten.

Von Databricks Assistant verwendete Dienste

Der Databricks-Assistent verwendet Azure OpenAI-Dienste, um Antworten bereitzustellen.

Der Azure OpenAI-Dienst wird von Microsoft betrieben, nicht von OpenAI, und unterliegt den jeweiligen Datenverwaltungsrichtlinien. An diesen Dienst gesendete Daten werden nicht für Modellschulungen verwendet. Ausführliche Informationen finden Sie in der Azure-Datenverwaltungsrichtlinie.

Für Azure OpenAI ist in Azure Databricks die Missbrauchsüberwachung deaktiviert, sodass keine Prompts oder Antworten in Azure OpenAI gespeichert werden.

Tipps zur Verbesserung der Genauigkeit der Ergebnisse

  • Verwenden Sie den Prompt „Tabellen suchen“, um bessere Antworten zu erhalten. Bevor Sie Fragen zu Daten in einer Tabelle stellen, fordern Sie den Assistenten auf, verwandte Tabellen nach Themen oder anderen Merkmalen zu suchen. Beispiel: Find tables related to NFL games.

  • Geben Sie die Struktur der gewünschten Antwort an. Die Struktur und die Details, die der Databricks-Assistent bereitstellt, variieren selbst bei ein- und demselben Prompt. Der Databricks-Assistent kennt Ihr Tabellen- und Spaltenschema und die Metadaten, sodass Sie Ihre Frage in natürlicher Sprache stellen können. Beispiel: List active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season. Assistent antwortet mithilfe von Daten aus Spalten wie s.player_id und s.attempts.

  • Stellen Sie Beispiele für Ihre Datenwerte auf Zeilenebene bereit. Der Databricks-Assistent hat keinen Zugriff auf Daten auf Zeilenebene, daher müssen Sie Beispiele für die Daten angeben, um genauere Antworten zu erhalten. Beispiel: List the average height for each position in inches. Dies gibt einen Fehler zurück, weil das Datasets die Höhe in Fuß und Zoll wie in 6-2 angibt.

  • Testen Sie Codeausschnitte, indem Sie sie im Bereich „Assistent“ ausführen. Verwenden Sie den Bereich „Assistent“ als Notizblock, in dem Sie die Wiederholungen Ihrer Abfragen und Assistentenantworten speichern. Sie können Code ausführen und im Bereich bearbeiten, bis Sie bereit sind, ihn einem Notebook hinzuzufügen.

    Testen sie Codeausschnitte, indem Sie sie im Bereich „Assistent“ ausführen.

  • Verwenden Sie Zellaktionen in einem Notebook. Zellaktionen umfassen Tastenkombinationen zu allgemeinen Aufgaben, z. B. Dokumentieren (Kommentieren), Reparieren und Erläutern von Code.

    Die Zellenaktion „/doc“ fordert den Assistenten auf, den Code zu kommentieren.

Vollständig illustrierte Beispiele finden Sie unter 5 Tipps für den Databricks-Assistenten.

Der Databricks-Assistent berücksichtigt den Unterhaltungsverlauf, damit Sie Ihre Fragen während dem Ausführen verfeinern können.

Was ist die Preisgestaltung für Databricks Assistant?

Alle aktuellen Databricks Assistant-Funktionen stehen für alle Kunden ohne zusätzliche Kosten zur Verfügung.

Benutzer zahlen nur für die Berechnung, die sie zum Ausführen ihrer Notizbücher, Abfragen, Aufträge usw. verwenden. Es gibt faire Nutzungsgrenzwerte, um Missbrauch zu verhindern. Die meisten Benutzer sind nicht von diesen Grenzwerten betroffen.

Feedback senden

Die beste Möglichkeit zum Senden von Feedback besteht in der Verwendung der Links Feedback geben im Notebook und SQL-Editor. Sie können auch eine E-Mail an assistant-feedback@databricks.com oder an Ihr Kontoteam senden.

Teilen Sie uns Vorschläge zur Produktverbesserung und Probleme mit der Benutzerfreundlichkeit mit, anstatt sich über die Genauigkeit der Eingabe zu beschweren. Wenn Sie einen nicht hilfreichen Vorschlag vom Assistenten erhalten, klicken Sie auf die Schaltfläche Symbol „Daumen nach unten“Nicht hilfreich.

Geografische Verfügbarkeit von Assistentenfeatures

Der Databricks-Assistent ist ein designierter Dienst, der Geografien verwendet, um die Datenresidenz bei der Verarbeitung von Kundeninhalten zu verwalten. Weitere Informationen zur Verfügbarkeit von Assistentenfeatures in verschiedenen geografischen Gebieten finden Sie unter Designierte Databricks-Dienste.

Datenschutz und Sicherheit

F: Welche Daten werden an die Modelle gesendet?

Der Databricks-Assistent sendet bei jeder API-Anforderung Code und Metadaten an die Modelle. Dies trägt dazu bei, relevantere Ergebnisse für Ihre Daten zurückzugeben. Beispiele:

  • Code/Abfragen in der aktuellen Notebookzelle oder der Registerkarte SQL-Editor
  • Tabellen- und Spaltennamen und -beschreibungen
  • Vorherige Fragen
  • Bevorzugte Tabellen

F: Berücksichtigen die an die Modelle gesendeten Metadaten die Unity-Katalogberechtigungen des Benutzers’?

Ja, alle an das Modell gesendeten Daten respektieren die Unity-Katalogberechtigungen des Benutzers, sodass keine Metadaten in Verbindung mit Tabellen gesendet werden, für die der Benutzer keine Berechtigung zur Einsicht hat.

F: Wenn ich eine Abfrage mit Ergebnissen ausführe und dann eine Frage stelle, werden die Ergebnisse meiner Abfrage dann an das Modell gesendet?

Nein, nur der Codeinhalt in Zellen, Metadaten zu Tabellen und der von Benutzer*innen eingegebene Text werden an das Modell gesendet. Für das Feature "Fehler beheben" gibt Databricks auch die Stapelüberwachung aus der Fehlerausgabe weiter.

F: Führt der Databricks-Assistent gefährlichen Code aus?

Nein Der Databricks-Assistent führt Code nicht automatisch in Ihrem Namen aus. KI-Modelle können Fehler machen, Absichten missverstehen, Antworten falsch interpretieren oder insgesamt falsche Antworten geben. Überprüfen und testen Sie KI-generierten Code, bevor Sie ihn ausführen.

F: Hat Databricks eine Bewertung durchgeführt, um die Genauigkeit und Angemessenheit der Antworten des Assistenten zu bewerten?

Ja. Databricks verfügt über Risikominderungen, um zu verhindern, dass der Assistent schädliche Antworten wie Hassreden, unsicheren Code, Prompt-Jailbreaks und urheberrechtlich geschützte Inhalte Dritter generiert. Databricks hat umfangreiche Tests aller unserer KI-Hilfsfeatures mit Tausenden simulierten Benutzereingaben durchgeführt, um die Robustheit von Risikominderungen zu bewerten. Diese Bewertungen konzentrierten sich auf die erwarteten Anwendungsfälle für den Assistenten, z. B. das Generieren von Code in den Sprachen Python, Databricks SQL, R und Scala.

F: Kann ich den Databricks-Assistenten mit Tabellen verwenden, die regulierte Daten verarbeiten (PHI, PCI, IRAP, FedRAMP)?

Ja. Dazu müssen Sie Anforderungen erfüllen. Sie müssen zum Beispiel das Compliancesicherheitsprofil aktivieren und bei der Konfiguration des Compliancesicherheitsprofils den relevanten Compliancestandard hinzufügen.