MicrosoftML (R-Paket in Machine Learning Services in SQL Server)

Gilt für: SQL Server 2016 (13.x) und höhere Versionen

MicrosoftML ist ein R-Paket von Microsoft, das leistungsstarke Machine-Learning-Algorithmen bereitstellt. Sie enthält Funktionen für Training, Transformationen, Bewertung, Text- und Bildanalyse sowie Featureextraktion zum Ableiten von Werten aus vorhandenen Daten. Das Paket ist in Machine Learning Services in SQL Server und in SQL Server 2016 R Services enthalten und unterstützt Hochleistung für Big Data. Dafür wird Verarbeitung mit mehreren Kernen und schnelles Datenstreaming verwendet. MicrosoftML enthält auch zahlreiche Transformationen für die Text- und Bildverarbeitung.

Vollständige Referenzdokumentation

Das MicrosoftML-Paket wird in mehreren Microsoft-Produkten bereitgestellt. Die Verwendung ist jedoch immer identisch, unabhängig davon, ob Sie das Paket in SQL Server oder einem anderen Produkt abrufen. Da die Funktionen identisch sind, wird die Dokumentation für einzelne RevoScaleR-Funktionen nur an einer Stelle in der R-Referenz veröffentlicht. Abweichungen durch produktspezifisches Verhalten finden Sie ggf. auf der Hilfeseite der Funktion.

Versionen und Plattformen

Das MicrosoftML-Paket basiert auf R 3.5.2 und ist nur verfügbar, wenn Sie eines der folgenden Microsoft-Produkte oder einen der Downloads installieren:

Hinweis

Vollständige Produktversionen sind in SQL Server 2017 nur unter Windows verfügbar. In SQL Server 2019 wird MicrosoftML sowohl unter Windows als auch unter Linux unterstützt.

Paketabhängigkeiten

Die Algorithmen folgender Elemente hängen in MicrosoftML von RevoScaleR ab:

  • Datenquellenobjekte: Die von MicrosoftML-Funktionen genutzten Daten werden mithilfe von RevoScaleR-Funktionen erstellt.
  • Remotecomputing (das Verschieben der Funktionsausführung in eine SQL Server-Remoteinstanz): Das RevoScaleR-Paket stellt Funktionen zum Erstellen und Aktivieren eines Remotecomputekontexts für SQL Server bereit.

In den meisten Fällen werden die Pakete bei der Verwendung von MicrosoftML zusammen geladen.

Funktionen nach Kategorie

In diesem Abschnitt werden die Funktionen nach Kategorien aufgelistet, damit Sie einen Überblick über die Verwendung der einzelnen Funktionen erhalten. Im Inhaltsverzeichnis können Sie in alphabetischer Reihenfolge nach den Funktionen suchen.

1: Machine Learning-Algorithmen

Funktionsname BESCHREIBUNG
rxFastTrees Implementierung von FastRank, effiziente Implementierung des Gradient Boosting-MART-Algorithmus.
rxFastForest Implementierung der zufälligen Gesamtstruktur und der Gesamtstruktur nach Quantilregression mit rxFastTrees.
rxLogisticRegression Logistische Regression mit L-BFGS.
rxOneClassSvm Einklassige Support Vector Machine.
rxNeuralNet Binäres, mehrklassiges und neuronales Regressionsnetzwerk.
rxFastLinear Optimierung des doppelten stochastischen Koordinatenanstiegs für die lineare binäre Klassifizierung und Regression.
rxEnsemble Trainiert eine Reihe von verschiedenen Modellen zur Steigerung der Vorhersageleistung im Vergleich zu einem einzelnen Modell.

2: Transformationsfunktionen

Funktionsname BESCHREIBUNG
concat Erstellt eine Spalte mit einem einzelnen Vektorwert aus mehreren Spalten.
categorical Erstellt einen Indikatorvektor durch Kategorietransformation mit einem Wörterbuch.
categoricalHash Konvertiert den Kategoriewert durch einen Hashvorgang in ein Indikatorarray.
featurizeText Erstellt aus einem angegebenen Textkorpus einen Behälter mit der Anzahl von Sequenzen aus aufeinander folgenden Wörtern (sogenannten N-Grammen). Enthält Spracherkennung, Tokenisierung, das Entfernen von Stoppwörtern, Textnormalisierung und Featuregenerierung.
getSentiment Bewertet Text in natürlicher Sprache und erstellt eine Spalte mit Wahrscheinlichkeiten, dass die Stimmung im Text positiv ist.
ngram Ermöglicht das Definieren von Argumenten für die anzahl- und hashbasierte Featureextraktion.
selectColumns Wählt mehrere Spalten aus, die erneut trainiert werden sollen, und löscht alle anderen Spalten.
selectFeatures Wählt unter Verwendung eines angegebenen Modus Funktionen aus den angegebenen Variablen aus.
loadImage Lädt Bilddaten.
resizeImage Ändert die Größe eines Bilds in eine angegebene Größe unter Verwendung einer angegebenen Methode zur Größenänderung.
extractPixels Extrahiert die Pixelwerte aus einem Bild.
featurizeImage Erstellt mithilfe eines vortrainierten tiefen neuronalen Netzwerkmodells Merkmale für ein Bild.

3: Bewertungs- und Trainingsfunktionen

Funktionsname BESCHREIBUNG
rxPredict.mlModel Führt die Bewertungsbibliothek entweder in SQL Server mithilfe der gespeicherten Prozedur oder über R-Code aus, um eine Echtzeitbewertung und dadurch eine wesentlich schnellere Vorhersageleistung zu erzielen.
rxFeaturize Wandelt Daten von einem Eingabedataset in ein Ausgabedataset um.
mlModel Stellt die Zusammenfassung eines Microsoft Machine Learning-Modells für R bereit.

4: Verlustfunktionen zur Klassifizierung und Regression

Funktionsname BESCHREIBUNG
expLoss Spezifikationen für eine Verlustfunktion für exponentielle Klassifizierungen.
logLoss Spezifikationen für eine Verlustfunktion für Protokollklassifizierungen.
hingeLoss Spezifikationen für eine Verlustfunktion für Scharnierklassifizierungen.
smoothHingeLoss Spezifikationen für eine Verlustfunktion für geglättete Scharnierklassifizierungen.
poissonLoss Spezifikationen für eine Verlustfunktion für Poisson-Regressionen.
squaredLoss Spezifikationen für eine Verlustfunktion für quadratische Regressionen.

5: Funktionsauswahlfunktionen

Funktionsname BESCHREIBUNG
minCount Spezifikation für die Funktionsauswahl im Anzahlmodus.
mutualInformation Spezifikation für die Funktionsauswahl im Transinformationsmodus.

6: Ensemble-Modellierungsfunktionen

Funktionsname BESCHREIBUNG
fastTrees Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines schnellen Strukturmodells mit rxEnsemble.
fastForest Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines schnellen Gesamtstrukturmodells mit rxEnsemble.
fastLinear Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines schnellen linearen Modells mit rxEnsemble.
logisticRegression Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines logistischen Regressionsmodells mit rxEnsemble.
oneClassSvm Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines OneClassSvm-Modells mit rxEnsemble.

7: Neuronale Netzwerkfunktionen

Funktionsname BESCHREIBUNG
optimizer Gibt Optimierungsalgorithmen für den Machine Learning-Algorithmus rxNeuralNet an.

8: Paketstatusfunktionen

Funktionsname BESCHREIBUNG
rxHashEnv Umgebungsobjekt zum Speichern des paketweiten Status.

Verwendung von MicrosoftML

Funktionen in MicrosoftML können in R-Code aufgerufen werden, der in gespeicherten Prozeduren gekapselt ist. Die meisten Entwickler erstellen MicrosoftML-Lösungen lokal, und migrieren den fertigen R-Code anschließend als Bereitstellungsübung in gespeicherte Prozeduren.

Das MicrosoftML-Paket für R ist in SQL Server 2017 bereits installiert.

Das Paket wird nicht standardmäßig geladen. Laden Sie zunächst das MicrosoftML-Paket und anschließend RevoScaleR, wenn Sie Remotecomputekontexte oder verbundene Verbindungs- oder Datenquellenobjekte verwenden müssen. Verweisen Sie dann auf die einzelnen Funktionen, die Sie benötigen.

library(microsoftml);
library(RevoScaleR);
logisticRegression(args);

Weitere Informationen