Rozpocznij pracę z eksperymentami platformy MLflow
W tej kolekcji notesów pokazano, jak można uruchomić eksperyment MLflow.
Składniki MLflow
MLflow to platforma typu „open source” umożliwiająca zarządzanie całym cyklem życia uczenia maszynowego. MLflow ma trzy podstawowe składniki:
- Śledzenie
- Modele
- Projekty
Składnik MLflow Tracking umożliwia rejestrowanie i wykonywanie zapytań dotyczących sesji trenowania modelu maszynowego (przebiegów) przy użyciu następujących interfejsów API:
Przebieg platformy MLflow to zbiór parametrów, metryk, tagów i artefaktów skojarzonych z procesem trenowania modelu uczenia maszynowego.
Co to są eksperymenty w środowisku MLflow?
Eksperymenty są podstawową jednostką organizacji w rozwiązaniu MLflow. Wszystkie przebiegi MLflow należą do eksperymentu. Każdy eksperyment umożliwia wizualizowanie, wyszukiwanie i porównywanie przebiegów, a także pobieranie artefaktów przebiegu lub metadanych na potrzeby analizy w innych narzędziach. Eksperymenty są przechowywane na serwerze śledzenia MLflow hostowanym w usłudze Azure Databricks.
Eksperymenty znajdują się w drzewie plików obszaru roboczego . Eksperymenty są zarządzane przy użyciu tych samych narzędzi, których używasz do zarządzania innymi obiektami obszaru roboczego, takimi jak foldery, notesy i biblioteki.
Przykładowe notesy MLflow
W poniższych notesach pokazano, jak utworzyć i zalogować się do przebiegu platformy MLflow przy użyciu interfejsów API śledzenia MLflow, a także jak używać interfejsu użytkownika eksperymentu do wyświetlania przebiegu. Te notesy są dostępne w językach Python, Scala i R.
Notesy języka Python i języka R korzystają z eksperymentu notesu. Notes Scala tworzy eksperyment w folderze Shared
.
Uwaga
W przypadku środowiska Databricks Runtime 10.4 LTS ML i nowszych funkcja automatycznego rejestrowania usługi Databricks jest domyślnie włączona dla notesów języka Python.