SKLearn Klass
Skapar en beräkning för träning i Scikit-learn-experiment.
DEPRECATED. Använd objektet ScriptRunConfig med din egen definierade miljö eller den AzureML-Tutorial kuraterade miljön. En introduktion till hur du konfigurerar SKLearn-experimentkörningar med ScriptRunConfig finns i Träna scikit-learn-modeller i stor skala med Azure Machine Learning.
Den här uppskattningen stöder endast cpu-träning med en nod.
Versioner som stöds: 0.20.3
Initiera en Scikit-learn-skattare.
- Arv
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parametrar
Name | Description |
---|---|
source_directory
Obligatorisk
|
En lokal katalog som innehåller experimentkonfigurationsfiler. |
compute_target
Obligatorisk
|
AbstractComputeTarget eller
str
Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett -objekt eller strängen "lokal". |
vm_size
Obligatorisk
|
VM-storleken för beräkningsmålet som ska skapas för träningen. Värden som stöds: Valfri storlek på virtuella Azure-datorer. |
vm_priority
Obligatorisk
|
VM-prioriteten för beräkningsmålet som ska skapas för träningen. Om inget anges används "dedikerad". Värden som stöds: "dedikerad" och "lågprioritet". Detta börjar endast gälla när |
entry_script
Obligatorisk
|
En sträng som representerar den relativa sökvägen till filen som används för att starta träningen. |
script_params
Obligatorisk
|
En ordlista med kommandoradsargument som ska skickas till träningsskriptet som anges i |
custom_docker_image
Obligatorisk
|
Namnet på den Docker-avbildning som avbildningen som ska användas för träning kommer att skapas. Om den inte anges används en standard-CPU-baserad avbildning som basavbildning. |
image_registry_details
Obligatorisk
|
Information om Docker-avbildningsregistret. |
user_managed
Obligatorisk
|
Anger om Azure ML återanvänder en befintlig Python-miljö. Falskt innebär att AzureML skapar en Python-miljö baserat på specifikationen för conda-beroenden. |
conda_packages
Obligatorisk
|
En lista med strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet. |
pip_packages
Obligatorisk
|
En lista med strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet. |
conda_dependencies_file_path
Obligatorisk
|
En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden.
Om detta anges installerar Inte Azure ML några ramverksrelaterade paket.
Detta kan anges i kombination med parametern |
pip_requirements_file_path
Obligatorisk
|
En sträng som representerar den relativa sökvägen till textfilen pip-krav.
Detta kan anges i kombination med parametern |
conda_dependencies_file
Obligatorisk
|
En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden.
Om detta anges installerar Inte Azure ML några ramverksrelaterade paket.
Detta kan anges i kombination med parametern |
pip_requirements_file
Obligatorisk
|
En sträng som representerar den relativa sökvägen till textfilen pip-krav.
Detta kan anges i kombination med parametern |
environment_variables
Obligatorisk
|
En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i processen där användarskript körs. |
environment_definition
Obligatorisk
|
Miljödefinitionen för ett experiment innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med hjälp av |
inputs
Obligatorisk
|
En lista över DataReference eller DatasetConsumptionConfig objekt som ska användas som indata. |
shm_size
Obligatorisk
|
Storleken på Docker-containerns delade minnesblock. Om det inte anges används standard azureml.core.environment._DEFAULT_SHM_SIZE. |
resume_from
Obligatorisk
|
Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från. |
max_run_duration_seconds
Obligatorisk
|
Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet. |
framework_version
Obligatorisk
|
Scikit-learn-versionen som ska användas för att köra träningskod.
|
source_directory
Obligatorisk
|
En lokal katalog som innehåller experimentkonfigurationsfiler. |
compute_target
Obligatorisk
|
AbstractComputeTarget eller
str
Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett -objekt eller strängen "lokal". |
vm_size
Obligatorisk
|
VM-storleken för beräkningsmålet som ska skapas för träningen. Värden som stöds: Valfri storlek på virtuella Azure-datorer. |
vm_priority
Obligatorisk
|
VM-prioriteten för beräkningsmålet som ska skapas för träningen. Om inget anges används "dedikerad". Värden som stöds: "dedikerad" och "lågprioritet". Detta börjar endast gälla när |
entry_script
Obligatorisk
|
En sträng som representerar den relativa sökvägen till filen som används för att starta träningen. |
script_params
Obligatorisk
|
En ordlista med kommandoradsargument som ska skickas till träningsskriptet som anges i |
use_docker
Obligatorisk
|
Ett bool-värde som anger om miljön som ska köra experimentet ska vara Docker-baserad. |
custom_docker_image
Obligatorisk
|
Namnet på den Docker-avbildning som avbildningen som ska användas för träning kommer att skapas. Om den inte anges används en standard-CPU-baserad avbildning som basavbildning. |
image_registry_details
Obligatorisk
|
Information om Docker-avbildningsregistret. |
user_managed
Obligatorisk
|
Anger om Azure ML återanvänder en befintlig Python-miljö. Falskt innebär att AzureML skapar en Python-miljö baserat på specifikationen för conda-beroenden. |
conda_packages
Obligatorisk
|
En lista med strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet. |
pip_packages
Obligatorisk
|
En lista med strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet. |
conda_dependencies_file_path
Obligatorisk
|
En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket.
Detta kan anges i kombination med parametern |
pip_requirements_file_path
Obligatorisk
|
En sträng som representerar den relativa sökvägen till textfilen pip-krav.
Detta kan anges i kombination med parametern |
conda_dependencies_file
Obligatorisk
|
En sträng som representerar den relativa sökvägen till yaml-filen med conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket.
Detta kan anges i kombination med parametern |
pip_requirements_file
Obligatorisk
|
En sträng som representerar den relativa sökvägen till textfilen pip-krav.
Detta kan anges i kombination med parametern |
environment_variables
Obligatorisk
|
En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i processen där användarskript körs. |
environment_definition
Obligatorisk
|
Miljödefinitionen för ett experiment innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med hjälp av |
inputs
Obligatorisk
|
En lista över azureml.data.data_reference. DataReference-objekt som ska användas som indata. |
shm_size
Obligatorisk
|
Storleken på Docker-containerns delade minnesblock. Om inte anges används standard azureml.core.environment._DEFAULT_SHM_SIZE. |
resume_from
Obligatorisk
|
Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från. |
max_run_duration_seconds
Obligatorisk
|
Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet. |
framework_version
Obligatorisk
|
Scikit-learn-versionen som ska användas för att köra träningskod.
|
_enable_optimized_mode
Obligatorisk
|
Aktivera inkrementell miljöversion med färdiga ramverksbilder för snabbare förberedelse av miljön. En fördefinierad ramverksavbildning bygger på Azure ML-standard-CPU/GPU-basavbildningar med ramverksberoenden förinstallerade. |
_disable_validation
Obligatorisk
|
Inaktivera skriptvalidering innan du kör sändningen. Standardvärdet är Sant. |
_show_lint_warnings
Obligatorisk
|
Visa varningar om skriptlindning. Standardvärdet är Falskt. |
_show_package_warnings
Obligatorisk
|
Visa paketverifieringsvarningar. Standardvärdet är Falskt. |
Kommentarer
När du skickar ett träningsjobb kör Azure ML skriptet i en conda-miljö i en Docker-container. SKLearn-containrar har följande beroenden installerade.
Beroenden | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Senaste | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Docker-avbildningarna utökar Ubuntu 16.04.
Om du behöver installera ytterligare beroenden kan du antingen använda parametrarna pip_packages
eller conda_packages
eller så kan du ange din pip_requirements_file
eller conda_dependencies_file
filen. Du kan också skapa en egen avbildning och skicka parametern custom_docker_image
till beräkningskonstruktorn.
Attribut
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'