AksEndpointDeploymentConfiguration Klasse
Hinweis
Dies ist eine experimentelle Klasse, die jederzeit geändert werden kann. Unter https://aka.ms/azuremlexperimental finden Sie weitere Informationen.
Stellt Informationen zur Bereitstellungskonfiguration für einen Dienst dar, der auf Azure Kubernetes Service bereitgestellt wird
Erstellt ein AksEndpointDeploymentConfiguration-Objekt mithilfe der deploy_configuration
-Methode der AksEndpoint-Klasse
Initialisieren Sie ein Konfigurationsobjekt für die Bereitstellung eines Endpunkts in einem AKS-Computeziel.
- Vererbung
-
AksEndpointDeploymentConfiguration
Konstruktor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parameter
Name | Beschreibung |
---|---|
autoscale_enabled
Erforderlich
|
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn |
autoscale_min_replicas
Erforderlich
|
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1. |
autoscale_max_replicas
Erforderlich
|
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10. |
autoscale_refresh_seconds
Erforderlich
|
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1. |
autoscale_target_utilization
Erforderlich
|
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70. |
collect_model_data
Erforderlich
|
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“. |
auth_enabled
Erforderlich
|
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
cpu_cores
Erforderlich
|
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1 |
memory_gb
Erforderlich
|
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“. |
enable_app_insights
Erforderlich
|
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert lautet „False“. |
scoring_timeout_ms
Erforderlich
|
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000. |
replica_max_concurrent_requests
Erforderlich
|
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet. |
max_request_wait_time
Erforderlich
|
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500. |
num_replicas
Erforderlich
|
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert. |
primary_key
Erforderlich
|
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll. |
secondary_key
Erforderlich
|
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll. |
tags
Erforderlich
|
Wörterbuch der Schlüsselwerttags für diesen Webdienst |
properties
Erforderlich
|
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden. |
description
Erforderlich
|
Eine Beschreibung für diesen Webdienst |
gpu_cores
Erforderlich
|
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0. |
period_seconds
Erforderlich
|
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1. |
initial_delay_seconds
Erforderlich
|
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden Der Standardwert ist 310. |
timeout_seconds
Erforderlich
|
Die Anzahl der Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1. |
success_threshold
Erforderlich
|
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird Der Standardwert lautet 1. Der Mindestwert ist 1. |
failure_threshold
Erforderlich
|
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von |
namespace
Erforderlich
|
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden. |
token_auth_enabled
Erforderlich
|
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“. |
version_name
Erforderlich
|
Der Name der Version in einem Endpunkt. |
traffic_percentile
Erforderlich
|
Die Menge des Datenverkehrs, den die Version in einem Endpunkt empfängt. |
cpu_cores_limit
Erforderlich
|
Die maximale Anzahl der CPU-Kerne, die dieser Webdienst verwenden darf. Kann eine Dezimalzahl sein. |
memory_gb_limit
Erforderlich
|
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein. |
autoscale_enabled
Erforderlich
|
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn |
autoscale_min_replicas
Erforderlich
|
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1. |
autoscale_max_replicas
Erforderlich
|
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10. |
autoscale_refresh_seconds
Erforderlich
|
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1. |
autoscale_target_utilization
Erforderlich
|
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70. |
collect_model_data
Erforderlich
|
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“. |
auth_enabled
Erforderlich
|
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
cpu_cores
Erforderlich
|
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1 |
memory_gb
Erforderlich
|
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“. |
enable_app_insights
Erforderlich
|
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert lautet „False“. |
scoring_timeout_ms
Erforderlich
|
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000. |
replica_max_concurrent_requests
Erforderlich
|
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet. |
max_request_wait_time
Erforderlich
|
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500. |
num_replicas
Erforderlich
|
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert. |
primary_key
Erforderlich
|
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll. |
secondary_key
Erforderlich
|
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll. |
tags
Erforderlich
|
Wörterbuch der Schlüsselwerttags für diesen Webdienst |
properties
Erforderlich
|
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden. |
description
Erforderlich
|
Eine Beschreibung für diesen Webdienst |
gpu_cores
Erforderlich
|
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0. |
period_seconds
Erforderlich
|
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1. |
initial_delay_seconds
Erforderlich
|
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden Der Standardwert ist 310. |
timeout_seconds
Erforderlich
|
Die Anzahl der Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1. |
success_threshold
Erforderlich
|
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird Der Standardwert lautet 1. Der Mindestwert ist 1. |
failure_threshold
Erforderlich
|
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von |
namespace
Erforderlich
|
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden. |
token_auth_enabled
Erforderlich
|
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“. |
version_name
Erforderlich
|
Der Name der Version in einem Endpunkt. |
traffic_percentile
Erforderlich
|
Die Menge des Datenverkehrs, den die Version in einem Endpunkt empfängt. |
compute_target_name
Erforderlich
|
Der Name des Computeziels, in dem die Bereitstellung erfolgen soll |
cpu_cores_limit
Erforderlich
|
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein. |
memory_gb_limit
Erforderlich
|
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein. |
Variablen
Name | Beschreibung |
---|---|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1 |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert lautet „False“. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
Wörterbuch der Schlüsselwerttags für diesen Webdienst |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
Eine Beschreibung für diesen Webdienst |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden Der Standardwert ist 310. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
Die Anzahl der Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird Der Standardwert lautet 1. Der Mindestwert ist 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
Der Name der Version in einem Endpunkt. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
Die Menge des Datenverkehrs, den die Version in einem Endpunkt empfängt. |
Methoden
validate_endpoint_configuration |
Überprüfen, ob die angegebenen Konfigurationswerte gültig sind. Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war. |
validate_endpoint_configuration
Überprüfen, ob die angegebenen Konfigurationswerte gültig sind.
Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.
validate_endpoint_configuration()
Ausnahmen
Typ | Beschreibung |
---|---|