AksServiceDeploymentConfiguration Klasse
Stellt Informationen zur Bereitstellungskonfiguration für einen in Azure Kubernetes Service bereitgestellten Dienst dar.
Erstellt ein AksServiceDeploymentConfiguration-Objekt mithilfe der deploy_configuration
-Methode der AksWebservice-Klasse
Initialisieren Sie ein Konfigurationsobjekt für die Bereitstellung in einem AKS-Computeziel.
- Vererbung
-
AksServiceDeploymentConfiguration
Konstruktor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parameter
Name | Beschreibung |
---|---|
cpu_cores_limit
Erforderlich
|
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein. |
memory_gb_limit
Erforderlich
|
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein. |
autoscale_enabled
Erforderlich
|
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn |
autoscale_min_replicas
Erforderlich
|
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1. |
autoscale_max_replicas
Erforderlich
|
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10 |
autoscale_refresh_seconds
Erforderlich
|
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1. |
autoscale_target_utilization
Erforderlich
|
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70. |
collect_model_data
Erforderlich
|
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“. |
auth_enabled
Erforderlich
|
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
cpu_cores
Erforderlich
|
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1 |
memory_gb
Erforderlich
|
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“. |
enable_app_insights
Erforderlich
|
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“. |
scoring_timeout_ms
Erforderlich
|
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000. |
replica_max_concurrent_requests
Erforderlich
|
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet. |
max_request_wait_time
Erforderlich
|
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500. |
num_replicas
Erforderlich
|
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert. |
primary_key
Erforderlich
|
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll |
secondary_key
Erforderlich
|
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll |
tags
Erforderlich
|
Wörterbuch der Schlüsselwerttags für diesen Webdienst |
properties
Erforderlich
|
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden. |
description
Erforderlich
|
Eine Beschreibung für diesen Webdienst |
gpu_cores
Erforderlich
|
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0. |
period_seconds
Erforderlich
|
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1. |
initial_delay_seconds
Erforderlich
|
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310. |
timeout_seconds
Erforderlich
|
Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1. |
success_threshold
Erforderlich
|
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1. |
failure_threshold
Erforderlich
|
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von |
namespace
Erforderlich
|
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden. |
token_auth_enabled
Erforderlich
|
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“. |
cpu_cores_limit
Erforderlich
|
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein. |
memory_gb_limit
Erforderlich
|
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein. |
blobfuse_enabled
|
Gibt an, ob blobfuse für Modelldownloads für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. Standardwert: None
|
autoscale_enabled
Erforderlich
|
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn |
autoscale_min_replicas
Erforderlich
|
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1. |
autoscale_max_replicas
Erforderlich
|
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10 |
autoscale_refresh_seconds
Erforderlich
|
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1. |
autoscale_target_utilization
Erforderlich
|
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70. |
collect_model_data
Erforderlich
|
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“. |
auth_enabled
Erforderlich
|
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
cpu_cores
Erforderlich
|
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1 |
memory_gb
Erforderlich
|
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“. |
enable_app_insights
Erforderlich
|
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“. |
scoring_timeout_ms
Erforderlich
|
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000. |
replica_max_concurrent_requests
Erforderlich
|
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet. |
max_request_wait_time
Erforderlich
|
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500. |
num_replicas
Erforderlich
|
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert. |
primary_key
Erforderlich
|
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll |
secondary_key
Erforderlich
|
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll |
tags
Erforderlich
|
Wörterbuch der Schlüsselwerttags für diesen Webdienst |
properties
Erforderlich
|
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden. |
description
Erforderlich
|
Eine Beschreibung für diesen Webdienst |
gpu_cores
Erforderlich
|
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0. |
period_seconds
Erforderlich
|
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1. |
initial_delay_seconds
Erforderlich
|
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310. |
timeout_seconds
Erforderlich
|
Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1. |
success_threshold
Erforderlich
|
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1. |
failure_threshold
Erforderlich
|
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von |
namespace
Erforderlich
|
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden. |
token_auth_enabled
Erforderlich
|
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“. |
compute_target_name
Erforderlich
|
Der Name des Computeziels, in dem die Bereitstellung erfolgen soll |
cpu_cores_limit
Erforderlich
|
Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein. |
memory_gb_limit
Erforderlich
|
Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein. |
blobfuse_enabled
Erforderlich
|
Gibt an, ob blobfuse für Modelldownloads für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
Variablen
Name | Beschreibung |
---|---|
autoscale_enabled
|
Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll.
Der Standardwert ist „True“, wenn |
autoscale_min_replicas
|
Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1. |
autoscale_max_replicas
|
Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10 |
autoscale_refresh_seconds
|
Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1. |
autoscale_target_utilization
|
Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70. |
collect_model_data
|
Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“. |
auth_enabled
|
Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“. |
cpu_cores
|
Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1 |
memory_gb
|
Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“. |
enable_app_insights
|
Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert ist „FALSE“. |
scoring_timeout_ms
|
Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000. |
replica_max_concurrent_requests
|
Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet. |
max_request_wait_time
|
Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500. |
num_replicas
|
Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert. |
primary_key
|
Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll |
secondary_key
|
Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll |
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Wörterbuch der Schlüsselwerttags für diesen Webdienst |
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden. |
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Eine Beschreibung für diesen Webdienst |
gpu_cores
|
Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0. |
period_seconds
|
Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1. |
initial_delay_seconds
|
Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden. Der Standardwert ist 310. |
timeout_seconds
|
Die Anzahl von Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1. |
success_threshold
|
Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird. Der Standardwert lautet 1. Der Mindestwert ist 1. |
failure_threshold
|
Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von |
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden. |
token_auth_enabled
|
Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“. |
Methoden
print_deploy_configuration |
Ausgeben der Bereitstellungskonfiguration. |
validate_configuration |
Überprüft, ob die angegebenen Konfigurationswerte gültig sind. Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war. |
print_deploy_configuration
Ausgeben der Bereitstellungskonfiguration.
print_deploy_configuration()
validate_configuration
Überprüft, ob die angegebenen Konfigurationswerte gültig sind.
Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.
validate_configuration()
Ausnahmen
Typ | Beschreibung |
---|---|