BanditPolicy Klass
Definierar en princip för tidig avslutning baserat på slack-kriterier och ett frekvens- och fördröjningsintervall för utvärdering.
Initiera en BanditPolicy med slackfaktor, slack_amount och utvärderingsintervall.
- Arv
-
azureml.train.hyperdrive.policy.EarlyTerminationPolicyBanditPolicy
Konstruktor
BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)
Parametrar
Name | Description |
---|---|
slack_factor
|
Förhållandet som används för att beräkna det tillåtna avståndet från den bäst presterande experimentkörningen. Standardvärde: None
|
slack_amount
|
Det absoluta avståndet som tillåts från den bästa körningen. Standardvärde: None
|
evaluation_interval
|
Frekvensen för att tillämpa principen. Standardvärde: 1
|
delay_evaluation
|
Antalet intervall som den första principutvärderingen ska fördröjas för.
Om det anges tillämpar principen varje multipel av Standardvärde: 0
|
slack_factor
Obligatorisk
|
Förhållandet som används för att beräkna det tillåtna avståndet från den bäst presterande experimentkörningen. |
slack_amount
Obligatorisk
|
Det absoluta avståndet som tillåts från den bästa körningen. |
evaluation_interval
Obligatorisk
|
Frekvensen för att tillämpa principen. |
delay_evaluation
Obligatorisk
|
Antalet intervall som den första principutvärderingen ska fördröjas för.
Om det anges tillämpar principen varje multipel av |
Kommentarer
Bandit-principen använder följande konfigurationsparametrar:
slack_factor
: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slack som ett förhållande.slack_amount
: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slacket som en absolut mängd.evaluation_interval
:Valfri. Frekvensen för att tillämpa principen. Varje gång träningsskriptet loggar räknas det primära måttet som ett intervall.delay_evaluation
:Valfri. Antalet intervall för att fördröja principutvärderingen. Använd den här parametern för att undvika för tidig avslutning av träningskörningar. Om det anges tillämpar principen varje multipel avevaluation_interval
som är större än eller lika meddelay_evaluation
.
Alla körningar som inte faller inom slack-faktorn eller slack-mängden för utvärderingsmåttet med avseende på den bäst presterande körningen avslutas.
Överväg en Bandit-princip med slack_factor
= 0,2 och evaluation_interval
= 100.
Anta att körning X är den för närvarande bäst presterande körningen med ett AUC -mått (prestandamått) på 0,8 efter 100 intervall. Anta vidare att den bästa AUC som rapporteras för en körning är Y. Den här principen jämför värdet (Y + Y * 0,2) med 0,8, och om det är mindre avbryts körningen. Om delay_evaluation
= 200 tillämpas principen första gången med intervall 200.
Överväg nu en Bandit-princip med slack_amount
= 0,2 och evaluation_interval
= 100.
Om Kör 3 är den för närvarande bäst presterande körningen med ett AUC (prestandamått) på 0,8 efter 100 intervall, avslutas alla körningar med en AUC som är mindre än 0,6 (0,8–0,2) efter 100 iterationer.
delay_evaluation
På samma sätt kan även användas för att fördröja den första utvärderingen av avslutningsprincipen för ett visst antal sekvenser.
Mer information om hur du tillämpar principer för tidig avslutning finns i Finjustera hyperparametrar för din modell.
Attribut
delay_evaluation
Returnera antalet sekvenser som den första utvärderingen fördröjs för.
Returer
Typ | Description |
---|---|
Fördröjningsutvärderingen. |
evaluation_interval
slack_factor
Returnera slack-faktorn med avseende på den bäst presterande träningskörningen.
Returer
Typ | Description |
---|---|
Slack-faktorn. |
POLICY_NAME
POLICY_NAME = 'Bandit'