BanditPolicy Klass

Definierar en princip för tidig avslutning baserat på slack-kriterier och ett frekvens- och fördröjningsintervall för utvärdering.

Initiera en BanditPolicy med slackfaktor, slack_amount och utvärderingsintervall.

Arv
azureml.train.hyperdrive.policy.EarlyTerminationPolicy
BanditPolicy

Konstruktor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parametrar

Name Description
slack_factor

Förhållandet som används för att beräkna det tillåtna avståndet från den bäst presterande experimentkörningen.

Standardvärde: None
slack_amount

Det absoluta avståndet som tillåts från den bästa körningen.

Standardvärde: None
evaluation_interval
int

Frekvensen för att tillämpa principen.

Standardvärde: 1
delay_evaluation
int

Antalet intervall som den första principutvärderingen ska fördröjas för. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Standardvärde: 0
slack_factor
Obligatorisk

Förhållandet som används för att beräkna det tillåtna avståndet från den bäst presterande experimentkörningen.

slack_amount
Obligatorisk

Det absoluta avståndet som tillåts från den bästa körningen.

evaluation_interval
Obligatorisk
int

Frekvensen för att tillämpa principen.

delay_evaluation
Obligatorisk
int

Antalet intervall som den första principutvärderingen ska fördröjas för. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Kommentarer

Bandit-principen använder följande konfigurationsparametrar:

  • slack_factor: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slack som ett förhållande.

  • slack_amount: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slacket som en absolut mängd.

  • evaluation_interval:Valfri. Frekvensen för att tillämpa principen. Varje gång träningsskriptet loggar räknas det primära måttet som ett intervall.

  • delay_evaluation:Valfri. Antalet intervall för att fördröja principutvärderingen. Använd den här parametern för att undvika för tidig avslutning av träningskörningar. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Alla körningar som inte faller inom slack-faktorn eller slack-mängden för utvärderingsmåttet med avseende på den bäst presterande körningen avslutas.

Överväg en Bandit-princip med slack_factor = 0,2 och evaluation_interval = 100. Anta att körning X är den för närvarande bäst presterande körningen med ett AUC -mått (prestandamått) på 0,8 efter 100 intervall. Anta vidare att den bästa AUC som rapporteras för en körning är Y. Den här principen jämför värdet (Y + Y * 0,2) med 0,8, och om det är mindre avbryts körningen. Om delay_evaluation = 200 tillämpas principen första gången med intervall 200.

Överväg nu en Bandit-princip med slack_amount = 0,2 och evaluation_interval = 100. Om Kör 3 är den för närvarande bäst presterande körningen med ett AUC (prestandamått) på 0,8 efter 100 intervall, avslutas alla körningar med en AUC som är mindre än 0,6 (0,8–0,2) efter 100 iterationer. delay_evaluation På samma sätt kan även användas för att fördröja den första utvärderingen av avslutningsprincipen för ett visst antal sekvenser.

Mer information om hur du tillämpar principer för tidig avslutning finns i Finjustera hyperparametrar för din modell.

Attribut

delay_evaluation

Returnera antalet sekvenser som den första utvärderingen fördröjs för.

Returer

Typ Description
int

Fördröjningsutvärderingen.

evaluation_interval

Returnera värdet för utvärderingsintervallet.

Returer

Typ Description
int

Utvärderingsintervallet.

slack_factor

Returnera slack-faktorn med avseende på den bäst presterande träningskörningen.

Returer

Typ Description

Slack-faktorn.

POLICY_NAME

POLICY_NAME = 'Bandit'