ParallelTask クラス

並列タスク。

継承
azure.ai.ml.entities._mixins.RestTranslatableMixin
ParallelTask
azure.ai.ml.entities._mixins.DictMixin
ParallelTask

コンストラクター

ParallelTask(*, type: str | None = None, code: str | None = None, entry_script: str | None = None, program_arguments: str | None = None, model: str | None = None, append_row_to: str | None = None, environment: Environment | str | None = None, **kwargs: Any)

パラメーター

名前 説明
type
必須
str

並列タスクの種類。 指定できる値は、'run_function'、'model' です。

code
必須
str

ソース コードを指すローカルパスまたはリモート パス。

entry_script
必須
str

複数のノードで並列に実行されるユーザー スクリプト。 これは、ローカル ファイル パスとして指定されます。 entry_script には、次の 2 つの関数が含まれている必要があります。init(): この関数は、モデルの逆シリアル化やグローバル オブジェクトへの読み込みなど、後で推論するためのコストのかかる準備、または一般的な準備を行うときに使用する必要があります。 run(mini_batch): 並列化するメソッド。 各呼び出しには 1 つのミニバッチがあります。 'mini_batch': バッチ推論は run メソッドを呼び出して、そのメソッドに、リストまたは Pandas データフレームのいずれかを引数として渡します。 min_batch のエントリはそれぞれ、filepath (入力が FileDataset の場合) または Pandas データフレーム (入力が TabularDataset の場合) になります。 run() メソッドは、Pandas データフレームまたは配列を返します。 append_row output_action の場合、これらの返される要素は、共通の出力ファイルに追加されます。 summary_only の場合、要素のコンテンツは無視されます。 すべての出力アクションについて、返される出力要素はそれぞれ、入力ミニバッチ内で成功した 1 つの入力要素の推論を示します。 各並列ワーカー プロセスは、init を 1 回呼び出してから、すべてのミニバッチが処理されるまで run 関数をループします。

program_arguments
必須
str

並列タスクの引数。

model
必須
str

並列タスクのモデル。

append_row_to
必須
str

run() メソッドの呼び出しによって出力されるすべての値は、出力場所に作成される 1 つの一意のファイルに集計されます。 設定されていない場合は、'summary_only' が呼び出されます。つまり、ユーザー スクリプトは出力自体を格納することが期待されます。

environment
必須

トレーニング ジョブが実行される環境。

Keyword-Only パラメータ

名前 説明
type
必須
code
必須
entry_script
必須
program_arguments
必須
model
必須
append_row_to
必須
environment
必須

メソッド

get
has_key
items
keys
update
values

get

get(key: Any, default: Any | None = None) -> Any

パラメーター

名前 説明
key
必須
default
既定値: None

has_key

has_key(k: Any) -> bool

パラメーター

名前 説明
k
必須

items

items() -> list

keys

keys() -> list

update

update(*args: Any, **kwargs: Any) -> None

values

values() -> list