DML_CONVOLUTION_OPERATOR_DESC struttura (directml.h)

Articolo
03/05/2024

Esegue una convoluzione del FilterTensor con InputTensor. Questo operatore supporta diverse configurazioni di convoluzione standard. Queste configurazioni standard includono la convoluzione avanti e indietro (trasposta) impostando i campi Direzione e Modalità , nonché la convoluzione approfondita impostando il campo GroupCount .

Riepilogo dei passaggi coinvolti: eseguire la convoluzione nel tensore di output; rimodellare la distorsione delle stesse dimensioni del tensore di output; aggiungere il tensore di bias rimodellato al tensore di output.

Sintassi

struct DML_CONVOLUTION_OPERATOR_DESC {
  const DML_TENSOR_DESC     *InputTensor;
  const DML_TENSOR_DESC     *FilterTensor;
  const DML_TENSOR_DESC     *BiasTensor;
  const DML_TENSOR_DESC     *OutputTensor;
  DML_CONVOLUTION_MODE      Mode;
  DML_CONVOLUTION_DIRECTION Direction;
  UINT                      DimensionCount;
  const UINT                *Strides;
  const UINT                *Dilations;
  const UINT                *StartPadding;
  const UINT                *EndPadding;
  const UINT                *OutputPadding;
  UINT                      GroupCount;
  const DML_OPERATOR_DESC   *FusedActivation;
};

Members

InputTensor

Tipo: const DML_TENSOR_DESC*

Tensor contenente i dati di input. Le dimensioni previste di InputTensor sono:

{ BatchCount, InputChannelCount, InputWidth } per 3D,
{ BatchCount, InputChannelCount, InputHeight, InputWidth } per 4D e
{ BatchCount, InputChannelCount, InputDepth, InputHeight, InputWidth } per 5D.

FilterTensor

Tipo: const DML_TENSOR_DESC*

Tensor contenente i dati del filtro. Le dimensioni previste del FilterTensor sono:

{ FilterBatchCount, FilterChannelCount, FilterWidth } per 3D,
{ FilterBatchCount, FilterChannelCount, FilterHeight, FilterWidth } per 4D e
{ FilterBatchCount, FilterChannelCount, FilterDepth, FilterHeight, FilterWidth } per 5D.

BiasTensor

Tipo: _Maybenull_ const DML_TENSOR_DESC*

Tensore facoltativo contenente i dati di pregiudizio. Il tensore di pregiudizio è un tensore contenente dati che vengono trasmessi nel tensore di output alla fine della convoluzione che viene aggiunta al risultato. Le dimensioni previste di BiasTensor sono:

{ 1, OutputChannelCount, 1 } per 3D,
{ 1, OutputChannelCount, 1, 1 } per 4D e
{ 1, OutputChannelCount, 1, 1, 1 } per 5D.

Per ogni canale di output, il singolo valore di pregiudizio per tale canale viene aggiunto a ogni elemento di tale canale di OutputTensor. Ovvero, il BiasTensor viene trasmesso alle dimensioni dell'outputTensor e ciò che l'operatore restituisce è la somma di questo BiasTensor trasmesso con il risultato della convoluzione.

OutputTensor

Tipo: const DML_TENSOR_DESC*

Un tensore a cui scrivere i risultati. Le dimensioni previste dell'outputTensor sono:

{ BatchCount, OutputChannelCount, OutputWidth } per 3D,
{ BatchCount, OutputChannelCount, OutputHeight, OutputWidth } per 4D e
{ BatchCount, OutputChannelCount, OutputDepth, OutputHeight, OutputWidth } per 5D.

Mode

Tipo: DML_CONVOLUTION_MODE

Modalità da usare per l'operazione di convoluzione. DML_CONVOLUTION_MODE_CROSS_CORRELATION è il comportamento necessario per gli scenari di inferenza tipici. Al contrario, DML_CONVOLUTION_MODE_CONVOLUTION capovolge l'ordine degli elementi in ogni kernel di filtro lungo ogni dimensione spaziale.

Direction

Tipo: DML_CONVOLUTION_DIRECTION

Direzione dell'operazione di convoluzione. DML_CONVOLUTION_DIRECTION_FORWARD è la forma primaria di convoluzione usata per l'inferenza in cui viene usata una combinazione di DML_CONVOLUTION_DIRECTION_FORWARD e DML_CONVOLUTION_DIRECTION_BACKWARD durante il training.

DimensionCount

Tipo: UINT

Numero di dimensioni spaziali per l'operazione di convoluzione. Le dimensioni spaziali sono le dimensioni inferiori del filtro di voluzioneTensor. Ad esempio, la larghezza e la dimensione altezza sono dimensioni spaziali di un tensore di filtro di 4D convoluzione. Questo valore determina anche le dimensioni delle matrici Strides, Dilations, StartPadding, EndPadding e OutputPadding. Deve essere impostato su 2 quando InputTensor.DimensionCount è 4 e 3 quando InputTensor.DimensionCount è 5.

Strides