estrutura DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)

Adiciona cada elemento em ATensor ao elemento correspondente em BTensor e coloca o resultado no elemento correspondente de OutputTensor, com a opção para ativação fundida.

f(a, b) = FusedActivation(a + b)

A descrição do operador de ativação fundida, se fornecida, executa o operador de ativação fornecido na saída.

Esse operador dá suporte à execução in-loco, o que significa que OutputTensor tem permissão para alias de um ou mais tensores de entrada durante a associação.

Sintaxe

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

Membros

ATensor

Tipo: const DML_TENSOR_DESC*

Um tensor que contém as entradas do lado esquerdo.

BTensor

Tipo: const DML_TENSOR_DESC*

Um tensor que contém as entradas do lado direito.

OutputTensor

Tipo: const DML_TENSOR_DESC*

O tensor de saída no qual gravar os resultados.

FusedActivation

Tipo: _Maybenull_ const DML_OPERATOR_DESC*

Uma camada de ativação fundida opcional a ser aplicada após a adição. Para obter mais informações, consulte Usando operadores fundidos para melhorar o desempenho.

A ativação fundida só pode ser usada quando o tipo de dados de saída é FLOAT16 ou FLOAT32.

Comentários

Disponibilidade

Esse operador foi introduzido no DML_FEATURE_LEVEL_2_0.

Restrições do Tensor

ATensor, BTensor e OutputTensor devem ter os mesmos DataType, DimensionCount e Sizes.

Suporte ao Tensor

DML_FEATURE_LEVEL_3_0 e superior

Tensor Tipo Contagens de dimensões com suporte Tipos de dados com suporte
Atensor Entrada 1 a 8 FLOAT32, FLOAT16
BTensor Entrada 1 a 8 FLOAT32, FLOAT16
OutputTensor Saída 1 a 8 FLOAT32, FLOAT16

DML_FEATURE_LEVEL_2_0 e superior

Tensor Tipo Contagens de dimensões com suporte Tipos de dados com suporte
Atensor Entrada 4 a 5 FLOAT32, FLOAT16
BTensor Entrada 4 a 5 FLOAT32, FLOAT16
OutputTensor Saída 4 a 5 FLOAT32, FLOAT16

Requisitos

Requisito Valor
Cliente mínimo com suporte Windows 10, versão 2004 (10.0; Build 19041)
Servidor mínimo com suporte Windows Server, versão 2004 (10.0; Build 19041)
Cabeçalho directml.h

Confira também