estrutura DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)
Adiciona cada elemento em ATensor ao elemento correspondente em BTensor e coloca o resultado no elemento correspondente de OutputTensor, com a opção para ativação fundida.
f(a, b) = FusedActivation(a + b)
A descrição do operador de ativação fundida, se fornecida, executa o operador de ativação fornecido na saída.
Esse operador dá suporte à execução in-loco, o que significa que OutputTensor tem permissão para alias de um ou mais tensores de entrada durante a associação.
Sintaxe
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
Membros
ATensor
Tipo: const DML_TENSOR_DESC*
Um tensor que contém as entradas do lado esquerdo.
BTensor
Tipo: const DML_TENSOR_DESC*
Um tensor que contém as entradas do lado direito.
OutputTensor
Tipo: const DML_TENSOR_DESC*
O tensor de saída no qual gravar os resultados.
FusedActivation
Tipo: _Maybenull_ const DML_OPERATOR_DESC*
Uma camada de ativação fundida opcional a ser aplicada após a adição. Para obter mais informações, consulte Usando operadores fundidos para melhorar o desempenho.
A ativação fundida só pode ser usada quando o tipo de dados de saída é FLOAT16 ou FLOAT32.
Comentários
Disponibilidade
Esse operador foi introduzido no DML_FEATURE_LEVEL_2_0
.
Restrições do Tensor
ATensor, BTensor e OutputTensor devem ter os mesmos DataType, DimensionCount e Sizes.
Suporte ao Tensor
DML_FEATURE_LEVEL_3_0 e superior
Tensor | Tipo | Contagens de dimensões com suporte | Tipos de dados com suporte |
---|---|---|---|
Atensor | Entrada | 1 a 8 | FLOAT32, FLOAT16 |
BTensor | Entrada | 1 a 8 | FLOAT32, FLOAT16 |
OutputTensor | Saída | 1 a 8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 e superior
Tensor | Tipo | Contagens de dimensões com suporte | Tipos de dados com suporte |
---|---|---|---|
Atensor | Entrada | 4 a 5 | FLOAT32, FLOAT16 |
BTensor | Entrada | 4 a 5 | FLOAT32, FLOAT16 |
OutputTensor | Saída | 4 a 5 | FLOAT32, FLOAT16 |
Requisitos
Requisito | Valor |
---|---|
Cliente mínimo com suporte | Windows 10, versão 2004 (10.0; Build 19041) |
Servidor mínimo com suporte | Windows Server, versão 2004 (10.0; Build 19041) |
Cabeçalho | directml.h |