struttura DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)
Aggiunge ogni elemento in ATensor all'elemento corrispondente in BTensor e inserisce il risultato nell'elemento corrispondente di OutputTensor, con l'opzione per l'attivazione fuso.
f(a, b) = FusedActivation(a + b)
La descrizione dell'operatore di attivazione fuso, se specificata, esegue l'operatore di attivazione specificato nell'output.
Questo operatore supporta l'esecuzione sul posto, ovvero OutputTensor è autorizzato ad eseguire l'alias di uno o più tensori di input durante l'associazione.
Sintassi
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
Members
ATensor
Tipo: const DML_TENSOR_DESC*
Tensore contenente gli input sul lato sinistro.
BTensor
Tipo: const DML_TENSOR_DESC*
Tensore contenente gli input sul lato destro.
OutputTensor
Tipo: const DML_TENSOR_DESC*
Tensore di output in cui scrivere i risultati.
FusedActivation
Tipo: _Maybenull_ const DML_OPERATOR_DESC*
Livello di attivazione fuso facoltativo da applicare dopo l'aggiunta. Per altre info, vedi Uso degli operatori fusibili per migliorare le prestazioni.
L'attivazione fuso può essere usata solo quando il tipo di dati di output è FLOAT16 o FLOAT32.
Commenti
Disponibilità
Questo operatore è stato introdotto in DML_FEATURE_LEVEL_2_0
.
Vincoli tensor
ATensor, BTensor e OutputTensor devono avere gli stessi oggetti DataType, DimensionCount e Size.
Supporto di Tensor
DML_FEATURE_LEVEL_3_0 e versioni successive
Tensore | Tipo | Conteggi delle dimensioni supportati | Tipi di dati supportati |
---|---|---|---|
ATensor | Input | da 1 a 8 | FLOAT32, FLOAT16 |
BTensor | Input | da 1 a 8 | FLOAT32, FLOAT16 |
OutputTensor | Output | da 1 a 8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 e versioni successive
Tensore | Tipo | Conteggi delle dimensioni supportati | Tipi di dati supportati |
---|---|---|---|
ATensor | Input | da 4 a 5 | FLOAT32, FLOAT16 |
BTensor | Input | da 4 a 5 | FLOAT32, FLOAT16 |
OutputTensor | Output | da 4 a 5 | FLOAT32, FLOAT16 |
Requisiti
Requisito | Valore |
---|---|
Client minimo supportato | Windows 10 versione 2004 (10.0; Build 19041) |
Server minimo supportato | Windows Server, versione 2004 (10.0; Build 19041) |
Intestazione | directml.h |