Модель шейдера HLSL 6.4

Описание встроенных функций машинного обучения, добавленных в модель шейдера HLSL 6.4.

Модель шейдера 6.4

Эти встроенные функции являются обязательными и поддерживаемыми функциями модели шейдера 6.4. Следовательно, не требуется никаких отдельных проверка возможностей, помимо использования модели шейдера 6.4. Минимальный поддерживаемый клиент для этих подпрограмм — Windows 10 версии 1903.

Встроенные функции языка заливки

Целое число без знака Dot-Product из 4 элементов и накопление

uint32 dot4add_u8packed(uint32 a, uint32 b, uint32 acc); // ubyte4 a, b;

  4-мерное целое число без знака с добавлением. Умножает каждую соответствующую пару 8-разрядных байтов без знака в двух входных DWORD и суммирует результаты в 32-разрядный целый накопитель без знака. Эта инструкция работает в одной 32-разрядной полосе SIMD. Входные данные также считаются 32-разрядными.  

Целое число со знаком Dot-Product из 4 элементов и аккумулировать

int32 dot4add_i8packed(uint32 a, uint32 b, int32 acc); // signed byte4 a, b;

4-мерное целое число со знаком с добавлением. Умножает каждую соответствующую пару 8-разрядных байтов со знаком в двух входных DWORD и суммирует результаты в 32-разрядный целочисленный накопитель со знаком. Эта инструкция работает в одной 32-разрядной полосе SIMD. Входные данные также считаются 32-разрядными.  

Одиночная точность с плавающей запятой 2 элемента Dot-Product и накопление

float dot2add( half2 a, half2 b, float acc );

2-мерная точка с плавающей запятой полу2 векторов с добавлением. Умножает элементы двух входных векторов с плавающей точкой половинной точности и суммирует результаты в 32-разрядный накопитель с плавающей точкой. Эти инструкции работают в одной 32-разрядной полосе SIMD. Входные данные представляют собой 16-разрядные объемы, упакованные в ту же полосу.

Это рассматривается в бите функции низкой точности (что указывает на наличие встроенной половины и короткой поддержки).

SV_ShadingRate

uint shadingRate : SV_ShadingRate

Целое число без знака, указывающее, сколько целевых пикселей записывается каждым вызовом пиксельного шейдера. Допустимые значения относятся к набору значений перечисления D3D12_SHADING_RATE.

Это системное значение доступно на платформах , D3D12_VARIABLE_SHADING_RATE_TIER_2 или выше. Его можно записать не более одного из этапов вершин или геометрических шейдеров. Его можно считывать на этапе пиксельного шейдера. Дополнительные сведения см. в разделе Заливка переменной скорости.