_mm_sha_epi16
更新:2011 年 3 月
需要 Visual Studio 2010 SP1。
Microsoft 专用
生成 XOP 指令 vpshaw 以执行每个字的第一个源中由第二个源指定的数量的算术移位。
__m128i _mm_sha_epi16 (
__m128i src,
__m128i counts
);
参数
[in] src
包含八个 16 位带符号整数的 128 位参数。[in] counts
包含十六个 8 位带符号整数的 128 位参数。
返回值
包含八个 16 位带符号整数的 128 位结果 r。
r[i] := (counts[2*i] >= 0) ? src[i] << counts[2*i]) :
src[i] >> -counts[2*i]);
要求
内部 |
体系结构 |
---|---|
_mm_sha_epi16 |
XOP |
头文件 <intrin.h>
备注
src 中的每个 16 位带符号整数值按照 counts 中相应的值所指定的位数移动,并且该 16 位带符号整数结果存储为目标中相应的值。 如果 counts 中的值为正,则向左移动(向最高有效位)并且零向右端移动;否则,向右移动并且符号位副本向左端移动。 如果移位计数大于 15,则相应的结果值为 0;如果移位计数小于 ﹣15,则结果为 ﹣1,如果 src 的值为负,则为 0。 忽略其他计数中的值。
vpshaw 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。
示例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128i a, b, d;
int i;
for (i = 0; i < 8; i++) {
a.m128i_u16[i] = (2*(i+1)) << 12 | (15 - 2*(i+1)) << 8 |
2*i << 4 | (15 - 2*i);
b.m128i_i8[2*i] = 3*i - 12;
}
printf_s("data: ");
for (i = 0; i < 8; i++) printf_s(" %04x", a.m128i_u16[i]);
printf_s("\nshifted by ");
for (i = 0; i < 8; i++) printf_s(" %4d", b.m128i_i8[2*i]);
d = _mm_sha_epi16(a, b);
printf_s("\ngives ");
for (i = 0; i < 8; i++) printf_s(" %04x", d.m128i_u16[i]);
printf_s("\n");
}
请参见
参考
其他资源
针对 Visual Studio 2010 SP1 添加的 XOP 内部函数
修订记录
Date |
修订记录 |
原因 |
---|---|---|
2011 年 3 月 |
添加了本内容。 |
SP1 功能更改。 |