Microsoft 语言检测
ELS 语言检测服务称为 Microsoft 语言检测。 此服务使用 Microsoft 专利技术,允许应用程序检测编写特定文本时使用的语言。
Microsoft 语言检测的输入
Microsoft 语言检测服务的输入是 UTF-16 (规范化形式的 C) 文本。 服务必须确定此文本的语言。
Microsoft 语言检测的输出
Microsoft 语言检测服务检索以双 null 结尾、注册表格式的 UTF-16 字符串,其中列出了用语言名称表示的语言,并用 null 字符分隔符分隔。 列表按相关性排序。 对于大多数语言,将使用非特定名称。 但是,对于某些人(例如 sr-Cyrl、sr-Latn、zh-Hant 和 zh-Hans),则使用全名。
Microsoft 语言检测操作
Microsoft 语言检测服务检查应用程序提供的文本的 Unicode 脚本。 它根据检测到的脚本对文本进行分段,然后确定写入每个段的语言。 如果脚本指示单一语言,则保证语言出现在语言的输出列表中。 该服务使用专利算法来确定每种受支持语言的相关性。
Microsoft 语言检测 GUID
Microsoft 语言检测服务的 GUID 在 Elssrvc.h 中声明,如以下代码所示。
// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
{ 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };
相关主题