Microsoft 言語検出

ELS 言語検出サービスは、Microsoft 言語検出と呼ばれます。 このサービスでは、Microsoft が特許を取得したテクノロジを使用して、アプリケーションが特定のテキストが書き込まれる言語を検出できるようにします。

Microsoft 言語検出への入力

Microsoft 言語検出サービスへの入力は、UTF-16 (正規化形式 C) テキストです。 サービスは、このテキストの言語を決定する必要があります。

Microsoft 言語検出の出力

Microsoft 言語検出サービスは、null で終わる、レジストリ形式の UTF-16 文字列リスト言語を、名前で表され、null 文字区切り記号で区切って取得します。 リストは関連性で並べ替えられます。 ほとんどの言語では、ニュートラル名が使用されます。 ただし、sr-Cyrl、sr-Latn、zh-Hant、zh-Hans などの一部では、完全な名前が使用されます。

Microsoft 言語検出操作

Microsoft 言語検出サービスは、アプリケーションによって提供されるテキストの Unicode スクリプトをチェックします。 検出したスクリプトに基づいてテキストをセグメント化し、各セグメントが書き込まれる言語を決定します。 スクリプトが 1 つの言語を示す場合、言語は言語の出力リストに存在することが保証されます。 このサービスでは、特許を取得したアルゴリズムを使用して、サポートされている各言語の関連性を判断します。

Microsoft 言語検出 GUID

次のコードに示すように、Microsoft 言語検出サービスの GUID は Elssrvc.h で宣言されています。

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

拡張言語サービスについて