類似の検索 (FAST Search Server 2010 for SharePoint)

"類似アイテムの検索機能" により、取得済みのクエリ結果と同様のドキュメントを検索できます。

最終更新日: 2011年9月1日

適用対象: SharePoint Server 2010

この記事の内容
類似検索クエリの種類
アイテムの類似ベクトルの参照
類似検索クエリの結果の並べ替え

類似度の評価は統計的尺度に基づいて行われます。FAST Search Server 2010 for SharePoint では、クエリに追加される類似コンポーネントが自動的に作成されます。

適用先: Microsoft FAST Search Server 2010 for SharePoint

類似検索クエリの種類

このプロパティは、実行する類似検索クエリの種類を表します。

重みの降順で並べ替えられた、各アイテムのドキュメント ベクトルを使用して、元のクエリを Q とすると、アイテム d の 3 種類の類似検索を作成できます。これらの類似検索要求は、次のクエリの書き換え (正確なクエリ言語ではなく、記号を使用して表しています) を使用して、新しい一意のクエリに変換されます。

  • FindSimilar: Query = Q OR <s1,w1> [OR <sm,wm>]* 類似ベクトルは、OR 演算子を使用してクエリに追加されます。つまり、元のクエリは、書き換え後のクエリに追加されますが、新しいクエリは、元のクエリで一致しない場合でも、類似アイテムと一致することができます。

  • RefineSimilar: Query = Q AND (<s1,w1> [OR <sm,wm>]*) 元のクエリの条件と類似ベクトルの条件が満たされる場合にクエリは一致します。たとえば、<SimilarTo> に示されているアイテムに類似したアイテムを含むように元のクエリを絞り込みます。

  • ExcludeSimilar: Query = Q ANDNOT (<s1,w1> [OR <sm,wm>]*) 元のクエリの条件が満たされ、類似条件が満たされない場合に、クエリは一致します。

    <s,w> は、アイテムの処理中に計算されるアイテムの類似ベクトルを示しています。

既定値: FindSimilar

注意

クエリに追加される類似コンポーネント (<s1,w1> [OR <sm,wm>]*) は、既定のフルテキスト インデックスに対してクエリを実行します。

アイテムの類似ベクトルの参照

このプロパティは、類似アイテムを検索するときの類似参照を表します。これは、docvector 管理プロパティでクエリ結果に返される各アイテムの類似ベクトル表記です。

値は、次の書式に従って書式設定された文字列です。

[string1,weight1][string2,weight2]...[stringN,weightN]

類似検索クエリを実行する場合は、SimilarTo 要素に、類似参照として使用するアイテムの docvector 管理プロパティの値を指定した string パラメーターを入れる必要があります。

重みは、0 ~ 1 の範囲の浮動小数点値です。1 は、最も関連性が高いことを示します。

類似ベクトルは、アイテムの処理中に作成され、アイテムで最も重要な用語または概念と対応する重みを示します。

類似検索クエリの結果の並べ替え

FindSimilar プロパティでは、類似度に基づくクエリ結果を並べ替える基準 (類似度または順位) を指定します。

類似検索クエリを実行した場合、その結果は次の 2 つの方法で並べ替えることができます。

  • 関連性のスコア (順位) を基準にする。これは、標準のクエリの並べ替え方法で、SortSimilar="False" に相当します。

  • 類似度を基準にする。これは、類似クエリの既定の並べ替え方法です。最も類似するアイテムがリストの最初に表示されます。これは、SortSimilar="True" に相当します。

既定値: True