セマンティック検索 (SQL Server)

[アーティクル]
05/23/2023

適用対象 SQL Server

SQL Server 統計的セマンティック検索では、統計的に関連性がある キーフレーズ を抽出してインデックスを作成することにより、データベースに格納されている非構造化ドキュメントを深く解釈することができます。次に、これらのキーフレーズを使用して、類似または関連ドキュメントを特定してインデックスを作成することができます。

セマンティック検索で実行できる操作

セマンティック検索は、SQL Server の既存のフルテキスト検索機能を基にして構築されていますが、キーワード検索を超える新しいシナリオにも対応できます。フルテキスト検索ではドキュメントの単語に対してクエリを実行しますが、セマンティック検索ではドキュメントの意味に対してクエリを実行します。これによって、自動タグ抽出、関連性のあるコンテンツの検出、類似コンテンツにまたがる階層的なナビゲーションなどのソリューションが可能になりました。たとえば、キーフレーズのインデックスに対してクエリを実行して、ドキュメントの編成またはコーパスに関する分類を作成することができます。また、ドキュメントの類似性のインデックスに対してクエリを実行して、ジョブの説明に一致するレジュメを特定できます。

以降の例に、セマンティック検索の機能を示します。同時に、これらの例では、セマンティックインデックスに対してクエリを実行し、その結果を構造化データとして取得するために使用する 3 つの Transact-SQL 行セット関数を示します。

ドキュメント内のキーフレーズを検索する

次のクエリは、サンプルドキュメントで識別されたキーフレーズを取得します。結果は、各キーフレーズの統計的有意性を順位付けするスコアの降順で表されます。

このクエリは、semantickeyphrasetable 関数を呼び出します。

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC

類似または関連ドキュメントを検索する

次のクエリは、サンプルドキュメントに類似または関連すると識別されたドキュメントを取得します。結果は、2 つのドキュメントの類似性を順位付けするスコアの降順で表されます。

このクエリは、semanticsimilaritytable 関数を呼び出します。

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC

類似または関連ドキュメントを示すキーフレーズを検索する

次のクエリは、2 つのサンプルドキュメント間の類似性または関連性を示すキーフレーズを取得します。結果は、各キーフレーズの重みを順位付けするスコアの降順で表されます。

このクエリは、semanticsimilaritydetailstable 関数を呼び出します。

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC

SQL Server へドキュメントを保存する

セマンティック検索でドキュメントのインデックスを作成する前に、ドキュメントを SQL Server データベースに保存する必要があります。

SQL Server の FileTable の機能との組み合わせにより、構造化されていないファイルやドキュメントを、リレーショナルデータベースの最上位レベルのオブジェクトにすることができます。その結果、データベース開発者は、Transact-SQL セットベースの操作で構造化データと共にドキュメントを操作できます。

FileTable 機能の詳細については、「FileTables (SQL Server)」を参照してください。データベースへのドキュメントの保存の別のオプションである FILESTREAM 機能については、「FILESTREAM (SQL Server)」を参照してください。

次の方法で共有

セマンティック検索 (SQL Server)

セマンティック検索で実行できる操作

ドキュメント内のキーフレーズを検索する

類似または関連ドキュメントを検索する

類似または関連ドキュメントを示すキーフレーズを検索する

SQL Server へドキュメントを保存する

関連タスク

関連するコンテンツ

フィードバック

その他のリソース

次の方法で共有

セマンティック検索 (SQL Server)

セマンティック検索で実行できる操作

ドキュメント内のキー フレーズを検索する

類似または関連ドキュメントを検索する

類似または関連ドキュメントを示すキー フレーズを検索する

SQL Server へドキュメントを保存する

関連タスク

関連するコンテンツ

フィードバック

その他のリソース

ドキュメント内のキーフレーズを検索する

類似または関連ドキュメントを示すキーフレーズを検索する