フルテキスト検索の概要

[アーティクル]
06/25/2013

SQL Server のデータベースでは、フルテキストが既定で有効になっています。ただし、テーブルでフルテキストインデックスを使用するには、Full-Text Engine を使用してアクセスするテーブルの列に対してフルテキストインデックス作成機能をセットアップする必要があります。

このトピックの内容

フルテキスト検索を行うためのデータベースの構成
フルテキストカタログとインデックスの設定
フルテキストインデックスのオプションの選択
例: フルテキスト検索のセットアップ
一般的なタスク

フルテキスト検索を行うためのデータベースの構成

どのシナリオでも、データベース管理者は次の基本的な手順を実行して、データベースでフルテキスト検索用のテーブル列を構成します。

フルテキストカタログを作成します。
検索する各テーブルに、次の方法でフルテキストインデックスを作成します。
1. フルテキストインデックスに含めるテキスト列を特定します。
2. バイナリデータ (varbinary(max) または image データ) として格納されたドキュメントが列に含まれている場合は、インデックスが作成される列内の各ドキュメントの型を識別するテーブル列 (型列) を指定する必要があります。
3. 列内のドキュメントに対してフルテキスト検索で使用される言語を指定します。
4. ベーステーブルとその列での変更を追跡するためにフルテキストインデックスで使用する変更追跡メカニズムを選択します。

フルテキスト検索では、ワードブレーカー、ステミング機能、ストップワード (ノイズワードとも呼ばれます) を含んだストップリスト、類義語辞典ファイルの各言語コンポーネントを使用して、複数の言語がサポートされます。類義語辞典ファイルと (場合によって) ストップリストは、データベース管理者が構成する必要があります。特定の類義語辞典ファイルは、対応する言語を使用するすべてのフルテキストインデックスをサポートし、特定のストップリストには任意の数のフルテキストインデックスを関連付けることができます。

フルテキストカタログとインデックスの設定

この作業には、次の基本的な手順が含まれます。

フルテキストインデックスを格納するフルテキストカタログを作成する。

各フルテキストインデックスは、フルテキストカタログに属している必要があります。フルテキストインデックスごとにテキストカタログを作成するか、複数のフルテキストインデックスを特定のカタログに関連付けることができます。フルテキストカタログは仮想オブジェクトであり、ファイルグループには属しません。カタログは、フルテキストインデックスのグループを指す論理的概念です。
テーブルまたはインデックス付きビューで、フルテキストインデックスを作成する。

フルテキストインデックスは、Full-Text Engine により構築および管理されるトークンベースの特殊な機能インデックスです。テーブルまたはビューにフルテキスト検索を作成するには、そのテーブルまたはビューに、単一列で非 NULL 値の一意なインデックスが作成されている必要があります。 Full-Text Engine では、テーブルの各行を一意の圧縮可能なキーにマップするために、この一意のインデックスが必要になります。フルテキストインデックスには、char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary、varbinary(max) 型の列を含めることができます。詳細については、「フルテキストインデックスの作成と管理」を参照してください。

フルテキストインデックスの作成について学習する前に、フルテキストインデックスと標準の SQL Server インデックスの違いを見ることが重要です。次の表に、両方のインデックスの相違点を示します。

フルテキストインデックス	標準の SQL Server インデックス
1 つのテーブルに対し、1 つのフルテキストインデックスしか使用できません。	1 つのテーブルに対し、複数の標準インデックスを使用できます。
フルテキストインデックスへのデータの追加は作成と呼ばれ、スケジュールによる要求または個別の要求のどちらかを通じて要求できます。または、新規データの追加と共に自動的に行うことができます。	関連するデータが挿入、更新、または削除されたときに、自動的に更新されます。
同じデータベース内で 1 つ以上のフルテキストカタログにグループ化されます。	グループ化されません。

[先頭に戻る]

フルテキストインデックスのオプションの選択

ここでは、次について説明します。

列の言語の選択
フルテキストインデックスのファイルグループの選択
フルテキストカタログへのフルテキストインデックスの割り当て
ストップリストとフルテキストインデックスの関連付け
フルテキストインデックスの更新

列の言語の選択

列の言語を選択する際の考慮点の詳細については、「フルテキストインデックス作成時の言語の選択」を参照してください。

フルテキストインデックスのファイルグループの選択

フルテキストインデックスの作成処理では、I/O が非常に集中します (高い頻度で SQL Server からデータを読み取り、フィルター選択されたデータをフルテキストインデックスに反映するため)。 I/O パフォーマンスの最大化に最適なデータベースファイルグループにフルテキストインデックスを配置するか、他のボリュームの別のファイルグループにフルテキストインデックスを配置することをお勧めします。

管理のしやすさが重要である場合は、テーブルデータと関連するフルテキストカタログは同じファイルグループに格納することをお勧めします。パフォーマンス上の理由から、別々のボリュームに格納されている別々のファイルグループにテーブルデータとフルテキストインデックスを配置して、I/O 並列処理を最大限に高めることが必要になる場合もあります。

[先頭に戻る]

フルテキストカタログへのフルテキストインデックスの割り当て

フルテキストカタログ内のテーブルに対するフルテキストインデックスの割り当てを立案することは重要です。

変更が少ないテーブル、変更が多いテーブル、または特定の時間帯に頻繁に変更されるテーブルなど、同じ更新特性を持つテーブルは、同じフルテキストカタログの下にまとめて関連付けることをお勧めします。フルテキストカタログの作成スケジュールをセットアップすると、データベースの利用率が高いときでもデータベースサーバーのリソース使用に大きな影響を及ぼすことなく、フルテキストインデックスとテーブルの同期が維持されるようになります。

フルテキストカタログにテーブルを割り当てる際には、次のガイドラインを考慮してください。

常に、一意なフルテキストキーに利用可能な最小の一意なインデックスを選択してください。 4 バイトで、整数ベースのインデックスが最適です。これにより、ファイルシステム内の Microsoft Search サービスで必要となるリソースが大幅に減少します。主キーが大きい場合 (100 バイト以上)、テーブル内の他の一意なインデックスを選択するか、または他の一意なインデックスを作成して、フルテキストインデックス用のキーにすることを検討してください。そうしないと、一意なフルテキストキーのサイズが最大サイズ (900 バイト) を超えた場合、フルテキストの作成を続行できなくなります。
数百万の行を持つテーブルにインデックスを作成しようとしている場合、そのテーブル専用のフルテキストカタログを割り当ててください。
フルテキストインデックスを作成するテーブル内の変更量だけではなく、そのテーブル内の行の総数についても考慮してください。変更される行と、最後にフルテキストインデックスを作成したときにテーブル内に存在した行の総数が数百万行に及ぶ場合は、そのテーブルを専用のフルテキストカタログに割り当ててください。

[先頭に戻る]

ストップリストとフルテキストインデックスの関連付け

SQL Server 2008 では、ストップリストが導入されています。ストップリストは、ストップワード (ノイズワードとも呼ばれます) の一覧です。ストップリストは各フルテキストインデックスに関連付けられ、そのストップリスト内の単語がそのインデックスのフルテキストクエリに適用されます。既定では、システムストップリストは、新しいフルテキストインデックスに関連付けられます。ただし、独自のストップリストを作成して使用することもできます。詳細については、「フルテキスト検索に使用するストップワードとストップリストの構成と管理」を参照してください。

たとえば、次の CREATE FULLTEXT STOPLIST Transact-SQL ステートメントでは、システムストップリストからコピーして、myStoplist3 という名前の新しいフルテキストストップリストを作成します。

CREATE FULLTEXT STOPLIST myStoplist FROM SYSTEM STOPLIST;
GO

次の ALTER FULLTEXT STOPLIST Transact-SQL ステートメントでは、myStoplist という名前のストップリストを変更して、単語 'en' をまずスペイン語用に、次にフランス語用に追加します。

ALTER FULLTEXT STOPLIST MyStoplist ADD 'en' LANGUAGE 'Spanish';
ALTER FULLTEXT STOPLIST MyStoplist ADD 'en' LANGUAGE 'French';
GO

[先頭に戻る]

フルテキストインデックスの更新

標準の SQL Server インデックスと同様に、フルテキストインデックスは、関連付けられたテーブルの中でデータが変更されると、自動的に更新されます。これは既定の動作です。指定したスケジュール間隔または手動でフルテキストインデックスを最新の状態に保つこともできます。フルテキストインデックスの作成は時間とリソースの消費が大きいため、インデックスの更新は、通常、非同期プロセスで実行します。この非同期プロセスは、バックグラウンドで実行され、ベーステーブルの変更後にフルテキストインデックスを最新の状態に維持します。ベーステーブルのそれぞれの変更後すぐにフルテキストインデックスを更新すると、リソースを大量に消費することがあります。そのため、更新、挿入、または削除の率が非常に高い場合は、クエリのパフォーマンスが低下する可能性があります。この問題が発生した場合、リソースについてクエリと競合しないよう、手動による変更追跡の更新をスケジュール設定して、適宜、大量の変更に対応することを検討してください。

作成状態を監視するには、FULLTEXTCATALOGPROPERTY 関数または OBJECTPROPERTYEX 関数を使用します。カタログ作成状態を取得するには、次のステートメントを実行します。

SELECT FULLTEXTCATALOGPROPERTY('AdvWksDocFTCat', 'Populatestatus');

通常、カタログ全体の作成を実行している間は、結果として 1 が返されます。

[先頭に戻る]

例: フルテキスト検索のセットアップ

次の 2 部構成の例では、AdventureWorks データベースに AdvWksDocFTCat という名前のフルテキストカタログを作成し、次に、 AdventureWorks2012 の Document テーブルにフルテキストインデックスを作成します。このステートメントによって、セットアップ時に指定した既定のディレクトリ内にフルテキストカタログが作成されます。 AdvWksDocFTCat というフォルダーが既定のディレクトリ内にあります。

AdvWksDocFTCat という名前のフルテキストカタログを作成するために、この例では、CREATE FULLTEXT CATALOG ステートメントを使用します。
```
USE AdventureWorks;
GO
CREATE FULLTEXT CATALOG AdvWksDocFTCat;
```
Document テーブルにフルテキストインデックスを作成する前に、テーブルに一意の単一列で NULL 値にならないインデックスが含まれていることを確認します。次の CREATE INDEX ステートメントでは、Document テーブルの DocumentID 列に、一意のインデックス ui_ukDoc を作成します。
```
CREATE UNIQUE INDEX ui_ukDoc ON Production.Document(DocumentID);
```
一意のキーを作成したら、次の CREATE FULLTEXT INDEX ステートメントを使用して、Document テーブルにフルテキストインデックスを作成できます。
```
CREATE FULLTEXT INDEX ON Production.Document
(
    Document                         --Full-text index column name 
        TYPE COLUMN FileExtension    --Name of column that contains file type information
        Language 2057                 --2057 is the LCID for British English
)
KEY INDEX ui_ukDoc ON AdvWksDocFTCat --Unique index
WITH CHANGE_TRACKING AUTO            --Population type;
GO
```
この例で定義する TYPE COLUMN では、"Document" 列 (バイナリ型) の各行のドキュメント型が含まれる、テーブルの型列を指定します。この型列には、特定の行のドキュメントのユーザー指定ファイル拡張子 (".doc"、".xls" など) が格納されます。 Full-Text Engine では、特定の行のファイル拡張子を使用して、その行のデータを解析するために使用する正しいフィルターを呼び出します。その行のバイナリデータをフィルターが解析した後、指定されたワードブレーカーがコンテンツを解析します (この例では、英語 (U.K.) のワードブレーカーを使用します)。フィルター処理が行われるのは、インデックス作成時か、フルテキストインデックスへの自動変更追跡が有効になっている場合にユーザーがベーステーブルで列を挿入または列を更新したときだけである点に注意してください。詳細については、「検索用フィルターの構成と管理」を参照してください。

[先頭に戻る]

一般的なタスク

フルテキストカタログを作成するには

テーブル (またはビュー) のインデックスを表示するには

sys.indexes (Transact-SQL)

一意のインデックスを作成するには

フルテキストインデックスを作成するには

フルテキストインデックスに関する情報を表示するには

カタログビューまたは動的管理ビュー	説明
sys.fulltext_index_catalog_usages (Transact-SQL)	フルテキストカタログからフルテキストインデックスへの参照ごとに 1 行のデータを返します。
sys.fulltext_index_columns (Transact-SQL)	フルテキストインデックスの一部となっている列ごとに 1 行のデータを格納します。
sys.fulltext_index_fragments (Transact-SQL)	フルテキストインデックスでは、フルテキストインデックスフラグメントと呼ばれる内部テーブルを使用して逆インデックスのデータを保存します。このビューを使用すると、これらのフラグメントに関するメタデータをクエリできます。このビューは、フルテキストインデックスが含まれているすべてのテーブルのフルテキストインデックスフラグメントごとに 1 行のデータを格納しています。
sys.fulltext_indexes (Transact-SQL)	表形式オブジェクトのフルテキストインデックスごとに 1 行のデータを保持します。
sys.dm_fts_index_keywords (Transact-SQL)	指定されたテーブルのフルテキストインデックスのコンテンツに関する情報を返します。
sys.dm_fts_index_keywords_by_document (Transact-SQL)	指定されたテーブルについて、フルテキストインデックスのドキュメントレベルのコンテンツに関連する情報を返します。個々のキーワードは、複数のドキュメントに出現する場合があります。
sys.dm_fts_index_population (Transact-SQL)	現在実行中の、フルテキストインデックス設定に関する情報を返します。

[先頭に戻る]

次の方法で共有

フルテキスト検索の概要

このトピックの内容

フルテキスト検索を行うためのデータベースの構成

フルテキストカタログとインデックスの設定

フルテキストインデックスのオプションの選択

列の言語の選択

フルテキストインデックスのファイルグループの選択

フルテキストカタログへのフルテキストインデックスの割り当て

ストップリストとフルテキストインデックスの関連付け

フルテキストインデックスの更新

例: フルテキスト検索のセットアップ

一般的なタスク

フルテキストカタログを作成するには

テーブル (またはビュー) のインデックスを表示するには

一意のインデックスを作成するには

フルテキストインデックスを作成するには

フルテキストインデックスに関する情報を表示するには

関連項目

参照

概念

その他のリソース

次の方法で共有

フルテキスト検索の概要

このトピックの内容

フルテキスト検索を行うためのデータベースの構成

フルテキスト カタログとインデックスの設定

フルテキスト インデックスのオプションの選択

列の言語の選択

フルテキスト インデックスのファイル グループの選択

フルテキスト カタログへのフルテキスト インデックスの割り当て

ストップリストとフルテキスト インデックスの関連付け

フルテキスト インデックスの更新

例: フルテキスト検索のセットアップ

一般的なタスク

フルテキスト カタログを作成するには

テーブル (またはビュー) のインデックスを表示するには

一意のインデックスを作成するには

フルテキスト インデックスを作成するには

フルテキスト インデックスに関する情報を表示するには

関連項目

参照

概念

その他のリソース

フルテキストカタログとインデックスの設定

フルテキストインデックスのオプションの選択

フルテキストインデックスのファイルグループの選択

フルテキストカタログへのフルテキストインデックスの割り当て

ストップリストとフルテキストインデックスの関連付け

フルテキストインデックスの更新

フルテキストカタログを作成するには

フルテキストインデックスを作成するには

フルテキストインデックスに関する情報を表示するには