IFILTER_INIT列挙 (filter.h)

[Indexing Service は Windows XP の時点ではサポートされなくなり、Windows 8 の時点では使用できません。 代わりに、クライアント側 検索には Windows Search を使用し、サーバー側の検索には Microsoft Search Server Express を使用します。

フィルター処理を制御するフラグ。

構文

typedef enum tagIFILTER_INIT {
  IFILTER_INIT_CANON_PARAGRAPHS = 1,
  IFILTER_INIT_HARD_LINE_BREAKS = 2,
  IFILTER_INIT_CANON_HYPHENS = 4,
  IFILTER_INIT_CANON_SPACES = 8,
  IFILTER_INIT_APPLY_INDEX_ATTRIBUTES = 16,
  IFILTER_INIT_APPLY_OTHER_ATTRIBUTES = 32,
  IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES = 256,
  IFILTER_INIT_INDEXING_ONLY = 64,
  IFILTER_INIT_SEARCH_LINKS = 128,
  IFILTER_INIT_FILTER_OWNED_VALUE_OK = 512,
  IFILTER_INIT_FILTER_AGGRESSIVE_BREAK = 1024,
  IFILTER_INIT_DISABLE_EMBEDDED = 2048,
  IFILTER_INIT_EMIT_FORMATTING = 4096
} IFILTER_INIT;

定数

 
IFILTER_INIT_CANON_PARAGRAPHS
値: 1
段落区切りは、Unicode 段落区切り記号 (0x2029) でマークする必要があります。
IFILTER_INIT_HARD_LINE_BREAKS
値: 2
Wordの改行文字などのソフトリターンは、ハードリターンに置き換える必要がありますか?行区切り記号 (0x2028)。 既存のハード リターンは 2 倍にすることができます。 復帰 (0x000D)、改行 (0x000A)、またはキャリッジ リターンとライン フィードを組み合わせてハード リターンと見なす必要があります。 意図は、観察された改行と一致するパターン式の一致を有効にすることです。
IFILTER_INIT_CANON_HYPHENS
値: 4
さまざまなワープロ プログラムには、オプションのハイフン (行の末尾にのみ表示される) や改行しないハイフンなど、ホスト文字セットで表されないハイフンの形式があります。 このフラグは、オプションのハイフンを null に変換し、改行しないハイフンを通常のハイフン (0x2010)、またはハイフン -MINUSES (0x002D) に変換することを示します。
IFILTER_INIT_CANON_SPACES
値: 8
IFILTER_INIT_CANON_HYPHENS フラグがハイフンを標準化するのと同様に、スペースが標準化されます。 改行されていないスペースなどの特殊なスペース文字はすべて、標準のスペース文字 (0x0020) に変換されます。
IFILTER_INIT_APPLY_INDEX_ATTRIBUTES
値: 16
クライアントが内部値型プロパティを表すチャンクにテキストを分割することを示します。
IFILTER_INIT_APPLY_OTHER_ATTRIBUTES
値: 32
IFILTER_INIT_APPLY_INDEX_ATTRIBUTESフラグおよびIFILTER_INIT_APPLY_CRAWL_ATTRIBUTESフラグの対象とされないプロパティは、出力する必要があります。
IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES
値: 256
クライアントが、インデックス作成プロセス中に決定されたプロパティを表すチャンクにテキストを分割することを示します。
IFILTER_INIT_INDEXING_ONLY
値: 64
クライアントが IFilter::Init メソッドを 1 回だけ呼び出し、IFilter::BindRegion を呼び出さないため、インデックス作成のために IFilter を最適化します。 これにより、別のチャンクにアクセスする前と後の両方でチャンクにアクセスする可能性がなくなります。
IFILTER_INIT_SEARCH_LINKS
値: 128
テキスト抽出プロセスでは、ドキュメント内のすべてのリンクされたオブジェクトを再帰的に検索する必要があります。 リンクが使用できない場合、リンクの最初のチャンクを取得した IFilter::GetChunk 呼び出しは、FILTER_E_LINK_UNAVAILABLEを返す必要があります。
IFILTER_INIT_FILTER_OWNED_VALUE_OK
値: 512
コンテンツ インデックス作成プロセスでは、フィルターによって設定されたプロパティ値を返すことができます。
IFILTER_INIT_FILTER_AGGRESSIVE_BREAK
値: 1024
TBD
IFILTER_INIT_DISABLE_EMBEDDED
値: 2048
TBD
IFILTER_INIT_EMIT_FORMATTING
値: 4096
TBD

解説

通常、 IFilter::GetText メソッドによるテキスト出力は、ドキュメントの実際のテキストと正確に一致する必要があります。 ただし、相互運用性を最大限に高めるためには、一般的な機能の標準化が望ましい場合があります。 これらの機能には、段落区切り、改行、ハイフン、スペースが含まれます。 IFilter インターフェイス サーバーでは、null 文字をテキストに埋め込むこともできます。これは、クライアントによってほとんど無視されます。 つまり、Unicode 文字0x0000は完全に無視され、0x0001は単語区切りとして扱われます。

テキストの標準化を制御するフラグは、IFILTER_INIT_CANON_PARAGRAPHS、IFILTER_INIT_HARD_LINE_BREAKS、IFILTER_INIT_CANON_HYPHENS、IFILTER_INIT_CANON_SPACESの 4 つのフラグです。

IFilter インターフェイスのさまざまなクライアントが、オブジェクトの異なるビューを必要とします。 IFILTER_INIT_APPLY_INDEX_ATTRIBUTES、IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES、IFILTER_INIT_APPLY_OTHER_ATTRIBUTESの 3 つのフラグによって、チャンクに適用する必要があるプロパティのセットを制御します。 さらに、 IFilter::Init メソッドの呼び出しで、aAttributes に格納されているサイズ cAttributes の配列として、特定のプロパティを要求できます。

IFilter インターフェイスの実装では、コンテンツ インデックス作成以外の操作が発生した場合に、チャンク情報を格納する必要があります。 IFILTER_INIT_INDEXING_ONLYは、インデックス作成用にフィルターを最適化します。

表示目的で、ドキュメントや埋め込みオブジェクトだけでなく、リンクをまたいで検索することが望ましい場合があります。 IFILTER_INIT_SEARCH_LINKSは、すべてのリンクを再帰的に検索します。

特定の IFilter インターフェイスの実装では、コンテンツインデックス作成プロセス中にプロパティ値が生成される可能性があり、IFILTER_INIT_FILTER_OWNED_VALUE_OKはこれらの値を返しても問題ありません。

要件

   
サポートされている最小のクライアント Windows 2000 Professional [デスクトップ アプリのみ]
サポートされている最小のサーバー Windows 2000 Server [デスクトップ アプリのみ]
Header filter.h

関連項目

Ifilter