Office ファイルに対して期待した通り検索できないことがある

現象

Office ファイルに対して、SQL サーバー等からインデックスを作成する場合、ファイルに依存して期待した通りインデックスが作成されないことがあります。
インデックスが期待されない要因としてはいくつかありますが、要因の一つとしてワードブレークの処理があります。
検索エンジンから呼び出される Office のフィルタ (IFilter) は、内部バッファが固定となっており、ファイルの内容により、文字列が分割して検索エンジンに返されることがあります。
文字列が分割して検索エンジンに返されることにより、期待した単語で検索できないことがあります。

なお、内部バッファが固定となっているのは、メモリを大量に消費することがないよう考慮した正常な動作です。

状況

この動作は仕様です。
プロパティ

文書番号:2709225 - 最終更新日: 2016/09/29 - リビジョン: 1

フィードバック