「クロール対象とするパス」の指定方法について

(from osdn.net/users/hogefoobar)
三度の質問すみません。

ファイル検索の検索対象数が膨大で、クロール時間の短縮を図るべく「クロール対象とするパス」に拡張子を指定することにより実現できないか、と考えました。
(今までは、「クロール対象から除外するパス」に多数登録していましたが、対象をtext,pdf,office文書に限定する方向で。)


の「拡張子が png のものを対象から除外したい場合」の表現を参考に
例えば、テスト的に「txt」の拡張子のものだけを対象にしたいと思い、
「クロール対象とするパス」のところに「.*.txt$」とだけ記載し(その他のパスの表現はすべて空白)、実行してみましたが、件数が0件で返ってきました。
実行時間は1分にも満たず。当然、対象となる「txt」のファイルは当該ファイルシステムには多数存在しています。

こちら、表現が間違っているのでしょうか?ご教示頂きたく。よろしくお願いします。

(from osdn.net/users/shatake)

こちら、表現が間違っているのでしょうか?


の過去のやり取りにもありますように、「クロール対象とするパス」ではなく
「検索対象とするパス」に「.*.txt$」を設定して頂ければ良いかと思います。

(from osdn.net/users/hogefoobar)
shatake様、返信ありがとうございます。

返信を見て分からなくなったのですが、
・クロール対象
・検索対象
の違いです。

クロール対象…クロール時に正規表現で対象を絞り込み
検索対象…クロールした結果から、検索時の絞り込みの条件に正規表現の条件を加える

と認識していましたが、違うのでしょうか?


の文章見ても、その違いは分かりませんでした。

私がやりたいのは、クロール時間の短縮の為、クロールの対象件数を減らす(絞り込む)事です。そう思い前者の方に入力していました。
ご紹介頂いたものは、検索対象に条件を指定するものですが、そちらでよろしいのでしょうか?

ご紹介頂いた掲示板に

「クロール対象とするパス」等で指定するとそれ以外がクロール対象でなくなるため、
とありましたが、私がやりたいのは、まさしくこの通りなのですが。

以上、よろしくお願いします。

(from osdn.net/users/hogefoobar)
追記

ご紹介頂いた「検索対象」の方に条件を記入してクロールしたところ、24時間で終わらなかったクロールが4時間で終了しました。

検索もしてみましたが、望むような結果は返ってきています。

なので、正しい対処方法だと思うのですが、「検索対象」と「クロール対象」の考え方の区別が分からなくなってしまいました。