OTAKA
1
過去の質問等も検索しましたが、問題が解決しなかったので
質問することにしました。
Ver. Fess 13.12.1
OS:Windows10 pro for workstations
ファイルクロールの設定
クロール対象とするパス:file:/c:/Users/日本語/Documents/test/
検索対象とするパス:/.*
パーミッション
{role}guest
{role}admin
testフォルダには日英混合のファイル名を持つPDF、WORD、Excelファイル等を
テストとして入れてあります。
クローラの実行には問題ないですが、
インデックスサイズが0となり検索対象になりません。
パスに日本語が含まれるのがいけないのかと思い、
[s2robot_extractor.dicon]を作成し、shift_jisのエンコードを記述してみたりもしたのですが、
解決しません。
何かアドバイスいただければ助かります
よろしくお願いいたします。
検索対象とするパス:/.*
ですと、file:/… のパスは一致しないため、検索対象がなくなってしまうと思います。
OTAKA
3
回答ありがとうございます。
クロール対象とするパス:file:/c:/Users/日本語/Documents/test/
検索対象とするパス:file:/c:/Users/日本語/Documents/test/.*
クロール対象とするパス:file:/c:/Users/日本語/Documents/test
検索対象とするパス:file:/c:/Users/日本語/Documents/test/.*
でクローリングを試してみましたが、インデックスサイズは0のままです。
パスに日本語が含まれないフォルダで試した際は、
ファイル名に日本語が含まれないファイルだけインデックスを作成していました。
原因が違うところにあるのでしょうか?
本当に素人質問で申し訳ないですが、アドバイスいただければ幸いです。
親のフォルダからクロールしたりして、fess-crawler.logでクロールしているパスなどを確認すると良いかと思いますが、DISABLE_URL_ENCODEのような設定で調整するか、エンコードされたパスを指定するなどがあります。