(from osdn.net/users/k-sugiyama)
お世話になっております。
現在、SAMBAサーバーのファイルシステムクロールをテストしております。
その中で、日本語のフォルダ名が含まれるパスを除外したいのですが、うまくいきません。
具体的には、「クロール対象から除外するパス」に以下の様に設定しておりますが、除外されません。
./FESStest/検索対象ドキュメント/.
一方、以下の様に設定すると、ちゃんと除外されております。
./FESStest/.
パスのフィルタリング設定は、日本語非対応なのでしょうか?
ちなみに、クローラーログを見ると、Target PathはURLエンコードなしのそのままの日本語フォルダ名となっていますが、Excluded PathはURLエンコードされています。
2015-11-19 14:21:57,321 [WebFsCrawler] INFO Target Path: smb://(IPアドレス)/disk/(日本語フォルダ名:URLエンコードなし)/(日本語フォルダ名:URLエンコードなし)/
2015-11-19 14:21:57,322 [WebFsCrawler] INFO Excluded Path: ./FESStest/%E6%A4%9C%E7%B4%A2%E5%AF%BE%E8%B1%A1%E3%83%89%E3%82%AD%E3%83%A5%E3%83%A1%E3%83%B3%E3%83%88/.
よろしくお願い致します。