ContentNotFoundExceptionの発生

(from osdn.net/users/None)
ファイルシステムのクローリングを行ったところ、障害URLに下記エラーが発生していました。
確認したところ、クローリング先のフォルダ名にスペースが含まれているファイルに対して発生しているようです。
スペースが含まれていることが原因という断定もできませんが、
異なるフォルダに対象ファイルを置いてクローリングしたところ正常にクローリングされました。
解決策をご存知の方がいればご教示いただけないでしょうか。
なお、フォルダ名は変更せずにクローリングを行いたいと考えています。
org.codelibs.fess.exception.ContentNotFoundException

fess-crawler.logを確認してください。
デバッグログにするとスタックトレースも出ると思います。

shinsuke,

I too got this error message - what was your reply please?

org.codelibs.fess.exception.ContentNotFoundException: Not Found: https://www.soas.ac.uk/util/eventscrawler/.*

I have tried combinations of appending /.* to the urls but I still get 0 docs.

if curl is a good test of the url, then curl https://https://www.soas.ac.uk/util/eventscrawler gets the correct data, but appending / or /.* does not

Thanks

fess-crawler.logを確認してください。
クロール設定が間違っているなどだと思いますが、デバッグログにすれば、わかると思います。