discuss
1
(from osdn.net/users/t_hayakawa)
表題の通り、.docxファイルをクロールしたところ、mimetype:application/x-berkeley-dbのインデックスが作成されてしまい、検索結果に表示されてしまいます。
(正規のwordファイルは同時にインデックスが作成されており、正しく表示されます。)
この検索結果をクリックして表示しても「データが破損している」との表示が出てしまうだけなので、検索結果から除外したいと考えているのですが、ファイルクロール設定でmimetypeで除外するなどの対処は可能なのでしょうか?
使用Ver:Fess10.3.2
discuss
2
(from osdn.net/users/shinsuke)
この検索結果をクリックして表示しても「データが破損している」との表示が出てしまうだけなので、
本当にデータが壊れているか、Fessからアクセスしたときに
正しく取得できていない可能性があるように思います。
ファイルクロール設定でmimetypeで除外するなどの対処は可能なのでしょうか?
クロール設定でクロール対象から除外するパスに登録するか
app/WEB-INF/classes/crawler/rule.xmlのdefaultRuleのところで
.*でなく、除外するような正規表現で記述するかなどになると思います。