madone
1
プログラムソースの検索lでfessを導入しているのでが、拡張子が長いテキストファイルの場合にファイル名のインデックスが作成されますが、本文(content)はインデックスが作成されてません。
debugで確認するとmimeタイプはapplication/octet-streamでした。
この場合にtext/plainとして検索させる方法はありますでしょうか
例 xxxx.makefile で特定のフォルダのみmakefileだけでなく様々な拡張子で格納されてます。
fess 14.10.0 ,opensearch 2.9.0を使用
拡張子が長いテキストファイル名というのはどのようなものでしょうか?
madone
3
例
xxxx.makefile のmakefileになります。一般的な拡張子ではありません。
ファイル名と中身をみて、mimeタイプが決まるのですが、application/octet-streamとなると、contentが空になるのは正しい挙動だと思うので、直近では設定とかでは対応できないと思います。将来のバージョンでは、ファイル名でmimeタイプを調整できるような設定を考えようと思います。
madone
5
ご回答ありがとうございます。
検索対象のファイルがeuc-jpで保存されており、utf-8に変換するとcontextが表示されました。
試しにs-jisに変換するとeuc-jpと同様にNGになりました。
検索対象をeuc-jpとするといった設定はありませんででしょうか
fess_config.propertiesのcrawler.crawling.data.encoding=UTF-8だったような気もします。
madone
7
ご教示頂いた通り
crawler.crawling.data.encoding=EUC-JP
とするとログファイル上でencondig=EUC-JPで設定されているのは
確認できましたが、content-eoncoding=UTF-8となりcontentは出力されず
変わりませんでした。
madone
8
ファイル単位でなくクローラのファイルシステムの設定画面のdescriptionで設定できれば良いと思いました。