(from osdn.net/users/shintateh)
お世話になります。
現在、Windows Server 2008 R2上で Fess 9.4.2 を稼働しています。
検索システム用テストデータリポジトリから「test_utf8.txt」ファイルを
ダウンロードしてインデックス化し、検索を行いました。
ファイルタイトルの下にファイル内容などが表示されますが、
本文に続いて「org.apache.tika.parser.DefaultParser or」と
表示されます。
本文以外の情報が表示されているようなのですが、この情報は何なんでしょうか。
また、この情報を表示させないように出来るのでしょうか。
よろしくお願いします。
discuss
2
(from osdn.net/users/shinsuke)
テキスト抽出時にTikaが取得したメタ情報です。
メタ情報を除外するには、webapps/fess/WEB-INF/classes/s2robot_transformer.diconで
false
をfessTikaTransformerとfessFileTransformerに追加すると良いと思います。
次のバージョンで少し修正しようと思います。
(from osdn.net/users/shintateh)
返信ありがとうございます。
上記の変更を行いインデックスを再作成したところ、メタ情報が表示されなくなりました。
ありがとうございました。