SJISで保存されたHTMLを検索したい

Fess 14.3を使っています。

下記条件のページが化けてしまい、改善方法があれば教えていただきたいです。

・HTMLページ。
・metaタグでcharsetが指定されていない。
・文字コードはShift_JIS。

システムから出力したものでcharsetは指定されていません
クロール時に文字コードを指定することはできませんでしょうか?

通常は、ヘッダーやmetaタグから取得でき、個別の設定はないので、transformer.xmlにcharsetNameを以下のような感じで追加するとかになると思います。

  <component name="fessXpathTransformer" class="org.codelibs.fess.crawler.transformer.FessXpathTransformer" instance="singleton">
    <property name="charsetName">"Shift_JIS"</property>

ご回答ありがとうございます

ただ、下記のように文字化けしてしまいます。Shift_JIS以外にも試したのですが、どれもダメでした。やはり難しいのでしょうか。


������
y ޖ z @ @ @ @ @ @ y ԍ z

何も指定されていないときに使うデフォルトの値がその設定なので、どこかでエンコーディングが指定されているとそっちのほうが優先して利用されると思います。