お世話になっております。
障害数のしきい値を2にしてるにもかかわらず、障害URLのエラー回数が3以上を記録する場合があります。
再現手順
1.ファイルクロール時のindexにTITLEタグの文字列を入れる設定を施す
component(webHtmlRule)の下記箇所をコメントアウト
/usr/share/fess/app/WEB-INF/classes/crawler/rule.xml
<postConstruct name="addRule">
<arg>"url"</arg>
<arg>"http[s]?:.*"</arg>
</postConstruct>
2.下記のようなアンカータグをもつhtmlファイルを用意
(クエリパラメータがつくリンク)
<a href="./index.php?id=1" >
3.2のファイルをファイルクロールすると、障害URLに
java.lang.IllegalArgumentException
として記録される
期待する動作
障害URLにjava.lang.IllegalArgumentExceptionとして記録されるが、障害数にしきい値を2に設定した場合には、エラー回数は2を超えないようにクロールから除外されたい。
FESS ver 13.4.5.1
elastic ver 7.4.2.1
RHEL 7.7