FESSの全般設定についていくつか質問させてください。
①同時クローラ設定
現在、全般設定の「同時クローラ設定」の値を「5」としております。
ここの設定値についてですが、設定しているスケジューラを手動で10個ほど連続で実施したところ、10個のジョブすべてが
実行中となりました。
「同時クローラ設定」の設定により、5つ以上並行でジョブが実行されないと思っていたのですが、この設定値は何を設定しているのでしょうか。
②除外するエラーの種類
現在、全般設定の「除外するエラーの種類」の値を「org.codelibs.fess.crawler.exception.MaxLengthExceededException」としております。
この「除外するエラーの種類」にエラー内容を設定することで、設定しているエラーとなるファイルについては障害URLとはならず、検索できるようになると考えておりました。
現在は障害URLに上記設定しているエラーのファイルが表示され、検索もできない状態となっております。
上記の認識について誤っておりますでしょうか。また認識誤りの場合、サイズの大きなファイルを検索対象とするためにはどのような設定を行えばよろしいでしょうか。
③障害数のしきい値
現在、全般設定の「障害数のしきい値」の値を「2」としております。
上記設定をすると障害URLのエラー回数がしきい値を超えるとクロール対象から除外され、再度ジョブ実行時障害URLにしきい値を超えたファイルは表示されなくなる。
(エラー回数も増加しない)
上記の認識でしたが、現状、エラー回数はジョブ実行ごとに4、5、6と増加しており、障害URLにも表示されつづけています。
こちらについても何か認識等誤っておりますでしょうか。