webクロール利用しsubversionをクロールは出来ているのですが、
空フォルダを含んでindexが作成されます。
それで空フォルダは除外する為、除外するurlに
.*/$
としましたが、除外できませんでした、除外方法をご教示頂けないでしょうか
対象はホームページにある通り下記のようにしてます。
名前 Fess
URL https://fess.codelibs.org/
クロール対象とするURL Fess - Enterprise Search Server*
使用環境:
fess:14.12
opensearch:2.12
Windows server
fess-crawler.logでクロールしているURLを確認して、除外したいURLパターンの正規表現を指定して、除外してください。
ご回答ありがとうございます。
ログを確認し、正規表現で任意の文字、スラッシュで終わる
としているのですが、間違ってますでしょうか?
.*/$
お伝えした内容が間違ってました。
.*/$
を指定するとすべて除外され、indexが作成されません。
過去のトピックにも同じような話はあると思いますが、.*/$
を除外した場合、クロールの開始URLにhttps://fess.codelibs.org/
のようにしても、これが除外対象にマッチされるので、クロール対象はなくなります。
要件に合わせて、クロール対象・検索対象のパターンを適切に設定してください。