ファイルサーバーにおいてクロールできない。(再)

前回質問しましたが、スパム扱いになり、投稿が消えましたので、再送致します。

問題解決に至らず、途方にくれております。お力添え何卒よろしくお願いいたします。

2022-08-05 07:08:36,550 [eshttp] DEBUG Response in Memory
2022-08-05 07:08:36,550 [Crawler-20220805070723-1-5] DEBUG The url is null. (33)
2022-08-05 07:08:36,663 [eshttp] DEBUG >>> POST http://es01:9200/.crawler.queue/_search?typed_keys=true&batched_reduce_size=512&max_concurrent_shard_requests=5&ccs_minimize_roundtrips=true
2022-08-05 07:08:36,664 [eshttp] DEBUG >>> Content-Type=application/json
2022-08-05 07:08:36,665 [eshttp] DEBUG >>> {“from”:0,“size”:1000,“query”:{“bool”:{“filter”:[{“term”:{“sessionId”:{“value”:“20220805070723-1”,“boost”:1.0}}}],“adjust_pure_negative”:true,“boost”:1.0}},“sort”:[{“createTime”:{“order”:“asc”}}]}
2022-08-05 07:08:36,670 [eshttp] DEBUG <<< {“took”:2,“timed_out”:false,“_shards”:{“total”:10,“successful”:10,“skipped”:0,“failed”:0},“hits”:{“total”:{“value”:0,“relation”:“eq”},“max_score”:null,“hits”:[]}}

状況がわからないので、再現可能な情報提供をお願いします。

はい。すみません。
windows 10 pro
バージョン21H
Fess バージョン 13.16 Elasticsearch 7.16.2
14.3.0 Elaseticsearch 8.3.2
以上の環境では同じセグメントにあるファイルサーバーにクロールにいけませんでした。

しかしdockerを使用しないwindowsバージョンでしたらクロールできました。

Dockerで実行すると、Fessはコンテナ内で実行されるので、簡単に言うと、ホスト(Windows)側とは別な世界で実行されています。なので、Windowsで見えているファイルシステムは見えていないので、コンテナ(Fessが動いているDockerの世界)側で見えるようにするためには、対象の場所をマウントする必要があります。

コメントありがとうございます。初心者質問失礼します。どのように対象の場所をマントすればよろしいでしょうか。

Fessとは、関係ない話になってくるので、Googleなどで検索して探してみるのが良いと思います。

ありがとうございました。
試してみます。

codelibs/docker-fess で提供されている compose ファイルで環境を構築されていますか?

ネットワーク esnet のサブネット が 172.20.x だったり 192.168.x だったりと、compose、compose V2 でデフォルトが異なります。

接続先のファイルサーバーと、docker network のサブネットが衝突していないか確認はした方がよいです。

まずはDockerホストで、445 ポートのパケットログを取得して、コンテナからパケット出ているか確認されるとよいかと思います。

コメントありがとうございます。
公式のFessを見るとDockerを使用することが推奨されていたので、Dockerを使用していますが、いかんせん自身がdockerの使い方があまりよくわかっておりません。
少しそのあたり調査してみます。

1 Like