smbクロールできず。原因特定方法

初めまして。

smbサーバーに対してクロールを行いましたが、クロールのログで could not accessのエラーですぐに終了となります。

画面の全般からログレベルをALLにするもfess-crawler.logは、infoしか見当たらず。

詳細なログ出力するにはどうしたら良いでしょうか。

試したこと、環境

・ファイル認証設定は行っており、domain= の指定ももれなくしている

・fessサーバーと同じところにsmbサーバー立てたものについてはクロール成功している

・DFSを利用したsmbで、試験的にDFSを経由しない直接のアドレスを指定してクロールするも同様なエラー

・Linux のsmbコマンドは正常にアクセスできファイルの一覧取得できたためsmbへのアクセス、認証情報は問題なし

・AlmaLinux10, fess 15.3.2

障害URLの方に出ているかもしれません。

ありがとうございます。

障害URLで以下エラーが確認できました。

org.codelibs.fess.crawler.exception.CrawlingAccessException: Could not access

Caused by: org.codelibs.jcifs.smb.impl.SmbException: The network name cannot be found.

copilotに相談したところいくつか指摘があり

1.smb URL書式不備

2.認証情報不足(domain指定など)

3.DFSの影響 jcifsがDFS問合せに失敗

4.smb ver差などの(サーバー側がsmb1をサポートしてない)

1,2は再度確認し確認し問題無しと判断しております。

3,4を疑っておりますが、なにか切り分ける手段ございますでしょうか?

SMB1をクロールする場合は、smb1://...という感じでしてしてみてください。

お忙しいなか、ありがとうございます

smb1で試行しましたが、同様のエラーでした。

smbclient コマンドにて確認したところ、smb2で接続可能でした。(smb1はエラーとなりましたので対応していないようです)

他に、対応方法ございますでしょうか

様々試行しましたが改善しないため、少し手段を変えてきました。

smb直接クロールをやめて、osでmountして、file:/で参照する形に変更してみました。

autofsで対象とするsmbをマウントし、クロールするところまでは確認できました。

しかし、日本語ディレクトリが、ばけてしまって、配下をクロールできてないことがわかりました。

fess-crawler.logを確認すると、全角文字1文字が %EF%BF%BD に化けてしまっています。

試験的にfessサーバー自身のlocalディレクトリに、日本語フォルダを作成し、smbを経由しない形でfile:/にてクロールしましたが、同様に化けているため、smbに接続できない問題とは別に、文字コードの問題が内在していたと考えています。

almalinux10 minimal なのですが、localeが日本になっていないことに気が付き、以下の設定も行ったのですが改善されておりません。

dnf install langpacks-ja

localectl set-locale LANG=ja_JP.UTF-8

不足している設定ございますでしょうか?

様々課題がある環境で申し訳ございません。

ご教示いただければ幸いです。

日本語ディレクトリの文字化けは、調査の結果言語パック不足でした。

dnf install glibc-langpack-en

で、解消されました。

※OSのlocaleを変更する必要はありません

almalinux10 minimalのため、インストールされているパッケージが最小なことが影響していました。