shii
1
初めまして。
smbサーバーに対してクロールを行いましたが、クロールのログで could not accessのエラーですぐに終了となります。
画面の全般からログレベルをALLにするもfess-crawler.logは、infoしか見当たらず。
詳細なログ出力するにはどうしたら良いでしょうか。
試したこと、環境
・ファイル認証設定は行っており、domain= の指定ももれなくしている
・fessサーバーと同じところにsmbサーバー立てたものについてはクロール成功している
・DFSを利用したsmbで、試験的にDFSを経由しない直接のアドレスを指定してクロールするも同様なエラー
・Linux のsmbコマンドは正常にアクセスできファイルの一覧取得できたためsmbへのアクセス、認証情報は問題なし
・AlmaLinux10, fess 15.3.2
shii
3
ありがとうございます。
障害URLで以下エラーが確認できました。
org.codelibs.fess.crawler.exception.CrawlingAccessException: Could not access
Caused by: org.codelibs.jcifs.smb.impl.SmbException: The network name cannot be found.
copilotに相談したところいくつか指摘があり
1.smb URL書式不備
2.認証情報不足(domain指定など)
3.DFSの影響 jcifsがDFS問合せに失敗
4.smb ver差などの(サーバー側がsmb1をサポートしてない)
1,2は再度確認し確認し問題無しと判断しております。
3,4を疑っておりますが、なにか切り分ける手段ございますでしょうか?
SMB1をクロールする場合は、smb1://...という感じでしてしてみてください。
shii
5
お忙しいなか、ありがとうございます
smb1で試行しましたが、同様のエラーでした。
smbclient コマンドにて確認したところ、smb2で接続可能でした。(smb1はエラーとなりましたので対応していないようです)
他に、対応方法ございますでしょうか
shii
6
様々試行しましたが改善しないため、少し手段を変えてきました。
smb直接クロールをやめて、osでmountして、file:/で参照する形に変更してみました。
autofsで対象とするsmbをマウントし、クロールするところまでは確認できました。
しかし、日本語ディレクトリが、ばけてしまって、配下をクロールできてないことがわかりました。
fess-crawler.logを確認すると、全角文字1文字が %EF%BF%BD に化けてしまっています。
試験的にfessサーバー自身のlocalディレクトリに、日本語フォルダを作成し、smbを経由しない形でfile:/にてクロールしましたが、同様に化けているため、smbに接続できない問題とは別に、文字コードの問題が内在していたと考えています。
almalinux10 minimal なのですが、localeが日本になっていないことに気が付き、以下の設定も行ったのですが改善されておりません。
dnf install langpacks-ja
localectl set-locale LANG=ja_JP.UTF-8
不足している設定ございますでしょうか?
様々課題がある環境で申し訳ございません。
ご教示いただければ幸いです。
shii
7
日本語ディレクトリの文字化けは、調査の結果言語パック不足でした。
dnf install glibc-langpack-en
で、解消されました。
※OSのlocaleを変更する必要はありません
almalinux10 minimalのため、インストールされているパッケージが最小なことが影響していました。