kaito
1
WindowsServer2022にてFESSの構築を実施しております。
【第25回】Tesseract OCRを利用する](TECH+総合トップ | TECH+)
上記記事を参考にTesseract OCRの設定を行っていますが、現状画像検索ができておりません。
propertiesファイルなどの記載は記事の記載内容で作成しており、C:\tools\fess-14.0.1\conf配下に格納しております。
クローラーの「設定パラメータ」には上記パス内のpropertiesファイルを参照するように記載しております。
「設定パラメータ」
config.tika.tesseract.config=file:/c:/tools/fess-14.0.1/conf/TesseractOCRConfig.properties
config.tika.pdf.config=file:/c:/tools/fess-14.0.1/conf/PDFParser.properties
何か他に設定等必要なことがありますでしょうか。
お手数ですが、ご確認をお願いいたします。
14系での手順とかは整理していないので、13系までしか、その手順は使えないと思います。
kaito
3
ご回答ありがとうございます。
設定を見直し画像検索ができるようになりました。
RUF
4
お世話になります。
Ubuntu22とFESS14.2,ES8で利用させていただいております。
【第25回】Tesseract OCRを利用する](TECH+総合トップ | TECH+)
上記ページを参考に設定しましたが,画像検索が行えません。(スキャナー生成PDFの検索も同様です)。
クローラーログをdebugにして設定パラメータをどのように扱っているか見ました。
ログの標準レベルinfoの状態ではエラーのたぐいが出ないため,debugにしましたが同様にそれらしいエラーが出ておりません。
また設定パラメータのファイルパスの記述をわざと間違って記入しましたが,それについて言及するエラーも出ていないため,そもそもここに記述して動作するのかどうかもわからないと考えています。
FESS14系で対応すべきポイントをご教示いただければと思います。
お手数おかけ致します。どうぞよろしくお願い致します。