(from osdn.net/users/wasabi1975)
「システム」→「辞書」→Kuromoji」から、単語を登録しましたが、
検索結果に反映されていないようです。
たとえば「バーチャル リアリティー」をカスタム名詞で登録しても、
「ルリ」の結果に出てきてしまいます。
単語登録の後に必要な作業を教えていただけないでしょうか。
合わせて、Fessで利用できる品詞の種類(名詞、動詞、サ変動詞)など
教えていただけると助かります。
よろしくお願いいたします。
(from osdn.net/users/wasabi1975)
「システム」→「辞書」→Kuromoji」から、単語を登録しましたが、
検索結果に反映されていないようです。
たとえば「バーチャル リアリティー」をカスタム名詞で登録しても、
「ルリ」の結果に出てきてしまいます。
単語登録の後に必要な作業を教えていただけないでしょうか。
合わせて、Fessで利用できる品詞の種類(名詞、動詞、サ変動詞)など
教えていただけると助かります。
よろしくお願いいたします。
(from osdn.net/users/shinsuke)
Fess 10ではドキュメントの言語判定を行い、そのドキュメントに
最適な各言語用のAnalyzerを適用するようにしています。
形態素解析されたものが結果の上位に来ないような場合は
ドキュメントの言語判定で日本語として判定されていない可能性があります。
HTMLであれば、fess_config.propertiesで
crawler.document.html.lang.xpath=//HTML/@lang
の情報を利用し、ファイルシステムクロールであれば
crawler.document.file.default.lang=
が利用されます。ファイルシステムクロールで
強制的に日本語にする場合は
crawler.document.file.default.lang=ja
などとすること、ファイルが日本語として処理されます。
除外される品詞については
https://github.com/codelibs/fess/blob/fess-10.0.3/src/main/resources/fess_indices/fess.json#L33
を参照してください。
(from osdn.net/users/wasabi1975)
http://diamond.jp/articles/-/82928
上記のページですが、
が指定されておりますが、 「ルリ」を検索したときに「ベルリン」がヒットします。 辞書には「ベルリン」で登録しております。ファイルシステムクロールのように、ウェブの言語判定を
固定する方法があれば教えてください。
よろしくお願いいたします。
© 2020. All Rights Reserved - CodeLibs, Inc.