discuss
#1
(from osdn.net/users/funasource)
xlsxの図形内に書かれた文字列を検索するにはどうすれば良いでしょうか?
xlsxの図形内に文字列がある場合、xlsxを解凍すると
drawing1.xml
というファイルができて、その中にオブジェクト(図形)内の文字列が書かれていますが
drawing1.xml内の文字列はクロール(インデックス作成)の対象になっていないようです。
クロールの際に、もし drawing1.xml があればdrawing1.xmlも対象になるようにしたいです。
discuss
#2
(from osdn.net/users/shinsuke)
MS Officeの処理はPOIに任せていますが、取得できていないものなどは
s2robot_extractor.diconなどでExtractorをカスタマイズして
いただくことになるかと思います。(zipの中のXMLなどであれば、
zipとして扱えば良いのかもしれませんが…)
discuss
#3