xlsxのオブジェクト内の文字列

(from osdn.net/users/funasource)
xlsxの図形内に書かれた文字列を検索するにはどうすれば良いでしょうか?

xlsxの図形内に文字列がある場合、xlsxを解凍すると

drawing1.xml

というファイルができて、その中にオブジェクト(図形)内の文字列が書かれていますが

drawing1.xml内の文字列はクロール(インデックス作成)の対象になっていないようです。

クロールの際に、もし drawing1.xml があればdrawing1.xmlも対象になるようにしたいです。

(from osdn.net/users/shinsuke)
MS Officeの処理はPOIに任せていますが、取得できていないものなどは

s2robot_extractor.diconなどでExtractorをカスタマイズして

いただくことになるかと思います。(zipの中のXMLなどであれば、

zipとして扱えば良いのかもしれませんが…)

(from osdn.net/users/funasource)
ありがとうございました。