(from osdn.net/users/skomatsu)
共有フォルダクロール処理テスト評価を行っています。
以下わかれば可能情報教授いただけると助かります。
<現状課題>
・大量データ蓄積ファイルサーバー、クロールテスト中。
システム保管用データ1.6Tほど、ファイル&フォルダ沢山あり
・クロール処理が終わらない、現在1週間ほど。スレッド複数に増やしても同様
フォルダがたくさんあり、階層も深く(3~5)、中間空フォルダも沢山ある。
フォルダ処理間隔が1秒ごとのため空フォルダでもスキャンできる処理数限界あり
・処理間隔:1000ms単位で指定可能。1秒だと終わらないので0にするとCPU100%。
・初回クロールだえでなく、差分クロールでも変更対象抽出となるため全フォルダ同様スキャンと推測され時間問題解決しないと想定
<知りたいこと>
・フォルダスキャン処理間隔:1000ms単位指定ではなく、もっと細かく指定可能な方法ありますでしょうか?
・差分スキャン(クロール範囲限定)以下もしかして可能かもしれませんが、何か使える可能性ありますでしょうか?
以下現在はない模様
FileListDataStore: インデクシング対象のファイルパスを記述してクロールする
商用版を利用するしかない?
http://www.n2sm.net/products/n2search/functions.html
大量ファイルクロール ファイルシステムの更新情報を利用した大規模向け高速インデクシングオプションを利用することで大量ファイルのクロールも可能です。