discuss
November 15, 2016, 5:51pm
1
(from osdn.net/users/onyo1969 )
お世話になります。
特定のクロール設定のみを別スケジュールで実行したいのですが、設定方法がよく分かりません。
ファイルのクロール設定が1個しか無い状態にして、ヘルプを参考にして
return container.getComponent(“crawlJob”).execute(executor, [] as String[],[“1”] as String[],[] as String[],“commit”);
と設定してみましたが、指定時刻になってもクロールされません。ジョブログを見ると1秒程度で正常終了(状態:ok)しており、ログファイルを見てもaudit.log以外はファイルスタンプが更新されていません。
Default Crawlerの設定である、
return container.getComponent(“crawlJob”).logLevel(“info”).execute(executor);
と設定すると問題なくクロールされますので、ヘルプに記載のある「ファイルシステムクロール設定のID」がキーのような気がしているのですが、この「ID」とは具体的に何を指定すればよろしいのでしょうか?
以上、よろしくお願いします。
discuss
November 15, 2016, 10:18pm
3
(from osdn.net/users/shinsuke )
IDはelasticsearch上のクロール設定のドキュメントIDになりますが、
個別のジョブを作成する場合は各クロール設定の詳細で新しいジョブの作成から
作成してください。
discuss
November 16, 2016, 8:57am
4
(from osdn.net/users/onyo1969 )
なるほど!
この「新しいジョブの作成」というボタンが何のために存在するのか分からなかったのですが、セッションIDや上記ドキュメントIDなどを設定したスクリプトを自動生成してくれる機能だったのですね。
当方の環境では、下記のようなスクリプトが自動生成されて、無事クロールされるようになりました。これにより、念願だった曜日別クロールが実現できそうです。
return container.getComponent(“crawlJob”).logLevel(“info”).sessionId(“AVYyCVXWC_EGR83M7doO”).execute(executor, [] as String[],[“AVYyCVXWC_EGR83M7doO”] as String[],[] as String[], “”);
早急な回答ありがとうございました。