クロールしたあとにインデックスを参照するとシステムエラー

(from osdn.net/users/souchi00)
お世話になっております。

クロールでExtractorをカスタマイズしてpdfのテキストを抽出しているのですが、クロール後に管理画面のインデックス->セッションIDクリックで確認しようとすると、

システムエラー
サイト管理者にお問い合わせください。

となってしまします。
正常に動作させたいのですが、方法を教えてもらえないでしょうか?

環境は
CentOS6.6(x86_64)
java version “1.8.0_45”
です。
fessのバージョンは
fess-9.3.3,fess-9.4.0で現象を確認しました。
fess-9.1.0,fess-9.2.0ではこの現象はでませんでした。

よろしくお願いいたします。

以下設定内容です。
fess-9.3.3,fess-9.4.0のs2robot_extractor.dicon
9.1.0,9.2.0のはcodelibsをseasarに置き換え

<?xml version="1.0" encoding="UTF-8"?> "/fess/bin/pdftext.sh $INPUT_FILE $OUTPUT_FILE" "UTF-8"
<component name="extractorFactory" class="org.codelibs.robot.extractor.ExtractorFactory">
    <initMethod name="addExtractor">
        <arg>{

“application/pdf”
}
pdfCmdExtractor


pdftext.shの内容

/usr/bin/pdftotext -nopgbrk -raw $1 - | sed ‘:loop; N; $!b loop; ;s/\n//g’ > $2

fess.outには以下のメッセージが出力されていました。
2015-07-09 18:10:03,079 [http-nio-8080-exec-10] INFO [ACCESS] admin 10.1.4.73 http://localhost:8080/fess/admin/wizard/index
2015-07-09 18:10:06,557 [http-nio-8080-exec-1] INFO [ACCESS] admin 10.1.4.73 http://localhost:8080/fess/admin/document/index
2015-07-09 18:10:08,165 [http-nio-8080-exec-6] INFO [ACCESS] admin 10.1.4.73 http://localhost:8080/fess/admin/searchList/search
2015-07-09 18:10:08,559 [http-nio-8080-exec-6] ERROR System error occured.
org.codelibs.solr.lib.exception.SolrLibQueryException: [ESL0013]Invalid query: fl=score%2Cid%2CdocId%2Cboost%2CcontentLength%2Chost%2Csite%2ClastModified%2Cmimetype%2Cfiletype_s%2Ccreated%2Ctitle%2Cdigest%2Curl%2CclickCount_l_x_dv%2CfavoriteCount_l_x_dv%2Ccid_s%2Clang_s%2ChasCache_s_s&q=segment%3A20150709172928&start=0&rows=20&mm=100%25&defType=edismax&hl.fl=content&hl=true&hl.snippets=5&dcf=clickCount_l_x_dv&dcf=favoriteCount_l_x_dv
at org.codelibs.solr.lib.SolrGroup.getQueryException(SolrGroup.java:658)
at org.codelibs.solr.lib.SolrGroup.queryInternal(SolrGroup.java:643)
at org.codelibs.solr.lib.SolrGroup.query(SolrGroup.java:525)
at jp.sf.fess.service.SearchService.getDocumentList(SearchService.java:266)
at jp.sf.fess.service.SearchService$$EnhancedByS2AOP$$42e9082d.$$getDocumentList$$invokeSuperMethod$$(SearchService$$EnhancedByS2AOP$$42e9082d.java)
at jp.sf.fess.service.SearchService$$EnhancedByS2AOP$$42e9082d$$MethodInvocation$$getDocumentList3.proceed(MethodInvocationClassGenerator.java)
at
(中略)
org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61)
at java.lang.Thread.run(Thread.java:745)
Caused by: org.apache.solr.client.solrj.impl.HttpSolrServer$RemoteSolrException: org.apache.lucene.search.highlight.InvalidTokenOffsetsException: Token だし exceeds length of provided text sized 15026
at org.apache.solr.client.solrj.impl.HttpSolrServer.executeMethod(HttpSolrServer.java:552)
at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:210)
at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:206)
at org.apache.solr.client.solrj.request.QueryRequest.process(QueryRequest.java:91)
at org.apache.solr.client.solrj.SolrServer.query(SolrServer.java:310)
at org.codelibs.solr.lib.SolrGroup$13.callback(SolrGroup.java:531)
at org.codelibs.solr.lib.SolrGroup$13.callback(SolrGroup.java:526)
at org.codelibs.solr.lib.SolrGroup.queryInternal(SolrGroup.java:636)
… 92 more

(from osdn.net/users/shinsuke)
再現させて確認したいのですが、問題が起きるクロール対象のドキュメントをいただくことは可能でしょうか?

(from osdn.net/users/souchi00)
ご返答ありがとうございます。

申しわけありません、諸事情により対象ドキュメントをお渡しすることができません。
ただ、以下の方法で回避できました。
pdftest.shを以下の様にして句点のあとに改行を挿入したところ、現象は発生しなくなりました。
/usr/bin/pdftotext -nopgbrk -raw $1 - | sed -e ‘:loop; N; $!b loop; ;s/\n//g’ -e ‘s/。/。\n/g’ > $2

対象PDFは縦書なのですが、縦書PDFをpdftotextで変換すると、1文字毎に改行されてしまうので、sedで全ての改行を削除していました。

参考までに、これまで試行錯誤した結果をご報告いたします。、対象PDF1ファイルのみをクロールするとエラーにならないのですが、複数ファイルになるとエラーになります。1ファイルのみインデックス化されていると、どのファイルも問題なく動作するのですが、ファイルを追加してクロールし、2つ以上インデックス化すると、エラーになります。
全ての組み合わせを試行したわけではないですが、1ファイルのみのインデックス化だと問題ありません。

Caused by: org.apache.solr.client.solrj.impl.HttpSolrServer$RemoteSolrException: org.apache.lucene.search.highlight.InvalidTokenOffsetsException: Token だし exceeds length of provided text sized 15026
素人考えなのですが、このメッセージからなんかの制限を超えていたのかな?と思いました。なにかのパラメータの上限を上げればよいのであれば、そのパラメータも知りたいです。なにかお気づきの点ありましたら教えてもらえないでしょうか?
試してみたいです。

以上、よろしくお願いいたします。