Windowsサーバのファイルクロールにおいて、下記Exceptionが発生して該当ファイルがインデクシングされない現象が発生しております。
org.codelibs.fess.crawler.exception.EsAccessException: Failed to insert sKsJ7IEBIbI26gy_v8Pv-1.c21iOi8vSnJkNjg3NS8xMF_ntYTnuZTliKUvMTkwX-aKgOihky_jgqLjgq_jgrvjgrnliLbpmZAvMDAyX-ijveWTgeWIpS_ilqAwMTBf6KeS44OB44OD44OXKOaWsOS9k-ezuzIwMjAwOTExfikvMDcwMF_lpInmm7TotbfmoYhf6KeS44OB44OD44OXL-KXhuWkieabtOWujOS6hi9DQy1NTy1FUkotMjEtMDEzIFAwMyBTUFDlsI7lhaUv6KmV5L6h57WQ5p6cL3REYXRhLnhsc3gat org.codelibs.fess.crawler.service.impl.AbstractCrawlerService.insert(AbstractCrawlerService.java:232)at org.codelibs.fess.crawler.service.impl.EsDataService.store(EsDataService.java:59)at org.codelibs.fess.crawler.service.impl.EsDataService.store(EsDataService.java:40)at org.codelibs.fess.crawler.processor.impl.DefaultResponseProcessor.processResult(DefaultResponseProcessor.java:124)at org.codelibs.fess.crawler.processor.impl.DefaultResponseProcessor.process(DefaultResponseProcessor.java:79)at org.codelibs.fess.crawler.CrawlerThread.processResponse(CrawlerThread.java:287)at org.codelibs.fess.crawler.FessCrawlerThread.processResponse(FessCrawlerThread.java:238)at org.codelibs.fess.crawler.CrawlerThread.run(CrawlerThread.java:162)at java.base/java.lang.Thread.run(Thread.java:834)Caused by: org.codelibs.curl.CurlException: Failed to access to http://localhost:9201/.crawler.data/_doc/sKsJ7IEBIbI26gy_v8Pv-1.c21iOi8vSnJkNjg3NS8xMF_ntYTnuZTliKUvMTkwX-aKgOihky_jgqLjgq_jgrvjgrnliLbpmZAvMDAyX-ijveWTgeWIpS_ilqAwMTBf6KeS44OB44OD44OXKOaWsOS9k-ezuzIwMjAwOTExfikvMDcwMF_lpInmm7TotbfmoYhf6KeS44OB44OD44OXL-KXhuWkieabtOWujOS6hi9DQy1NTy1FUkotMjEtMDEzIFAwMyBTUFDlsI7lhaUv6KmV5L6h57WQ5p6cL3REYXRhLnhsc3g?timeout=1m&refresh=true&op_type=createat org.codelibs.curl.CurlRequest.lambda$connect$3(CurlRequest.java:201)at java.base/java.util.concurrent.ForkJoinTask$RunnableExecuteAction.exec(ForkJoinTask.java:1426)at java.base/java.util.concurrent.ForkJoinTask.doExec(ForkJoinTask.java:290)at java.base/java.util.concurrent.ForkJoinPool$WorkQueue.topLevelExec(ForkJoinPool.java:1020)at java.base/java.util.concurrent.ForkJoinPool.scan(ForkJoinPool.java:1656)at java.base/java.util.concurrent.ForkJoinPool.runWorker(ForkJoinPool.java:1594)at java.base/java.util.concurrent.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:183)Caused by: org.codelibs.curl.CurlException: Failed to write a response.at org.codelibs.curl.CurlRequest$RequestProcessor.writeContent(CurlRequest.java:326)at org.codelibs.curl.CurlRequest$RequestProcessor.accept(CurlRequest.java:274)at org.codelibs.curl.CurlRequest.lambda$execute$4(CurlRequest.java:218)at org.codelibs.curl.CurlRequest.lambda$connect$3(CurlRequest.java:199)… 6 moreCaused by: java.io.IOException: Stream closedat java.base/java.io.BufferedInputStream.getInIfOpen(BufferedInputStream.java:165)at java.base/java.io.BufferedInputStream.fill(BufferedInputStream.java:252)at java.base/java.io.BufferedInputStream.read1(BufferedInputStream.java:292)at java.base/java.io.BufferedInputStream.read(BufferedInputStream.java:351)at java.base/java.io.FilterInputStream.read(FilterInputStream.java:107)at org.codelibs.curl.CurlRequest$RequestProcessor.writeContent(CurlRequest.java:301)… 9 more
Exceptionが発生したのは80MB程度のExcelファイルです。
調べた結果、ここまでは確認できております。
・1ファイルのみ指定してクロールしても上記Exceptionが発生する
・クロール間隔を増やしても上記Exceptionが発生する(1000ミリ秒→5000ミリ秒)
・ファイルサイズが原因の可能性を考えて他にもExcelファイルをクロール検証してみたところ
90MB超のExcelファイルが問題なくクロールできた
原因について分かる事、調査すると良さそうな点などございましたら、ご教示いただけませんでしょうか?
よろしくお願い致します。
fess-13.16.0 ※Elasticsearch連携なしで利用
jdk-11.0.10