ウェブクロールでのファイルタイプについて

ウェブクロールで作成されたインデックス(ドキュメント)のファイルタイプについて質問です。

ウェブクロールでSVNのリポジトリ上のファイル群をクロールしています。
クロール処理は正常終了し、インデックスが作成されている事は確認出来ました。
が、インデックスの詳細を見ると、ファイルタイプに関する情報が以下の様になっていました。
web_svn_crawl

SVNのドキュメントを取得してファイルクロールでインデックスを作成した場合は、以下の様になっています。
file_smb_crawl

ウェブクロールでのファイルタイプの扱いはどの様になっているのでしょうか。
拡張子でファイルタイプを確定する等の設定変更は可能でしょうか。

fess_config.propertiesでの設定で、mimetypeから変換されます。Webサーバーがapplication/octet-streamを返してきて、それがmimetypeとして利用されたのだと思います。