Subversionのファイルをクロールする方法

(from osdn.net/users/tamori_naoto)
Tortoise SVNを利用しており、
SVNにあるWordやPDFなどをクロールさせて、
検索結果を表示できればと考えています。

一度SVNでローカルか共有フォルダなどにダウンロードして、
それを直接クロールすることができるのですが、
全体の容量が多いため直接SVNをクロールできれば助かります。

SVNはWeb上でもファイルをツリー上に表示できるので、
FESSのWebクローラーでリポジトリのURLをクロールしたところ、
1.0 text/xsl /svnindex.xslしかクロールされなかったため、
上記のxslの中身を直接クロールできれば理想的だと思っています。

何かご教示いただけると助かります。
よろしくお願いします。

(from osdn.net/users/shinsuke)
XSLTでSVNを表示させたことがないのでわかりませんが、
HTMLとしてパースできないので、インデックスされないと
思います。XSLTでなく、HTMLとして表示させるようにして、
クロールさせれば良いと思います。

(from osdn.net/users/tamori_naoto)
ご回答いただき、ありがとうございます。
上記のXSLTではなくHTMLとしてクロールさせる方法を
ご教示いただけないでしょうか。
お手数をおかけし大変恐縮ですがよろしくお願いいたします。

(from osdn.net/users/mshibata)
以下のような感じ (httpd.conf) で XSLT 以外の普通のディレクトリリスティング (HTML) の口も1つ作っておいて、Fess のパスマッピングで
http://hostname/svn2fess/http://hostname/svn/
…のようにパスを読み替え、Web クロールの設定ももっぱら
http://hostname/svn2fess/.*
…に対して行う。

…というのをウチではやってます。

IP アドレス、パス等、ウチ固有の情報は適当に読み替えてください。

<Location “/svn/”>
DAV svn
SVNParentPath “C:\TracLight\projects\svn”
SVNListParentPath on
SVNIndexXSLT “/svnindex.xsl”
Order allow,deny
Allow from 192.168.0.0/19

AuthName trac
AuthUserFile “C:\TracLight\projects\trac.htdigest”
Require valid-user
AuthzSVNAccessFile “C:\TracLight\projects\svnauthz”

<Location “/svn2fess/”>
DAV svn
SVNParentPath “C:\TracLight\projects\svn”
SVNListParentPath on
Order allow,deny
Allow from 192.168.28.55 // Fess サーバーからしかアクセスできなくしておく。
AuthType Digest
AuthName trac
AuthUserFile “C:\TracLight\projects\trac.htdigest”
Require valid-user
AuthzSVNAccessFile “C:\TracLight\projects\svnauthz”

(from osdn.net/users/mshibata)
[メッセージ #79816 への返信]
コピペの段階で一行消えておりました。

<Location “/svn/”> ~ の間にある空行は
AuthType Digest
…が入ります。

(from osdn.net/users/tamori_naoto)
いろいろご教授いただき、ありがとうございました。
SVNサーバーの設定を変えることができなかったため、
一度ローカルに落としたファイルを、
パスマッピングでURLを変更することにしました。

ちょっとどんくさいですが、
直接ローカルのファイルを参照させるよりかはマシかなと思います。

[メッセージ #79817 への返信]

[メッセージ #79816 への返信]
コピペの段階で一行消えておりました。

<Location “/svn/”> ~ の間にある空行は
AuthType Digest
…が入ります。