(from osdn.net/users/tamori_naoto)
Tortoise SVNを利用しており、
SVNにあるWordやPDFなどをクロールさせて、
検索結果を表示できればと考えています。
一度SVNでローカルか共有フォルダなどにダウンロードして、
それを直接クロールすることができるのですが、
全体の容量が多いため直接SVNをクロールできれば助かります。
SVNはWeb上でもファイルをツリー上に表示できるので、
FESSのWebクローラーでリポジトリのURLをクロールしたところ、
1.0 text/xsl /svnindex.xslしかクロールされなかったため、
上記のxslの中身を直接クロールできれば理想的だと思っています。
何かご教示いただけると助かります。
よろしくお願いします。
(from osdn.net/users/shinsuke)
XSLTでSVNを表示させたことがないのでわかりませんが、
HTMLとしてパースできないので、インデックスされないと
思います。XSLTでなく、HTMLとして表示させるようにして、
クロールさせれば良いと思います。
(from osdn.net/users/tamori_naoto)
ご回答いただき、ありがとうございます。
上記のXSLTではなくHTMLとしてクロールさせる方法を
ご教示いただけないでしょうか。
お手数をおかけし大変恐縮ですがよろしくお願いいたします。
(from osdn.net/users/mshibata)
以下のような感じ (httpd.conf) で XSLT 以外の普通のディレクトリリスティング (HTML) の口も1つ作っておいて、Fess のパスマッピングで
http://hostname/svn2fess/ → http://hostname/svn/
…のようにパスを読み替え、Web クロールの設定ももっぱら
http://hostname/svn2fess/.*
…に対して行う。
…というのをウチではやってます。
IP アドレス、パス等、ウチ固有の情報は適当に読み替えてください。
<Location “/svn/”>
DAV svn
SVNParentPath “C:\TracLight\projects\svn”
SVNListParentPath on
SVNIndexXSLT “/svnindex.xsl”
Order allow,deny
Allow from 192.168.0.0/19
AuthName trac
AuthUserFile “C:\TracLight\projects\trac.htdigest”
Require valid-user
AuthzSVNAccessFile “C:\TracLight\projects\svnauthz”
<Location “/svn2fess/”>
DAV svn
SVNParentPath “C:\TracLight\projects\svn”
SVNListParentPath on
Order allow,deny
Allow from 192.168.28.55 // Fess サーバーからしかアクセスできなくしておく。
AuthType Digest
AuthName trac
AuthUserFile “C:\TracLight\projects\trac.htdigest”
Require valid-user
AuthzSVNAccessFile “C:\TracLight\projects\svnauthz”
(from osdn.net/users/mshibata)
[メッセージ #79816 への返信]
コピペの段階で一行消えておりました。
<Location “/svn/”> ~ の間にある空行は
AuthType Digest
…が入ります。
(from osdn.net/users/tamori_naoto)
いろいろご教授いただき、ありがとうございました。
SVNサーバーの設定を変えることができなかったため、
一度ローカルに落としたファイルを、
パスマッピングでURLを変更することにしました。
ちょっとどんくさいですが、
直接ローカルのファイルを参照させるよりかはマシかなと思います。
[メッセージ #79817 への返信]
[メッセージ #79816 への返信]
コピペの段階で一行消えておりました。
<Location “/svn/”> ~ の間にある空行は
AuthType Digest
…が入ります。