[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Forward: CVS commit: htdocs
川本です。
> > あるいは、初期のようにurl書き換えにして、新しいファイルが
> > importされるたびに既存の/ja/ファイルのurlをチェックする
> > スクリプトを動かすとか。
>
> 自動化できるんだったら、これがベストな気がします。
> お手軽に使える html パーサってなにがあるのかしら。
perlのHTML::Parseモジュールとか?
どっかの本からのパクりなんですが、こんな感じでurlを
抜き出せます。
use HTML::Parse;
use HTML::Element;
$parsed_file = HTML::Parse::parse_htmlfile("index.html");
for (@{ $parsed_file->extract_links() }) {
$show_link = $_->[0];
print "$show_link\n";
}
後は、
・/ja/以下の全部のhtmlファイルにこれを実行して
・実際にファイルがあるかどうか調べる
くらいでよいのかな。
--
iかわもと よしひさ! kawamoto@es.osaka-u.ac.jp