[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Forward: CVS commit: htdocs



川本です。

> > あるいは、初期のようにurl書き換えにして、新しいファイルが
> > importされるたびに既存の/ja/ファイルのurlをチェックする
> > スクリプトを動かすとか。
> 
> 自動化できるんだったら、これがベストな気がします。
> お手軽に使える html パーサってなにがあるのかしら。

perlのHTML::Parseモジュールとか?
どっかの本からのパクりなんですが、こんな感じでurlを
抜き出せます。

use HTML::Parse;
use HTML::Element;

$parsed_file = HTML::Parse::parse_htmlfile("index.html");
for (@{ $parsed_file->extract_links() }) {
    $show_link = $_->[0];
    print "$show_link\n";
}

後は、
・/ja/以下の全部のhtmlファイルにこれを実行して
・実際にファイルがあるかどうか調べる
くらいでよいのかな。
-- 
iかわもと よしひさ!                   kawamoto@es.osaka-u.ac.jp