[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: www.NetBSD.orgの日本語訳was: Re: ports/zaurus/faq.xml: 1.2 -> 1.3
こんにちは。
小野寺です。
XSLと書くのか、XSLTと書くのか良く分からないほど
XMLとかのことが分からないので、誤解していたら
お許しください。
From: Hiroki Sato <hrs@allbsd.org>, Date: Sun, 14 Aug 2011 14:50:15 +0900 (JST)
> ry> とりあえず、1999.xmlとかは昔のTNFにあるものを使って、
> ry> 全体をUTF-8にして、makeできるようにしました。
> ry> これで文字化けは、私の気付く範囲ではなくなりました。
> ry> 現在の状況を
> ry> http://ryo-on.users.sourceforge.net/distrib/20110813-htdocs-js.tar.bz2
> ry> にアップロードしておきました。
> ry> ご確認ください。
> ry>
> ry> 私の意見としては、全体をUTF-8化したらどうかと思っています。
> ry> 最低限の変更ですみますし(当然TNFのツリーにはcommitできないのでしょうが)。
> ry>
> ry> いかがでしょうか?
>
> 文字が化けるのは、
>
> 1) 言語共通の XSLT 等々ではエンコーディング指定を明示的に行なず、
> 言語依存のところで指定する、という多層構造にもともとなっていたが、
> 言語依存を(英語も含めて)全部消してしまった。
>
> 2) 日本語は iso-2022-jp で書いてあった。
>
> というのが理由です。本来ならば、英語も iso-8859-1 を指定すべきところ
> なのですが、そっちは化けないので、誰も気づいていないのでしょう...
>
> UTF-8 に統一すること自体は問題ない (XML は指定がなければ UTF-8 を
> 仮定する) のですが、いずれにしても、既定値に頼らず、
> エンコーディングの指定をちゃんと入れるのが正しい方法だと思います。
XMLファイルでは、全てのファイルの頭にあるISO-2022-JPの文字を
UTF-8に置換しました。もちろん文字コードもUTF-8にしてあります。
例は、
http://ryo-on.users.sourceforge.net/htdocs/ja/changes/1998.xml
です。
これが、「既定値に頼らずエンコーディングの指定をちゃんと入れる」
ことになるでしょうか?
生成されたHTMLファイルにも、charset=UTF-8と入っています。
# こうなるようにxslファイルを変更したんだったと思いますが、
# よく分からないままにやっているので、記憶が不明瞭になりました…
> また、実用上困ることはまれなのですが、UTF-8 だと
> 表現できない漢字(特に人名等)がいくつかあるので、悩ましいところですね。
htdocs/jaだと、日本人の名前がローマ字のままの箇所ばかりのように
見られるので、当面心配はないのかなと思いました。
--
Ryo ONODERA // ryo_on@yk.rim.or.jp
PGP fingerprint = 82A2 DC91 76E0 A10A 8ABB FD1B F404 27FA C7D1 15F3