[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: charset of mailing list archive



In message <199905181521.AAA08379@edge.sky.yamashina.kyoto.jp>
  Takahiro Kambe <taca@sky.yamashina.kyoto.jp> writes:
>一応、HTTP/HTML的には上記のcharsetで行うべきだという意見を聞いたことが
>あるような気がします。

    http://www.fxis.co.jp/DMS/sgml/html_correct_charset.html

などに記述があります。

META 要素で指定しても,
現実には多くのサーバはそれをもとに HTTP ヘッダをつけたりはしません。
# www.jp.netbsd.org も, ( /ja/JP/ml.html を見ると,) つけませんね。

また,漢字コードを変換するプロキシなどがあると,
実際のコードと META 要素での指定が食い違うおそれがあるといった問題があるわけですね。

あと, (ブラウザ側の問題ですが) Mozilla 2 では, META で
charset=EUC-JP や charset=Shift_JIS を指定すると,
欧文フォントで表示されて化けます。
# HTTP ヘッダでやるぶんには化けない。


一方, HTTP ヘッダで指定すると,
ローカルに保存した場合には情報が失われることになります。
今回のケースでは, EUC と JIS の混在がある限り,問題は解消しないのですね。

あと,古いブラウザが対応していないという問題もあります。
たとえば Lynx 2.4 以前では,
HTTP ヘッダの Content-Type: で charset を指定されたページは,

 | This file cannot be displayed on this terminal:  D)ownload, or C)ancel 

となってしまって読めません。古い Mosaic もだめだったと思います。

個人的には, ISO-2022-JP で統一していただけると嬉しいです。

-- 
岡野孝悌
kano@na.rim.or.jp