[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: /usr/pkg/man/ja_JP.EUC
>>>>> On Sun, 10 Jul 2005 15:09:25 +0900, OBATA Akio <obata@lins.jp> said:
>> http://www.netbsd.org/cgi-bin/query-pr-single.pl?number=30687
>>
>> この PR では、「ja_JP.EUC」の部分を「ja」に変えるように勧めましたが、
>> 「ja」ではなく「ja_JP.eucJP」とする案もあります。
> NetBSD の man は国際化されていないので、それはそれとして、
そうなんですよね。
> 国際化されている man の場合、
> 1. 言語ごとに文字コードが一つと思っている
こう仮定している OS はないんじゃないでしょうか。
言語ごとに文字コードが一つってのは、ヨーロッパでも成り立たない話なので。
> => ja にman を全部放り込んでいる(eucJP だったり UTF-8だったりで統一)
> linux man はこれでしょうか?(最近のだと UTF-8だったりする?)
最近の Fedora Core などは、マニュアルの実体は UTF-8 で置いてあり、
LANG=ja_JP.eucJP の場合は、まず
man/ja_JP.eucJP/
を探してあればそのまま表示、なければ
man/ja/
を探して、ここにある UTF-8 のマニュアルを iconv で eucJP に変換して表
示するということをやっているみたいですよね。
データはコードセットによらず一つで済ませるというのは、それなりに魅力的
だと思います。コードセットを決め打ちするのは嫌ですけど、どこかにコード
セットを定義する場所を設けるなら、それもありのような気がします。
(やりすぎ?)
> 2. 言語ごと、文字コードごとにディレクトリを分けている
> => 同じ内容をコードを分けて、ja_JP.eucJP と ja_JP.SJIS と ja_JP.UTF-8へとか)
> Solaris とか HP-UX はこっち?(実機が手元に無いからわからん)
少なくとも Solaris 9 まではそうです。
> pkgsrc 的には、日本語 man は
> (1) どのOSでも同じディレクトリ名にする
> (2) 文字コードはEUC
> ってことでしょうか?
これは本当はまずいです。
ただ…
> ja が SJIS だったり UTF-8 だったりを期待しているOSを考えると、
> ja_JP.eucJP かなとも思います。
ja が SJIS な OS ってありましたっけ。
(HP-UX は ja ではなくて japanese が SJIS だったような)
しかも、幸いなことに今のところ pkgsrc は HP-UX をサポートしてないので、
気にしなくても良いという… (ひどい…)
たぶん ja の下に 日本語EUC 以外のマニュアルを置いているのは、Linux の
新しめのディストリビューションだけじゃないでしょうか。
しかも全てのディストリビューションが UTF-8 に切り替えたわけではなく、
まだ ja の下に 日本語EUC でマニュアルを置くディストリビューションも
残っていると思いますので、結局ディストリビューションによってバラバラ
の状態だと思います。
> あるいはja にしてそれぞれの OS が期待する文字コードに変換して入れるか。
本当は、"ja" 決め打ちでも "ja_JP.eucJP" 決め打ちでもまずく、
pkgsrc/mk/platform/ で、OS ごとに日本語用のディレクトリ名を定義し、
かつ Linux の場合はディストリビューションごとに適宜変換するって
しないといけないんでしょう。
> たとえば、converters/nkf では現在日本語 man はインストールしませんが、
> 配布物には含まれています。
> ただし、文字コードが iso-2022-jp のようです。
> もしこれをインストールするとしたら、どう扱うのがいいんでしょう?
UTF-8 を使う Linux 以外では、日本語EUCに変換してインストールするという
のが、ベストでしょうけど、これを本格的にやろうと思うと、pkgtools の
下に iconv を一式持ってくるというような事態になりかねないんですよね。
--
soda