[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: /usr/pkg/man/ja_JP.EUC



>>>>> On Sun, 10 Jul 2005 15:09:25 +0900, OBATA Akio <obata@lins.jp> said:

>> http://www.netbsd.org/cgi-bin/query-pr-single.pl?number=30687
>> 
>> この PR では、「ja_JP.EUC」の部分を「ja」に変えるように勧めましたが、
>> 「ja」ではなく「ja_JP.eucJP」とする案もあります。

> NetBSD の man は国際化されていないので、それはそれとして、

そうなんですよね。

> 国際化されている man の場合、

> 1. 言語ごとに文字コードが一つと思っている

こう仮定している OS はないんじゃないでしょうか。
言語ごとに文字コードが一つってのは、ヨーロッパでも成り立たない話なので。

>  => ja にman を全部放り込んでいる(eucJP だったり UTF-8だったりで統一)
>  linux man はこれでしょうか?(最近のだと UTF-8だったりする?)

最近の Fedora Core などは、マニュアルの実体は UTF-8 で置いてあり、
LANG=ja_JP.eucJP の場合は、まず
	man/ja_JP.eucJP/
を探してあればそのまま表示、なければ
	man/ja/
を探して、ここにある UTF-8 のマニュアルを iconv で eucJP に変換して表
示するということをやっているみたいですよね。

データはコードセットによらず一つで済ませるというのは、それなりに魅力的
だと思います。コードセットを決め打ちするのは嫌ですけど、どこかにコード
セットを定義する場所を設けるなら、それもありのような気がします。
(やりすぎ?)

> 2. 言語ごと、文字コードごとにディレクトリを分けている
>  => 同じ内容をコードを分けて、ja_JP.eucJP と ja_JP.SJIS と ja_JP.UTF-8へとか)
>  Solaris とか HP-UX はこっち?(実機が手元に無いからわからん)

少なくとも Solaris 9 まではそうです。

> pkgsrc 的には、日本語 man は
> (1) どのOSでも同じディレクトリ名にする
> (2) 文字コードはEUC
> ってことでしょうか?

これは本当はまずいです。
ただ…

> ja が SJIS だったり UTF-8 だったりを期待しているOSを考えると、
> ja_JP.eucJP かなとも思います。

ja が SJIS な OS ってありましたっけ。
(HP-UX は ja ではなくて japanese が SJIS だったような)
しかも、幸いなことに今のところ pkgsrc は HP-UX をサポートしてないので、
気にしなくても良いという… (ひどい…)

たぶん ja の下に 日本語EUC 以外のマニュアルを置いているのは、Linux の
新しめのディストリビューションだけじゃないでしょうか。
しかも全てのディストリビューションが UTF-8 に切り替えたわけではなく、
まだ ja の下に 日本語EUC でマニュアルを置くディストリビューションも
残っていると思いますので、結局ディストリビューションによってバラバラ
の状態だと思います。

> あるいはja にしてそれぞれの OS が期待する文字コードに変換して入れるか。

本当は、"ja" 決め打ちでも "ja_JP.eucJP" 決め打ちでもまずく、
pkgsrc/mk/platform/ で、OS ごとに日本語用のディレクトリ名を定義し、
かつ Linux の場合はディストリビューションごとに適宜変換するって
しないといけないんでしょう。

> たとえば、converters/nkf では現在日本語 man はインストールしませんが、
> 配布物には含まれています。
> ただし、文字コードが iso-2022-jp のようです。
> もしこれをインストールするとしたら、どう扱うのがいいんでしょう?

UTF-8 を使う Linux 以外では、日本語EUCに変換してインストールするという
のが、ベストでしょうけど、これを本格的にやろうと思うと、pkgtools の
下に iconv を一式持ってくるというような事態になりかねないんですよね。
--
soda