[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: /usr/pkg/man/ja_JP.EUC



>>>>> On Tue, 12 Jul 2005 11:36:59 +0900, OBATA Akio <obata@lins.jp> said:

>> データはコードセットによらず一つで済ませるというのは、それなりに魅力的
>> だと思います。コードセットを決め打ちするのは嫌ですけど、どこかにコード
>> セットを定義する場所を設けるなら、それもありのような気がします。
>> (やりすぎ?)

> そうですね。
> コードセットの違いしかないのだから、別に置くのも無駄のような。
> ただし、マニュアルにそのコードにしか含まれない特殊文字とかが
> あれば別ですが。

はい。なので、基本は、MANPATH によって探し、/usr/pkg/man/${LANG}/ に
現在利用しているコードセットのマニュアルがそこにない場合のみ、
/usr/pkg/man/%L/ にあるマニュアルからコード変換するというやり方が
いいんじゃないでしょうか。
たぶん Linux は、そうやっているんだと思います。

> HP-UX も11.0からHP-UX特有の変な名前は廃止されたようです。
> http://docs.hp.com/ja/5991-1165/ch04s01.html
> http://docs.hp.com/ja/5187-4196/ch01s07.html

おお、普通の名前になってますねえ。
昔は japan とか Japanese-EUC とかいろいろ名称があったので、
HP-UX の名前も、それほど変ではなかったと思います。

> AIXとかInterixとかはどうでしょうか?
> http://publib16.boulder.ibm.com/doc_link/Ja_JP/a_doc_lib/aixprggd/nlsgdrf/supportedlanguages.htm#japaneselang
> によると、AIXでは
> 	ja_JP:	EUC
> 	JA_JP:	UTF-8
> 	Ja_JP:	SJIS
> みたいですね・・・jaは・・・?
> 昔はSJISだったような記憶がかすかにあるのですが、自信がありません。

手元のメモだと、少なくとも 1995 年には ja_JP と Ja_JP の両方を
サポートしていたようです。
大文字小文字でコードセットの違いを表現するのは変だと昔から思ってた
んですが、そこは相変わらずなんですねえ。全部大文字にすると UTF-8 だと
いうポリシーはあるのかな…?

> 結局、
>  1. 日本語 man はパッケージでは euc-jp で用意されているのがほとんど。
>  2. man/ja のファイルは euc-jp で置いてないOSもある
>  3. euc-jp を置く場所は man/ja_JP.eucJP ・・・とは言い切れない
>  4. pkgsrcでコードを変換してインストールするのは荷が重い
> ということで、
>  (1) パッケージの man をコード変換しないでインストールする
>  (2) まずは、euc-jp だけでも
> ってところでしょうか?

はい。あの PR は、そういうつもりで出しました。
が、おばたさんのメールを読んで、ちょっと考え直しました。

> 3.のために置き換えの表は必要かもしれない(MAN_LOCALE.ja_JP.eucJP=ja とか)。

これがいいんじゃないでしょうか。
あと、マニュアルをインストールするディレクトリの名称は、locale 名とは
限らない (%L すなわち、locale 名のうちの言語部分だけが使われることがあ
る。例えば RedHat-8 では、ディレクトリ名は「ja/」なんですが、locale 名
としては「ja」は有効な名称ではありません) ので、_LOCALE という名称には
しない方が誤解を招かなくて良いと思います。ですから
	MAN_DIR.ja_JP.eucJP=ja
あるいは
	MAN_SUBDIR.ja_JP.eucJP=ja
とするのがいいような気がしますがどうでしょう。

> あるいはeuc-jpなmanは全部 man/ja_JP.eucJP に入れちゃって、
> 必要なOSは ja=>ja_JP.eucJP なシンボリックリンクを張っておくとか。

シンボリックリンクは美しくないので、避けることができるなら避けたい
ように思います。
--
soda