[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ja-gawk merged into gawk (Re: fonts/ja-shinonome configure failedon 1.6ZK)



おばた ナノです。

古い話ですが、

<20050104.151737.09116036.kei@ba2.so-net.ne.jp> の、
   "ja-gawk merged into gawk (Re: fonts/ja-shinonome configure failedon 1.6ZK)" において、
   "SUNAGAWA Keiki <kei@ba2.so-net.ne.jp>"さんは書きました:

> ja-gawkのパッチを配布していたページがなくなっていました。調
> べたところ、マルチバイト対応はgawk本体に取り込まれたようです。

現在はこちらで3.0.6用のパッチが配布されているようです。
http://www.hinadori.atnifty.com/~wills/program.html
3.0.6用の gawkmb115.diff.gz が書かれていますが、
3.0.4用の gawkmb112.diff.gz も同じところに置かれているようです。

> lang/gawkを普通にmakeしてもマルチバイト対応は有効になってい
> るようですが、どなたか確認していただけませんか。OKなら
> lang/ja-gawkを消そうと思います。

とても単純な例ですが、
 /^[私,僕,A]は/ {print }
なんてのを実行させて、
 私は
 僕は
 Aは
ってのをLANG=ja_JP.eucJPで食わせたら、ちゃんとマッチして表示されるようです。
日本語の正規表現で、どこが肝なのかわかっていないので、
これだけでは不十分かもしれませんが。

現在の gawk がロケールに従って処理をするのに対し、
ja-gawk の方は、コンパイル時に指定されているデフォルトのコードと思って処理し、
コマンドラインでも処理する文字コードを指定できるという違いがありますね。
その他にも、何か他の拡張があるのかもしれませんが、それが問題にならなければ
削除してもいいかな、と思います。

-- 
お役に立てない(^^;
OBATA Akio / obata@lins.jp
せかいは ひろがる ちきゅーは まわる。