Koning's Weblog

流浪の末のBlogでございます。コンピュータ、言語、歴史、等々。なんでもあり。

何故Unicodeを使わないのだろう?

 何故Unicodeを使わないのだろう?
 日本語の場合は言わずと知れたSJIS等のある意味決めうちの文字コードの方がメモリも少なくて済むだとか、過去との互換性というあたりが主な理由になるのだろう。
 これがコプト語やシリア語(アラビア語ではなく、アラム語の末裔で、東のアラム語が発展したものと考えられている)等Unicodeのバージョンが若いころには無かった(あるいはコプト語のようにギリシア語といっしょくた)という物では単純に無いから使えないという事が続いて来た。
 
 Unicodeのバージョンが5.0を超えるようになると、こうした言語への対応もしっかりとしてきたので、いい加減Unicode使ってよと考えるのだが、残念ながら事はそうは簡単ではないらしい。
 
 まずこうした新たに登録された言語の文字が置かれた場所がUTF-8でE2B280とかとんでもない場所にあったりするという事。
 古いOSで対応できない物がある事(場合によってはCuneiformCompositeのように𒀀F0928080とか、BMPどころかSMPにあるという物すらある)。
 次いで文字の入力に使えるInputMethodが無い事。コプト語やシリア語のようなアルファベットに類する文字を使う言語の場合、フォントを変える事でその言語を表示させる事が伝統的に行われているので今更それを変更する程のメリットがないと考えられる主要因になっていそうだ。
 これと同様にフォントの問題もある。伝統的なローマ字置換形では手頃に入手可能なフォント作成ツールですぐに文字が作れるが、Unicodeにきちんと対応させるとなると、こうした遠い場所のコードの文字を作るのは厄介になる。
 
 結局1つずつ解決されていかないとUnicodeで楽ができるという世界は遠い。
 
 というか、FC2の入力がどーやってもEUC_JPから離れられないのはデータベースの設定かな?最終的にBlogspotしかお手軽マルチリンガルBlogはないってことかな?(もちろん自前でmovable typeとか使える所は別として)。

コメント

前ふりとオチの落差

おひさしぶりです。

最後にFC2ブログに言及するところに笑ってしまいました。
身近な話じゃないですか。

うちのサイトの文字コードUTF-8ですが、Windows上のエディタ(メモ帳も含む)で、うまく開けない場合があって、なんだかセツナイデス。

  • 2008/05/06(火) 18:13:53 |
  • URL |
  • mishimax #VWFaYlLU
  • [ 編集 ]

ども、お久しぶりです。

Windowsだとemacs系のエディタしかないんですかねぇ?
日本語だけなら秀丸あたりでMeiryoなどを指定する手がありそうですが。
というか今時のVistaとかのエディタだと行けるんでしょうかねぇ?XPはおろか98SEでも重いエミュ環境なんで試すわけにもいきませんが(汗。

というか、すっかり放置状態ですんませんです。mishimaxさんとこは順調に続いてるようでなによりっす。

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバックURLはこちら
http://koning.blog69.fc2.com/tb.php/37-d7f3dbdb
この記事にトラックバックする(FC2ブログユーザー)