Koning's Weblog

流浪の末のBlogでございます。コンピュータ、言語、歴史、等々。なんでもあり。

コメントSPAMの下手人は・・・

 このところ、しつこく出会い系だのへ誘導しようというアホなコメントSPAMが続いたんで軒並みブラックリストにいれてたんだけど、ふと、ブラックリストを見て笑いましたよ(笑)

ntoska233060.oska.nt.ftth4.ppp.infoweb.ne.jp
ntoska338223.oska.nt.ftth4.ppp.infoweb.ne.jp
ntoska509091.oska.nt.ftth4.ppp.infoweb.ne.jp
ntt6-ppp801.osaka.sannet.ne.jp
ntoska291095.oska.nt.ftth4.ppp.infoweb.ne.jp
ntoska545190.oska.nt.ftth4.ppp.infoweb.ne.jp
p9212fa.osaknt01.ap.so-net.ne.jp
p925185.osaknt01.ap.so-net.ne.jp
p925639.osaknt01.ap.so-net.ne.jp
p67a476.osaknt01.ap.so-net.ne.jp

 どう見ても同一人物(笑)。ご丁寧にpppアクセスで毎回アカウントga違うってのもまた(笑)。
 
 次来たら京都府警とか各ISPに通報すべきかな?大阪からみたいだし、大阪方面からのIP全部遮断!とかもできるもんならしちゃいたいかもしれない(ヲイ。

訃報:広川太一郎さん

 巨星墜つ。という言葉があるとすればまさにこの人のためにあったんじゃないでしょーか?
 
 広川太一郎氏の訃報が飛び込んできました。
 
 モンティパイソンとか東京12チャンネルあたりでやってた吹き替えが秀逸でしたよね。と。
 007のロジャームーアなんかもこの方なんだよね。
 
 〜とかなんとか言っちゃったりなんかしちゃって とかこういう無駄なアドリブがこの人だとOKという。
 どっかで誰かが書いてたけれど、つまらないものを面白くしちゃうという神業の持ち主だったと思います。
 
 というか、何かここ数日でいろいろな意味で影響を受けた人たちがこの世を去ってゆく知らせにちょっと辛い気分になってきてしまいました。
 
 は〜〜。

 ご冥福をお祈りします。

Yr Wyddor

 ウェールズ語のアルファベットはウェールズ語で"Yr Wyddor"といい、辞書にリストアップされるのは29文字。英語と同じくローマ字(ラテン文字)を使う。
 と、ここまでは簡単なんだけど、ここからが厄介。
 まず何文字あるか?という事だけど、Gareth KingのOxford The Pocket Modern Welsh Dictionary(以下PMW)では29文字。wikipedia英語版では28文字。この違いは何か?というと「J」を含めるかどうか。
 伝統的な正書法ではJは英語からの借用ごにしか使わないけれど、現代ウェールズ語ではJを積極的に使う。例えば「日本」は伝統綴りでは「Siapan」だが、英語経由の「Japan」が多く使われている(BBC Cymru のニュースサイトでもJapanを使うし、前述のPMWでも巻末の国名リストにはJapanしか出てこない。一般に文字そのものの名前は英語と同じということで教えられる事が多い(Teach Yourselfシリーズから出ているwelsh, welsh dictionary, welsh grammarや前述のPMWには文字のリストはあっても読み方は出てこない。
 
 ただ、BBC Radio Cymruの人気番組C2のPodcastを聞くとわかるのだけど、タイトルコールで「エク ダイ(C2をウェールズ語で読むとこうなる)ラディオ カムリ」と言うので、文字の名前もウェールズ語の物があることを覚えておくと何かと便利。
 
 Sir. John Morris Jonesの「A Welsh Grammar Historical and Comparative (1913)」や水谷宏の「毎日ウェールズ語を話そう」にはこれらの文字の読み方が出てくるので、参考までにリストアップ。
 
 a, b, c, ch, d, dd, e, f, ff, g, ng, h, i, j, l, ll, m, n, o, p, ph, r, rh, s, t, th, u, w, y
 ウェールズ語による夫々の呼び名と、無理矢理なカタカナ表記(別の音も一緒くた)で並べると:
 â「アー」, bî「ビー」,ec「エク」, ech「エフ」, dî「ディー」, edd「エズ」, ê「エー」, ef「エヴ」, eff「エフ」, eg「エグ」, eng「エング」, âets「アエツ」, î「イー」jê「ジェー」, el「エル」, ell「エス」, em「エム」, en「エン」, ô「オー」, pî「ピー」, yff (ffî)「アフ(フィー)」, er「エル」rhî「リー」, es「エス」, tî「ティー」, eth「エス」, û「イー」, ŵ「ウー」, ŷ「アー」となる。
 
 このchとかddとかffは2文字なのだけど、1文字として扱われるので、fi (分解するとf-i)はffa(ff-a)より前に来る(英語なら迷わずfの次の文字がfとiなのでffaが先という)ことになるので、辞書を引くときは注意。

何故Unicodeを使わないのだろう?

 何故Unicodeを使わないのだろう?
 日本語の場合は言わずと知れたSJIS等のある意味決めうちの文字コードの方がメモリも少なくて済むだとか、過去との互換性というあたりが主な理由になるのだろう。
 これがコプト語やシリア語(アラビア語ではなく、アラム語の末裔で、東のアラム語が発展したものと考えられている)等Unicodeのバージョンが若いころには無かった(あるいはコプト語のようにギリシア語といっしょくた)という物では単純に無いから使えないという事が続いて来た。
 
 Unicodeのバージョンが5.0を超えるようになると、こうした言語への対応もしっかりとしてきたので、いい加減Unicode使ってよと考えるのだが、残念ながら事はそうは簡単ではないらしい。
 
 まずこうした新たに登録された言語の文字が置かれた場所がUTF-8でE2B280とかとんでもない場所にあったりするという事。
 古いOSで対応できない物がある事(場合によってはCuneiformCompositeのように𒀀F0928080とか、BMPどころかSMPにあるという物すらある)。
 次いで文字の入力に使えるInputMethodが無い事。コプト語やシリア語のようなアルファベットに類する文字を使う言語の場合、フォントを変える事でその言語を表示させる事が伝統的に行われているので今更それを変更する程のメリットがないと考えられる主要因になっていそうだ。
 これと同様にフォントの問題もある。伝統的なローマ字置換形では手頃に入手可能なフォント作成ツールですぐに文字が作れるが、Unicodeにきちんと対応させるとなると、こうした遠い場所のコードの文字を作るのは厄介になる。
 
 結局1つずつ解決されていかないとUnicodeで楽ができるという世界は遠い。
 
 というか、FC2の入力がどーやってもEUC_JPから離れられないのはデータベースの設定かな?最終的にBlogspotしかお手軽マルチリンガルBlogはないってことかな?(もちろん自前でmovable typeとか使える所は別として)。

訃報:Gary Gygax

 毎コミュのCocoaネタの為にRSSを受信してたんだけど、あすこは全記事ごっちゃのRSSしかなくて、不便してたんだよね。でもそれが逆にこういうニュースを気づかずに終わらないで済む事になるとは。
 「Dungeons & Dragons」の作者、Gary Gygax氏が死去
 RPG(日本では胡散臭い連中によってわざわざTableなんて枕詞がついてTRPGなんて言うけど)の、現在の形を生み出した男。Gary Gygax氏が死去。しかも病死で、死亡寸前?までGMやってたっつーじゃないですか。なんというか。凄い人だよねぇ。

 この人も大成功をおさめただけに、功罪あげればどちらもキリがないんですが(笑)。

 ご冥福をお祈りいたします。というより、この人のことだから、アンデッドになってでてきたり、エターナルチャンピオンな何かになってそうな感じですけどね(汗。

Dydd Gŵyr Ddewi

Dathlu Dydd Gŵyr Dewi!

Dydd Gŵyr Ddewi

Dathlu Dydd Gŵyr Dewi!