LINEで使うと相手のクライアントが落ちるということで、子どもたちの間で有名なユニコことUnicode。
それは別にウィルスでも攻撃手法でもなく、ただの文字コード。
文字コードというのは、コンピュータは内部では数値のみで構成されているけれども
言葉を表現するにはどうするかというと、
この数値はこの文字というように割り当てている。
これが文字コード。
コンピュータはアメリカで進化したため、アルファベットが年頭に置かれているけれども、
日本ではひらがなカタカナ漢字、韓国ではハングル、ロシアではキリル文字、
世界には様々な言葉があって、それらを様々な規格で表現していては非効率なので
Unicodeでは世界中の文字をUnicodeという規格で表現できるようにしている。
日本語はshift-jisが主流だったが段々とunicode(utf-8)に変わってきている。
世界中の文字が対象
unicodeはとにかくたくさん文字がある。
マイナーな漢字とかそのレベルじゃない。
マイナーな言語だ。
1.ヒエログリフ
まずは、まあそれほどマイナーでもないが、
現在では使われていない古代エジプトの絵文字
ロゼッタストーンによって解読がされた古代の文字
使っている人はいないけれど…何かの古文書を印刷するには役に立ちそうだ。
Unicodeの範囲 U+13000-U+1342F
2.梵字
サンスクリット語の文字。
仏壇に書かれているあのクニャッとした文字でお馴染みの梵字。
これは仏教では生き続けている文字だから、仏教徒には嬉しいものなのかもしれない。
Unicodeの範囲 U+11580–U+115FF
3.ルーン文字
ファンタジー好きにはお馴染み、ゲルマン人がはるか昔使っていた言葉。
時期的には2世紀ごろから使われていたらしい。
Unicode範囲は U+16A0-U+16FF
4.ウガリット文字
紀元前1500年頃
今で言うシリア付近のウガリットという国で使われていた言葉を表記するための文字。
こんな昔の言葉を解読した人もいるそうだが、それをUnicodeに入れようとする人もいる。
5.線文字B
紀元前1500年頃の地中海で使われていた文字。
長らくどのような言語の文字なのか不明だったが、古代のギリシャ語を表記するための文字だと解明された。
言葉が分かった今でも、こんな淡白な名前になっているけれど
これはこれでかっこいい。
範囲 U+10000–U+1007F syllabic signs
U+10080–U+100FF logograms
BがあるならAもあるのか?という疑問もあるだろう。
もちろん線文字Aはあるが、線文字Bとはちがい今だ解読されていないらしい。
6.楔形文字
紀元前三千年ごろから三千年に渡りシュメール人らによって使われていた文字。
シュメール人とはチグリス ユーフラテスの間で栄えたいわゆるメソポタミア文明の中心になった文明。
三千年とはとても長い間使われていたというのは驚きだ。
粘土板の上にペタペタとヘラで押し当てるように書いていたそうだが、
当時その年度に書いていた人も、数千年後にシリコンと磁性体の円盤の中で数値化された自分たちの言葉が使われているとは思っても見るまい
範囲 U+12000–U+1236E (シュメール=アッカド語楔形文字)
U+12400–U+12473 (楔形文字数字)
考古学や歴史学でしか扱わないような文字ですら、割り当てられているUnicode
単なる文字コードとは言えないこの徹底ぶり
古代言語と古代文明好き+コンピュータ好きにはたまらないね。
もっとちゃんとUnicodeを調べよう。本当に
漢字についてもUnicodeは面白いトピックスはいっぱいで、同じ意味でも形が違う漢字とか
もう楽しそうな事いっぱいだ。
このように、コンピュータは理系とか、言語は文系とかそういう単純なものではなく
何でもかんでも相互に関係しあっているし、関係し合えるってことですな。
おまけ
いくつか割当の提案がされているのがあるうちのおもしろいの
テングワール
指輪物語に登場する文字
作者のトールキンは言語学者なため、シンダール語など本当の言語のようにデザインした言葉を作っている。
格変化や動詞の変化なども、古代ケルト語をヒントに作っていって、時代と共にどう変わってどのように派生したかも設定されているそうだ。
最大の設定厨なわけだけれども、これに使われていたテングワールという文字もなんとUnicode割当提案中だそうで、
いよいよ本当の言語のようだ。
実際人工言語だけれども実用に足りるデザインだそうだ。