Unicode

結合文字

将来にわたって鬼車がUnicode結合文字を1文字として 扱うことができない(するつもりがない)というのは、 いちユーザとして悲しい宣言です。そのような宣言をした記憶はまったくありませんが? 反対に、サポートすると宣言した覚えもありません。 Unicode結合…

BEとLE (2)

以前読んだ本の中で、Unicodeは情報交換用だけではなく、内部コードとして使用されることも考慮しているということが書いてあった気がする。しかし、内部処理のencodingは処理の都合に合わせて自由に決めれば良いだけで、規格で与える必要は全くないと思う。…

BEとLE (1)

以前から疑問に思っているのだが、何故Unicodeのencoding schemeは、big endianとlittle endianの両方をサポートしているのだろうか?片方だけで十分ではないのか? どちらか決めにくい点を、敢て決めてしまうのが規格の役割ではないだろうか?

リトアニア語

SpecialCasing.txtにはリトアニア語固有のcase変換が載っているのに、CaseFolding.txtには載っていない。トルコ語のcase foldだけが載っている。これは何故だろう?ロケール依存で、複数文字にfoldされるのは複雑過ぎるので、省かれたのだろうか?