「あの人も読んでる」略して「も読」。さまざまな寄稿者が最近気になった情報や話題をシェアする企画です。他のテックな人たちがどんな情報を追っているのか、ちょっと覗いてみませんか?
Unicodeにおける合字について
Linus Torvalds Expresses His Hatred For Case-Insensitive File-Systems
LinuxはMacOSと異なり、文字を物理的に区別する特徴があります。例えば、MacOSのファイルシステムは大文字と小文字を区別しませんが、Linuxは区別します。
Torvalds氏が述べるように文字コードの扱いは、バグやセキュリティの問題を引き起こす可能性もあるため重要です。
今回触れられていたのは、Unicodeにおける合字についてです。合字とは、2つ以上のCode Pointを組み合わせて1つの文字として扱うことを指します。
身近な例としては、日本語の平仮名や片仮名に濁点や半濁点を付けるケースがあります。例えば、「か」と「゛」を組み合わせて「が」を作ることができます。また、最近だと絵文字の合字もあります。