2025-10-01から1ヶ月間の記事一覧
課題 ソートの順番は言語ごとに異なる。 そのため、様々な言語を扱う際は、言語(=ロケール)を指定してソートをしたい*1。 解決手法 PyICUを利用する。これはICU C++ライブラリのPythonラッパーである。 利点 実績のあるUnicodeライブラリであるICUを利用…
オンライン辞書などのタイ語学習サービスを提供していたthai-language.comが繋がらなくなっているいた。 http://www.thai-language.com/ HTTPS対応してなくてHTTPで接続する必要があったが、少し前までは見えていた。Internet Archiveを見ると、最後に9月27…
いくつかコミケとかで文字関係の解説漫画をかいて出したりしたのだが、今後のために反省点を書いていく。なお、この反省点を生かしたからといっていいものができるとは限らない。 ある程度のまとまりで話を区切るべき 40ページ近くだらだら書いてたやつがす…
以前このブログでUnicodeモンゴル文字の問題点についてまとめたが、それに関しての更新となる文書が出たのでそれについて書く。 L2/25-140 2025-04-23に、Unicode技術委員会文書レジストリ(UTC Document Registry)に、Unicodeモンゴル文字に関しての経過報告…