にせねこメモ

はてなダイアリーがUTF-8じゃないので移ってきました。

Unicode

ZawgyiとUnicode: ミャンマーの文字の電子化について

まえがき ミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか?それは、Unicodeという文字コードの標準があ…

Twitterハッシュタグの仕様について

まえがき Twitterに"#᥋ᵍᶜₒ𝖛ịⅆ"というハッシュタグが流れているのを見た。内部的には"#5GCovid"と等しいようだった。タグの指す内容は置くとして、これが同一視されてるのは奇妙な気もした。 これは、他にも同様のハッシュタグを作れるのでは?と思って、変換…

Twitterで旧字が化ける? CJK互換漢字という罠

概要 Twitterに投稿するとCJK互換漢字が対応する統合漢字に化けるので、投稿時に化けないStandard Variant形式と互換漢字とを相互変換するページを作成した: 互換漢字-異体字セレクタ コンバータ はじめに Twitterで「社」(U+FA4C)、「羽」(U+FA1E)などの一…

平成の次の新元号の文字列を取得するコード

※これはネタですが、エイプリルフールとは無関係です。もしや、U+32FFをNFKDで分解することによって、今でも「新元号の文字列を取得する」コードが書ける……!? (Unicode正規化用のライブラリを更新すれば正しい結果が帰る様になる…はず)— にせねこ (@nixeneko…

現在のUnicodeモンゴル文字の問題点と最近の動き

モンゴル文字は、主にモンゴル語表記のための文字*1である。縦書き専用の文字であり、日本語の場合とは反対に左から右へと行を進める。また、アラビア文字のように続け書きされ、文字が語のどの位置に来るかによって形が変わる。 モンゴル文字は現在も中国の…

Unicodeモンゴル文字フォント一覧

モンゴル文字Unicodeフォントに関する情報が見つけづらいので、リストを作ってまとめておく。暫定公開。抜けや間違い等ありましたら情報提供お願いいたします。 (2018-03-28 追記) 現在のUnicodeモンゴル文字の問題点と最近の動き - にせねこメモ ↑この記事…

変な文字化け

奇妙な文字化けがあった(ことを思い出した)のでメモしておく。きっかけはこのツイート。twitpicの画像をご覧いただきたい。何なのこいつ何を入れさせるつもりなの http://t.co/dYFVynv— シェゴ (@syego) September 3, 2011twitter.com「悰しい悰惴が倩瀨僯能…

モンゴル文字簡易翻字ブックマークレット

nixeneko.hatenablog.com これ、色々応用できるのでは、ということで、Unicodeのモンゴル文字をラテン文字に1:1で変換して表示するというものを作ってみた。 ブラウザのブックマークレットとして動くJavascriptプログラムです。文字の対応に変なところがあっ…

ブラウザ上で文字列のUnicode Code Pointを調べる

時々文字列を見てその素性を調べたいことがある。とりあえず文字のUnicodeコードポイントが分かれば色々と調べることもできるのだが、案外そういったものが見つからず不便だった(探し方が悪いのかもしれない)。 ブラウザでできたらいいなあと思ったのでJavas…

モンゴル文字とUnicode

調べたのでまとめる。 モンゴル文字は主にモンゴル語を表記するための文字であり、中国内の内モンゴル自治区で使われる。一方でモンゴル国内では一般にキリル文字表記が使われている。ここではモンゴル語表記の場合についてを書き、モンゴル文字から派生した…

マクロン付きのギリシア文字の母音にアクセントや気息記号を付けて表示する

古典ギリシャ語の初級文法では α, ι, υ の長母音を示すためにマクロンを付け(ᾱ, ῑ, ῡ)、さらにこれに気息記号やアクセント記号が付けられる場合がある。しかし、多くの環境では入力・表示ができない。技術的に可能ではあるのだが、対応しているものはほとん…