にせねこメモ

はてなダイアリーがUTF-8じゃないので移ってきました。

モンゴル文字とUnicode

調べたのでまとめる。


モンゴル文字は主にモンゴル語を表記するための文字であり、中国内の内モンゴル自治区で使われる。一方でモンゴル国内では一般にキリル文字表記が使われている。

ここではモンゴル語表記の場合についてを書き、モンゴル文字から派生したトド文字、シベ文字、満州文字等については省略する。

特徴

  • 左縦書き。つまり縦書き(上→下)で、かつ行は左→右へ書く(日本語と逆)
  • 語頭形(及び独立形)・語中形・語末形をもち、語のどの位置に書かれるかによって文字の形が異なる。また、それ以外にも特別な別形を持つ文字がある(10種持つ文字もあるらしい)。
  • 単語は空白で区切られるが、単語の中にも空白(字空け)が現れうる。
  • 宗教的なテキストのために、サンスクリット語チベット語表記用の文字が追加されている。
  • チベット数字を元にした独自の数字をもつ。縦書き中でも左→右に横書きされるらしい*1。最近は回転させて文の流れる向きに合わせることも多いらしい。
  • 独自のperiod, comma , colon をもつ。また点4つの記号で章末を表す。他にも、BIRGA は一節(passage)の始まりやフォリオの表面(the recto side of a folio)の始まりを示すものらしい。

Unicode

Unicode 3.0 で追加された。コードブロックは U+1800-U+18AF 。

コード表は次を参照。

文字のみが符号化されており、それの語の位置によって変化した形(“presentation forms”)は収録されていない。

о(o) と у(u) はどの位置でも同じ形であるにもかかわらず別々のコードポイントが与えられている。 ө(ö) と ү(ü) についても同様。


特殊な formatting characters が表記に使用される。

  • U+180B MONGOLIAN FREE VARIATION SELECTOR ONE
  • U+180C MONGOLIAN FREE VARIATION SELECTOR TWO
  • U+180D MONGOLIAN FREE VARIATION SELECTOR THREE
    • FVSとも。 contextual shaping of letters に作用する。前につくグリフの形を変える。視覚表現なし。
    • Unicode Character Database の Standardized Variants に有効なFVS付きの文字のリストがある。
  • U+180E MONGOLIAN VOWEL SEPARATOR
    • MVS とも。語末の a e の直前に挿入され、前後の文字を特別な形に変える。狭い空白をもつ。
  • U+202F NARROW NO-BREAK SPACE
    • 接尾辞がつけられる際に、単語本体と小さな空白で区切られる場合に挿入され、空白を内に含む語を構成する。前後の文字の glyph 選択に影響する。
  • U+200C ZERO WIDTH NON-JOINER (ZWNJ)
  • U+200D ZERO WIDTH JOINER (ZWJ)
    • 独立/語頭/語中/語末形を指定して表示するために使用可能である。
    • ZWJの直前の文字がモンゴル文字でないと(少くともWindowsでは)レイアウトエンジンがうまく動かないようであり、Wikipediaのページの表においては語中・語末形はその前に FVS1 を挿入することで表示していた。
独立 語頭 語中 語末
実際の表示 ᠠ‍᠋‍ᠠ‍ ᠋‍ᠠ
Unicode 1820 1820 200D 180B 200D 1820 200D 180B 200D 1820
説明 A A ZWJ FVS1 ZWJ A ZWJ FVS1 ZWJ A
  • 語頭-語中-語末形の表示には、 U+180A MONGOLIAN NIRUGU ( ᠊ ) を使うこともできる。アラビア文字で Kashida を使って表示するのに近いか。複合語の結合用のハイフンとしてとも使えるらしい。
独立 語頭 語中 語末
実際の表示 ᠠ᠊᠊ᠠ᠊ ᠊ᠠ
Unicode 1820 1820 180A 180A 1820 180A 180A 1820
説明 A A NIRUGU NIRUGU A ZWJ NIRUGU A

Presentation Forms

次のページを元に作成

ただし、2016年2月18日現在 StandardizedVariants.html には問題があるため、改善案が議論されている。


独立/語頭/語中/語末形のそれぞれの形と、FVSを適用した Standardized Variants である。 Unicodeの Standardized Variants に定義されていない欄についてはグレーアウトしている。モンゴル語以外のものは省いた。フォントの対応との間に一部ずれがある。これは Standardized Variants 側が不適切な状態となっているためで、改訂作業が行われている。

Vowels
LetterUnicodeIsolateInitialMedialFinal
A1820ᠠ‍᠋‍ᠠ‍᠋‍ᠠ
1820 180Bᠠ᠋᠋‍ᠠ᠋‍᠋‍ᠠ᠋
1820 180C᠋‍ᠠ᠌‍‍
E1821ᠡ‍᠋‍ᠡ‍᠋‍ᠡ
1821 180Bᠡ᠋‍‍᠋‍ᠡ᠋
I1822ᠢ‍᠋‍ᠢ‍᠋‍ᠢ
1822 180B᠋‍‍ᠢ᠋‍‍
O1823ᠣ‍᠋‍ᠣ‍᠋‍ᠣ
1823 180B᠋‍ᠣ᠋‍᠋‍ᠣ᠋
U1824ᠤ‍᠋‍ᠤ‍‍᠋‍ᠤ
1824 180Bᠤ᠋
OE1825ᠥ‍᠋‍ᠥ‍᠋‍ᠥ
1825 180B᠋‍ᠥ᠋‍᠋‍ᠥ᠋
1825 180C᠋‍ᠥ᠌‍
UE1826ᠦ‍᠋‍ᠦ‍᠋‍ᠦ
1826 180Bᠦ᠋᠋‍ᠦ᠋‍᠋‍ᠦ᠋
1826 180C᠋‍ᠦ᠌‍
EE1827ᠧ‍᠋‍ᠧ‍᠋‍ᠧ
備考

  • EEは外来語の表記に用いる。Eと異なりAと区別することができる。
  • O[FVS1]の語末形᠋‍ᠣ᠋は外来語に用いる。

Consonants
LetterUnicodeIsolateInitialMedialFinal
N1828ᠨ‍᠋‍ᠨ‍᠋‍ᠨ
1828 180Bᠨ᠋‍᠋‍ᠨ᠋‍
1828 180C᠋‍ᠨ᠌‍
1828 180D᠋‍ᠨ᠍‍
NG1829ᠩ‍᠋‍ᠩ‍᠋‍ᠩ
B182Aᠪ‍᠋‍ᠪ‍᠋‍ᠪ
182A 180B᠋‍ᠪ᠋
P182Bᠫ‍᠋‍ᠫ‍᠋‍ᠫ
Q182Cᠬ‍᠋‍ᠬ‍᠋‍ᠬ
182C 180Bᠬ᠋ᠬ᠋‍᠋‍ᠬ᠋‍᠋‍ᠬ᠋
182C 180C᠋‍ᠬ᠌‍
182C 180D᠋‍ᠬ᠍‍
G182Dᠭ‍᠋‍ᠭ‍᠋‍ᠭ
182D 180Bᠭ᠋ᠭ᠋‍᠋‍ᠭ᠋‍᠋‍ᠭ᠋
182D 180C᠋‍ᠭ᠌‍᠋‍ᠭ᠌
182D 180D᠋‍ᠭ᠍‍
M182Eᠮ‍᠋‍ᠮ‍᠋‍ᠮ
L182Fᠯ‍᠋‍ᠯ‍᠋‍ᠯ
S1830ᠰ‍᠋‍ᠰ‍᠋‍ᠰ
1830 180B᠋‍ᠰ᠋
1830 180C᠋‍ᠰ᠌
SH1831ᠱ‍᠋‍ᠱ‍᠋‍ᠱ
T1832ᠲ‍᠋‍ᠲ‍᠋‍ᠲ
1832 180B᠋‍ᠲ᠋‍
D1833ᠳ‍᠋‍ᠳ‍᠋‍ᠳ
1832 180Bᠳ᠋‍᠋‍ᠳ᠋‍᠋‍ᠳ᠋
CH1834ᠴ‍᠋‍ᠴ‍᠋‍ᠴ
J1835ᠵ‍᠋‍ᠵ‍᠋‍ᠵ
1835 180B᠋‍ᠵ᠋‍
Y1836ᠶ‍᠋‍ᠶ‍᠋‍ᠶ
1836 180Bᠶ᠋‍᠋‍ᠶ᠋‍
1836 180C᠋‍ᠶ᠌‍
R1837ᠷ‍᠋‍ᠷ‍᠋‍ᠷ
W1838ᠸ‍᠋‍ᠸ‍᠋‍ᠸ
1838 180B᠋‍ᠸ᠋
F1839ᠹ‍᠋‍ᠹ‍᠋‍ᠹ
K183Aᠺ‍᠋‍ᠺ‍᠋‍ᠺ
KH183Bᠻ‍᠋‍ᠻ‍᠋‍ᠻ
TS183Cᠼ‍᠋‍ᠼ‍᠋‍ᠼ
Z183Dᠽ‍᠋‍ᠽ‍᠋‍ᠽ
HA183Eᠾ‍᠋‍ᠾ‍᠋‍ᠾ
ZR183Fᠿ‍᠋‍ᠿ‍᠋‍ᠿ
LH1840ᡀ‍᠋‍ᡀ‍᠋‍ᡀ
ZHI1841ᡁ‍᠋‍ᡁ‍᠋‍ᡁ
CHI1842ᡂ‍᠋‍ᡂ‍᠋‍ᡂ

この他にいくつか、子音と母音との特別な合字形をもつものがある。
例として、

Ligature forms
LetterUnicodeIsolateInitialMedialFinal
BO(BUも同形)182A 1823ᠪᠣᠪᠣ‍᠋‍ᠪᠣ‍᠋‍ᠪᠣ
BÖ(BÜも同形)182A 1825ᠪᠥᠪᠥ‍᠋‍ᠪᠥ‍᠋‍ᠪᠥ
PO(PUも同形)182B 1823ᠫᠣᠫᠣ‍᠋‍ᠫᠣ‍᠋‍ᠫᠣ
GÖ(GÜも同形)182D 1825ᠭᠥᠭᠥ‍᠋‍ᠭᠥ‍᠋‍ᠭᠥ

縦書きについて

MS Office 2007 Word 以降であれば左縦書きが可能。

MS Word 2013 で設定する場合は、メニューの「ファイル」→「オプション」から「Word のオプション」ダイアログを開き、「言語」タブの「編集言語の選択」セクションで「[他の編集言語を追加]」プルダウンボックスから「モンゴル語 (伝統的なモンゴル文字、中国)」を選び「追加(A)」ボタンを押し、「OK」を押してダイアログを閉じる。すると再起動を促されるのでWordを再起動する。再起動後、リボンの「ページレイアウト」の「ページ設定」内「文字列の方向」から「縦書き (モンゴル語)」が選べる様になる。

また、モンゴル語縦書メモ帳のようなものもある。


WebサイトであればCSS 3.0の writing-mode の指定により左縦書き表示ができる。
Windows 7 において、 IE, Firefox では正常な表示が可能。 Chrome はフォントの指定がちゃんとしていれば表示できるようだ。
最新の iOS ではちゃんと表示できる。
Android ではうまく表示されない。フォント設定が悪いのかもしれない。

横書き文章中では display:inline-block; と writing-mode を指定すれば縦にした表示が可能。 Wikipedia で使用されていたCSSを次に示す。

display: inline-block;
font-weight:normal;
font-family:'Menk Hawang Tig', 'Menk Qagan Tig', 'Menk Garqag Tig', 'Menk Har_a Tig', 'Menk Scnin Tig', 'Mongolian BT', 'Mongolian Baiti', 'Mongol Usug', 'MongolianScript', 'Code2000', 'Menksoft Qagan';
font-size: 1.5em;
line-height: 1em;
writing-mode: vertical-lr;
-webkit-writing-mode: vertical-lr;
-o-writing-mode: vertical-lr;
-ms-writing-mode: tb-lr;
writing-mode: tb-lr;
vertical-align:top;

モンゴル文字の ISO 15924 コードは Mong である。
HTML 等の lang 指定は、IETF言語タグ(IETF言語タグ - Wikipedia)に従って“モンゴル語モンゴル文字表記” mn-Mong あるいは主に中国国内で用いられるため mn-Mong-CN とするといいのかもしれない。

フォント

最近のOSなら最初からインストールされている。

フリーで公開されているものもある。


Microsoftモンゴル文字フォント作成のための情報を提供している。(でも最終更新が2002年と古い…)

参考

電子辞書

*1:Unicode Standard https://www.unicode.org/versions/Unicode10.0.0/ch13.pdf によると、“The Mongolian and Todo scripts use a set of ten digits derived from the Tibetan digits. In vertical text, numbers are traditionally written from left to right across the width of the column. In modern contexts, they are frequently rotated so that they follow the vertical flow of the text.”とのことであるが、実例をみてないため、詳細不明。普通文中ではアラビア数字でなければ数詞は文字で書くようだ。仏典に用例があったりするのだろうか?