調べたのでまとめる。
モンゴル文字は主にモンゴル語を表記するための文字であり、中国内の内モンゴル自治区で使われる。一方でモンゴル国内では一般にキリル文字表記が使われている。
ここではモンゴル語表記の場合についてを書き、モンゴル文字から派生したトド文字、シベ文字、満州文字等については省略する。
特徴
- 左縦書き。つまり縦書き(上→下)で、かつ行は左→右へ書く(日本語と逆)
- 語頭形(及び独立形)・語中形・語末形をもち、語のどの位置に書かれるかによって文字の形が異なる。また、それ以外にも特別な別形を持つ文字がある(10種持つ文字もあるらしい)。
- 単語は空白で区切られるが、単語の中にも空白(字空け)が現れうる。
- 宗教的なテキストのために、サンスクリット語やチベット語表記用の文字が追加されている。
- チベット数字を元にした独自の数字をもつ。縦書き中でも左→右に横書きされるらしい*1。最近は回転させて文の流れる向きに合わせることも多いらしい。
- 独自のperiod᠃, comma ᠂, colon ᠄をもつ。また点4つの記号᠅で章末を表す。他にも、BIRGA ᠀ は一節(passage)の始まりやフォリオの表面(the recto side of a folio)の始まりを示すものらしい。
Unicode
Unicode 3.0 で追加された。コードブロックは U+1800-U+18AF 。
コード表は次を参照。
文字のみが符号化されており、それの語の位置によって変化した形(“presentation forms”)は収録されていない。
о(o) と у(u) はどの位置でも同じ形であるにもかかわらず別々のコードポイントが与えられている。 ө(ö) と ү(ü) についても同様。
特殊な formatting characters が表記に使用される。
- U+180B MONGOLIAN FREE VARIATION SELECTOR ONE
- U+180C MONGOLIAN FREE VARIATION SELECTOR TWO
- U+180D MONGOLIAN FREE VARIATION SELECTOR THREE
- FVSとも。 contextual shaping of letters に作用する。前につくグリフの形を変える。視覚表現なし。
- Unicode Character Database の Standardized Variants に有効なFVS付きの文字のリストがある。
- U+180E MONGOLIAN VOWEL SEPARATOR
- MVS とも。語末の ᠠ a ᠡ e の直前に挿入され、前後の文字を特別な形に変える。狭い空白をもつ。
- U+202F NARROW NO-BREAK SPACE
- 接尾辞がつけられる際に、単語本体と小さな空白で区切られる場合に挿入され、空白を内に含む語を構成する。前後の文字の glyph 選択に影響する。
- U+200C ZERO WIDTH NON-JOINER (ZWNJ)
- U+200D ZERO WIDTH JOINER (ZWJ)
独立 | 語頭 | 語中 | 語末 | |
---|---|---|---|---|
実際の表示 | ᠠ | ᠠ | ᠋ᠠ | ᠋ᠠ |
Unicode列 | 1820 | 1820 200D | 180B 200D 1820 200D | 180B 200D 1820 |
説明 | A | A ZWJ | FVS1 ZWJ A ZWJ | FVS1 ZWJ A |
- 語頭-語中-語末形の表示には、 U+180A MONGOLIAN NIRUGU ( ᠊ ) を使うこともできる。アラビア文字で Kashida を使って表示するのに近いか。複合語の結合用のハイフンとしてとも使えるらしい。
独立 | 語頭 | 語中 | 語末 | |
---|---|---|---|---|
実際の表示 | ᠠ | ᠠ᠊ | ᠊ᠠ᠊ | ᠊ᠠ |
Unicode列 | 1820 | 1820 180A | 180A 1820 180A | 180A 1820 |
説明 | A | A NIRUGU | NIRUGU A ZWJ | NIRUGU A |
Presentation Forms
次のページを元に作成
ただし、2016年2月18日現在 StandardizedVariants.html には問題があるため、改善案が議論されている。
独立/語頭/語中/語末形のそれぞれの形と、FVSを適用した Standardized Variants である。 Unicodeの Standardized Variants に定義されていない欄についてはグレーアウトしている。モンゴル語以外のものは省いた。フォントの対応との間に一部ずれがある。これは Standardized Variants 側が不適切な状態となっているためで、改訂作業が行われている。
Letter | Unicode | Isolate | Initial | Medial | Final |
---|---|---|---|---|---|
A | 1820 | ᠠ | ᠠ | ᠋ᠠ | ᠋ᠠ |
1820 180B | ᠠ᠋ | ᠋ᠠ᠋ | ᠋ᠠ᠋ | ||
1820 180C | ᠋ᠠ᠌ | ||||
E | 1821 | ᠡ | ᠡ | ᠋ᠡ | ᠋ᠡ |
1821 180B | ᠡ᠋ | ᠋ᠡ᠋ | |||
I | 1822 | ᠢ | ᠢ | ᠋ᠢ | ᠋ᠢ |
1822 180B | ᠋ᠢ᠋ | ||||
O | 1823 | ᠣ | ᠣ | ᠋ᠣ | ᠋ᠣ |
1823 180B | ᠋ᠣ᠋ | ᠋ᠣ᠋ | |||
U | 1824 | ᠤ | ᠤ | ᠋ᠤ | ᠋ᠤ |
1824 180B | ᠤ᠋ | ||||
OE | 1825 | ᠥ | ᠥ | ᠋ᠥ | ᠋ᠥ |
1825 180B | ᠋ᠥ᠋ | ᠋ᠥ᠋ | |||
1825 180C | ᠋ᠥ᠌ | ||||
UE | 1826 | ᠦ | ᠦ | ᠋ᠦ | ᠋ᠦ |
1826 180B | ᠦ᠋ | ᠋ᠦ᠋ | ᠋ᠦ᠋ | ||
1826 180C | ᠋ᠦ᠌ | ||||
EE | 1827 | ᠧ | ᠧ | ᠋ᠧ | ᠋ᠧ |
- EEᠧは外来語の表記に用いる。Eと異なりAと区別することができる。
- O[FVS1]の語末形᠋ᠣ᠋は外来語に用いる。
Letter | Unicode | Isolate | Initial | Medial | Final |
---|---|---|---|---|---|
N | 1828 | ᠨ | ᠨ | ᠋ᠨ | ᠋ᠨ |
1828 180B | ᠨ᠋ | ᠋ᠨ᠋ | |||
1828 180C | ᠋ᠨ᠌ | ||||
1828 180D | ᠋ᠨ᠍ | ||||
NG | 1829 | ᠩ | ᠩ | ᠋ᠩ | ᠋ᠩ |
B | 182A | ᠪ | ᠪ | ᠋ᠪ | ᠋ᠪ |
182A 180B | ᠋ᠪ᠋ | ||||
P | 182B | ᠫ | ᠫ | ᠋ᠫ | ᠋ᠫ |
Q | 182C | ᠬ | ᠬ | ᠋ᠬ | ᠋ᠬ |
182C 180B | ᠬ᠋ | ᠬ᠋ | ᠋ᠬ᠋ | ᠋ᠬ᠋ | |
182C 180C | ᠋ᠬ᠌ | ||||
182C 180D | ᠋ᠬ᠍ | ||||
G | 182D | ᠭ | ᠭ | ᠋ᠭ | ᠋ᠭ |
182D 180B | ᠭ᠋ | ᠭ᠋ | ᠋ᠭ᠋ | ᠋ᠭ᠋ | |
182D 180C | ᠋ᠭ᠌ | ᠋ᠭ᠌ | |||
182D 180D | ᠋ᠭ᠍ | ||||
M | 182E | ᠮ | ᠮ | ᠋ᠮ | ᠋ᠮ |
L | 182F | ᠯ | ᠯ | ᠋ᠯ | ᠋ᠯ |
S | 1830 | ᠰ | ᠰ | ᠋ᠰ | ᠋ᠰ |
1830 180B | ᠋ᠰ᠋ | ||||
1830 180C | ᠋ᠰ᠌ | ||||
SH | 1831 | ᠱ | ᠱ | ᠋ᠱ | ᠋ᠱ |
T | 1832 | ᠲ | ᠲ | ᠋ᠲ | ᠋ᠲ |
1832 180B | ᠋ᠲ᠋ | ||||
D | 1833 | ᠳ | ᠳ | ᠋ᠳ | ᠋ᠳ |
1832 180B | ᠳ᠋ | ᠋ᠳ᠋ | ᠋ᠳ᠋ | ||
CH | 1834 | ᠴ | ᠴ | ᠋ᠴ | ᠋ᠴ |
J | 1835 | ᠵ | ᠵ | ᠋ᠵ | ᠋ᠵ |
1835 180B | ᠋ᠵ᠋ | ||||
Y | 1836 | ᠶ | ᠶ | ᠋ᠶ | ᠋ᠶ |
1836 180B | ᠶ᠋ | ᠋ᠶ᠋ | |||
1836 180C | ᠋ᠶ᠌ | ||||
R | 1837 | ᠷ | ᠷ | ᠋ᠷ | ᠋ᠷ |
W | 1838 | ᠸ | ᠸ | ᠋ᠸ | ᠋ᠸ |
1838 180B | ᠋ᠸ᠋ | ||||
F | 1839 | ᠹ | ᠹ | ᠋ᠹ | ᠋ᠹ |
K | 183A | ᠺ | ᠺ | ᠋ᠺ | ᠋ᠺ |
KH | 183B | ᠻ | ᠻ | ᠋ᠻ | ᠋ᠻ |
TS | 183C | ᠼ | ᠼ | ᠋ᠼ | ᠋ᠼ |
Z | 183D | ᠽ | ᠽ | ᠋ᠽ | ᠋ᠽ |
HA | 183E | ᠾ | ᠾ | ᠋ᠾ | ᠋ᠾ |
ZR | 183F | ᠿ | ᠿ | ᠋ᠿ | ᠋ᠿ |
LH | 1840 | ᡀ | ᡀ | ᠋ᡀ | ᠋ᡀ |
ZHI | 1841 | ᡁ | ᡁ | ᠋ᡁ | ᠋ᡁ |
CHI | 1842 | ᡂ | ᡂ | ᠋ᡂ | ᠋ᡂ |
この他にいくつか、子音と母音との特別な合字形をもつものがある。
例として、
Letter | Unicode | Isolate | Initial | Medial | Final |
---|---|---|---|---|---|
BO(BUも同形) | 182A 1823 | ᠪᠣ | ᠪᠣ | ᠋ᠪᠣ | ᠋ᠪᠣ |
BÖ(BÜも同形) | 182A 1825 | ᠪᠥ | ᠪᠥ | ᠋ᠪᠥ | ᠋ᠪᠥ |
PO(PUも同形) | 182B 1823 | ᠫᠣ | ᠫᠣ | ᠋ᠫᠣ | ᠋ᠫᠣ |
GÖ(GÜも同形) | 182D 1825 | ᠭᠥ | ᠭᠥ | ᠋ᠭᠥ | ᠋ᠭᠥ |
縦書きについて
MS Office 2007 Word 以降であれば左縦書きが可能。
MS Word 2013 で設定する場合は、メニューの「ファイル」→「オプション」から「Word のオプション」ダイアログを開き、「言語」タブの「編集言語の選択」セクションで「[他の編集言語を追加]」プルダウンボックスから「モンゴル語 (伝統的なモンゴル文字、中国)」を選び「追加(A)」ボタンを押し、「OK」を押してダイアログを閉じる。すると再起動を促されるのでWordを再起動する。再起動後、リボンの「ページレイアウト」の「ページ設定」内「文字列の方向」から「縦書き (モンゴル語)」が選べる様になる。
また、モンゴル語縦書メモ帳のようなものもある。
WebサイトであればCSS 3.0の writing-mode の指定により左縦書き表示ができる。
Windows 7 において、 IE, Firefox では正常な表示が可能。 Chrome はフォントの指定がちゃんとしていれば表示できるようだ。
最新の iOS ではちゃんと表示できる。
Android ではうまく表示されない。フォント設定が悪いのかもしれない。
横書き文章中では display:inline-block; と writing-mode を指定すれば縦にした表示が可能。 Wikipedia で使用されていたCSSを次に示す。
display: inline-block; font-weight:normal; font-family:'Menk Hawang Tig', 'Menk Qagan Tig', 'Menk Garqag Tig', 'Menk Har_a Tig', 'Menk Scnin Tig', 'Mongolian BT', 'Mongolian Baiti', 'Mongol Usug', 'MongolianScript', 'Code2000', 'Menksoft Qagan'; font-size: 1.5em; line-height: 1em; writing-mode: vertical-lr; -webkit-writing-mode: vertical-lr; -o-writing-mode: vertical-lr; -ms-writing-mode: tb-lr; writing-mode: tb-lr; vertical-align:top;
モンゴル文字の ISO 15924 コードは Mong である。
HTML 等の lang 指定は、IETF言語タグ(IETF言語タグ - Wikipedia)に従って“モンゴル語のモンゴル文字表記” mn-Mong あるいは主に中国国内で用いられるため mn-Mong-CN とするといいのかもしれない。
フォント
最近のOSなら最初からインストールされている。
フリーで公開されているものもある。
参考
本文に関して
- Richard Gillam, Unicode Demystified: A Practical Programmer's Guide to the Encoding Standard, Addison-Wesley Professional, 2002, pp.407-413
- Unicode® 8.0.0 Chapter 13 South and Central Asia-II
- モンゴル文字 - Wikipedia
- Mongolian alphabets, pronunciation and language
コード表に関して
Unicode符号化とフォントの対応について
- 蒙古文编码 (standardized variants のべースとなった文書; outdated)
- http://www.babelstone.co.uk/Mongolian/Specification9.pdf (蒙古文编码の最新版に相当する文書)
- Mongolian character notes
- redirect
- Document log for Mongolian Variants discussion
- MONGOLIAN UNICODE PROJECT HOME P
- A Study of Traditional Mongolian Script Encodings and Rendering: Use of Unicode in OpenType fonts (PDF)
フォント、入力、アプリケーションでの使用に関して
転写
表記変換
- Conversion System between Traditional Mongolian and Cyrillic Mongolian (キリル文字表記←→モンゴル文字表記変換)
- 传统蒙古文编码转换系统(蒙科立编码与国家标准编码相互转换) (蒙科立编码←→国家标准编码 相互変換機)
電子辞書
- モンゴル語の電子化利用
- Bolor Dictionary (モンゴル語←→英語 電子辞書)
*1:Unicode Standard https://www.unicode.org/versions/Unicode10.0.0/ch13.pdf によると、“The Mongolian and Todo scripts use a set of ten digits derived from the Tibetan digits. In vertical text, numbers are traditionally written from left to right across the width of the column. In modern contexts, they are frequently rotated so that they follow the vertical flow of the text.”とのことであるが、実例をみてないため、詳細不明。普通文中ではアラビア数字でなければ数詞は文字で書くようだ。仏典に用例があったりするのだろうか?