サークル“ヒュアリニオス”として頒布した『モンゴル文字とUnicode』(初出: コミックマーケット100)を公開します。
モンゴル文字の特徴や現在のコンピュータ上で扱う際の問題点などを簡潔に説明するのを目指した漫画です。
更新履歴
- 2023-12-31 10ページの誤記を修正しました。ご指摘ありがとうございました。
サポートページ
ダウンロード
PDFファイルのダウンロードはこちらから: mongol_bichig_ba_unicode.pdf (13.2 MB)
本文
モンゴル文字は、主にモンゴル語表記のための文字*1である。縦書き専用の文字であり、日本語の場合とは反対に左から右へと行を進める。また、アラビア文字のように続け書きされ、文字が語のどの位置に来るかによって形が変わる。
モンゴル文字は現在も中国の内モンゴル自治区でモンゴル語の表記に現役で使用されている。他方モンゴル国ではソ連の影響下でモンゴル語の表記をキリル文字に切り替えたので、モンゴル文字は学校で習いはするものの一般にあまり使われない。
Unicode 3.0からモンゴル文字がシベ文字・トド文字・満州文字と統合されて収録されているため、コンピュータでこの文字を入力するにあたっては、独自の符号化方式を作成するのでなければUnicodeを利用しようとするのが当然に思える。しかし、現状のUnicodeモンゴル文字は致命的な欠陥を抱えている。
このエントリでは、2017年ころからUnicode Technical Committee (UTC)で盛んに議論されているUnicodeモンゴル文字ブロックの問題点と、その改善に向けた動きを、現代モンゴル語の表記を基本として見ていく。
Unicodeのサイトに、モンゴル文字に関するUTC文書がまとめられている。この記事はその最近の文書の内容を元にしている。
Unicodeモンゴル文字の最大で致命的な問題点は、エンコーディングのレベルで相互運用性(interoperability)がないことである。平たく言い替えると、機種依存文字状態になっている。
喩えを用いるのは不適当かもしれないが、ラテン文字の符号化で考えると、
といった状況である。
現状のエンコーディングでは、モンゴル文字の表示はフォント依存である。これは、Unicode公式で明文化されている規則だけではフォントを実装するには情報が足りず(underspecified)、各々のフォントベンダがそれぞれの解釈で実装を進めた結果、ベンダ間で実装が非互換となっている。あるフォントでは正しく表示されるUnicode文字列が、別のフォントでは正しく表示されないということが普通に起こっている。
一例として、「良い」という意味の単語(キリル文字表記はсайн)を挙げる。次図は、L2/17-334 On migration issues of the graphetic modelのAppendixからの引用である。
縦は3種類のコードポイントの並びを、横は8つのフォントベンダの実装を示す。黒い単語は正しく表示されているものを、グレーは単語が正しく表示されていないものを表す。フォントベンダは、左からMenksoft (中国)、Delehi (Almasとも, 中国)、IMUCS (中国)、Founder (中国)、Huaguang (中国)、Bolorsoft (モンゴル国)、Microsoft (米国)、Google (米国)である。
どのコードポイントの並びをとっても、全てのフォントで正しく表示できるものは存在しないことが分かる。
ここで挙げられている三種類のコードポイントの組み合わせについて、一体どれが正しいのかというと、Unicodeでは規定されていない。つまり、誰も「何をどう表示すれば正しく実装できたといえるのか」が分かっていないという状態である。
モンゴル文字が元々複雑だからというのが一つの原因ではあるが、もう一つの原因は現状のUnicodeモンゴル文字が音声情報ベースの符号化であることである。
X3L2/96-054 Joint proposal draft on encoding Mongolian Character Setは1996年にモンゴル国と中国が共同で作成したモンゴル文字符号化の草案であるが、その中で、符号化の方針として次のような記述がある。
● To guarantee the information integrity(not to lose the information) , different characters of the same glyph are coded separately.
The main principle to abide by is “No Information loss”.(略)
http://www.unicode.org/L2/L1996/96054-n1368-mongolian.pdf
② The sound information of Mongolian is very important especially in data indexing and searching. In many cases, a letter is of different pronunciation and different meaning accordingly. It is rather necessary to encode them all . This will contribute greatly to the information processing of Mongolian script.
という訳で、形が同じだが別の音を表すものであるなら別々の文字としてコード化すべき*2だと言い、音声情報を符号化することを強く推している。
その後の議論については読んでないので分からないが、現状のUnicodeモンゴル文字ブロックも基本的にこの方針でエンコードされている。
この音声情報を符号化することが混乱を引き起こしている。
音声情報ベースで符号化を行うと、ソートが簡単になる、また異音同綴語を区別できるなどの利点はあるが、レンダリングが複雑になり、文字の入力や照合に混乱をもたらすなどの欠点がある。
音声情報を符号化するというのは、モンゴル文字のラテン文字転写とだいたい一対一の対応がとれるということでもある。モンゴル文語の文法書においてはラテン文字転写で説明されていることも多い。
転写とは文字の音声的な特徴を写し取ったもので、形の情報を区別しないことがある。そのため、転写は、一部の文字についてはモンゴル文字で書き分けない文字を書き分けるし、別の文字についてはモンゴル文字で書き分ける文字を書き分けられないという特徴がある。これが転写ひいては符号化されたコードポイントとモンゴル文字の字形との間の対応のずれとなり、どうにか対応付けをするために複雑な仕組みを必要としている。
音声情報を符号化したために、モンゴル文字の形状の複雑さはシステムやフォント側が引き受けることとなった。
モンゴル文字がどのように複雑だったり、混乱を招いているのかを見ていく。
モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。
モンゴル語における母音調和とは、男性母音(a, o, u)と女性母音(e, ö, ü)の2つの母音系列が、原則一語中で混ぜて使われないというものである。他に、どちらの系列とも共存できる中性母音(i)がある。
母音が男性母音または中性母音からなる単語を男性語、女性母音または中性母音からなる単語を女性語という。中性母音のみからなる単語は女性語となる。
子音によっては、男性語と女性語で別の形を使うものがあり、例えば、U+182D MONGOLIAN LETTER GAは、次のように7種類以上の字形に変化する(赤部分。実際には母音等の文字とリガチャになっているものもありフォントグリフとは一致していないので注意)。
このように同じコードポイントの文字を、システムとフォントによって適切な形で表示する必要があるのだが、その規則は明示されてない部分も多いため、手探りで実装することになる。
母音のiは次のような形を取り得る。
語中のiは基本的に「すね」(左下に突き出る斜め線のこと; шилбэ 脛)が1本でかかれる。
一方で、本記事の冒頭で掲げた「良い」という意味の単語(キリル文字でсайн)は、「子音s + 二重母音ai + 子音n」という構成になっているのであるが、語中の二重母音の二番目のiは「すね」が2本となり、これを“i”で転写する方式と“yi”と転写する方式とがある*3。それぞれに従うと「良い」сайнの転写は順に“sain”, “sayin”となる。
他方、二重母音の2番目にくるiはすべて「すね」2本なのかというとそうではなく、数字の8(キリル文字でнайм)とその派生語については例外的にiは「すね」1本でかくため、「良い」сайнを“sain”とする場合、同じ“i”でも「すね」が1本のときと2本が存在することになる。
また、本来の文字yは基本的に「すね」の先が上に跳ね上がった形でかかれる。そのため、二重母音の「すね」2本のiを“yi”で転写するポッペ式における“sayiqan”という転写は、
のどちらの語をも表しうる*4。
このように、同じ文字が単語ごとに正書法によって複数の形に書き分けられるため、文字の形を変更するvariation sequenceという仕組みが存在している。これは、形を変更したい文字にvariation selectorという専用の符号を後置することで、文字を望んだ形に変更するという仕組みである。しかし、どれを本則として、どれをバリエーションとするかについて定義が不十分であるため、混乱がある*5。
まとめると、冒頭で掲げた「良い」(сайн)という単語は、
という2つの分類で説明できる。
繰り返すがこれについてはどれが正しいかというものは規定されていないため、どの方式にも理があるが、互換性はない。
他にも、同じ見た目の文字でも音が異なるならば別々にコード化するという方針により、語中のどの位置でも書き分けのないo, uに別々のコードポイントが与えられている。ö, üについても同様である。他にも書き分けのない文字はあるが省略する。
モンゴル語を理解する人は発音が分かるので、どちらを使えばいいか分かるのではないかという考えもあるかもしれない。しかし、モンゴル文字表記が作られてから時間が経っているため、綴りと発音が乖離しており、発音からo, uのどちらだとわかるとは限らない。また、モンゴル語ではアクセントの関係で、第一音節にある母音ははっきりと発音されるが、第二音節以降の短母音は弱化して曖昧に発音される。そのため、転写方法においても、モンゴル文字で形の区別のないo, uについて、oとuをすべて区別して書き分ける方法と、第一音節のみo, uを書き分け、第二音節以降はuで統一するという方式が併存している*7。転写方法も一様でないし、その転写とほぼ一対一で対応する音声情報ベースのエンコードにおいても表現が一様にならないのは当然という気もする。
結果として同じ見た目になるコードポイント列がたくさん存在し、入力する人にとっても優しくないし、検索を行うにしても、形が同じなのに引っかからないという事態が発生することになる*8。
さらに、キーボードのキートップからは同じ形の文字の区別がよくわからないため、「正しい綴り」というものがもし存在したとしても、それを入力するのは難しい。結果的に人にも機械にとっても厳しい仕組みとなっているのが現状である。
現状のエンコーディングモデルについて、L2/17-328 Script Ad Hoc Group Recommendations on Mongolian Text Modelでは次のような欠点が挙げられている。
散々な言われようである。
さすがにこの現状ではまずいだろうと、Unicodeモンゴル文字改善のためのScript Ad Hoc Groupが作られ、改善に向けた動きが活発になっている。
L2/17-243 Script Ad Hoc report and recommendations on Mongolianにおいて、2種類の改善案が出されている。それぞれの特徴を挙げる。
字形アプローチについてはL2/17-335 [Draft] A graphetic approach for the Mongolian encoding modelで独立した草案が作成されている。
また、モンゴル文字は字形アプローチとし、モンゴル文字と統合されている他の文字(トド文字・シベ文字・満州文字)については大きく変更せず*9、全体の整合性を整えた案がL2/17-333 A mixed encoding scheme for the Mongolian blockである。
これから字形アプローチ策定者はフォントやシステム等の試験実装を作成し、それによってモンゴル文字の表現において問題があるかどうかを検査していくだろうということである。
さて、Script Ad Hoc Groupは字形アプローチを強く推しているのであるが、中国やモンゴル国はどのように思っているのだろうか。
2017年9月23-25日に中国のフフホトで開催されたWG2 ad hoc meeting on MongolianのレポートがL2/17-347 Mongolian Ad Hoc Report (Hohhot, Inner Mongolia)である。
この文書によると、The Mongolian Working Group (おそらく中国か?)はthe Phonetic modelを支持し、モンゴル国の代表たちもthe Phonetic modelを支持しているとのことである。Unicode Technical Committeeの代表たちはどちらのモデルがよいとは言わなかったが、モンゴル文字テキスト処理の現状を懸念していることを表明した。
どちらにせよ、現状のモデルには多数の問題があり、改善策としてどちらの方式がとられたとしても、長期目標としてはモンゴル文字テキストを交換可能かつ将来にわたってアクセス可能にすること(interchangeable and accessible for future generations)であると会議の出席者は合意している。また、この問題の解決に向けて情報(や知識)を共有したり、協働することに同意したとのことである。
中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。
標準化の会議が年一回なので、公式の規格となるのは早くても2019年のUnicode 12.0以降となる。動向に注目したい。
*1:「用字系(script)」と言った方が適切かもしれないが、記事内では基本的に「文字」で統一した。
*2:「“cake”のcと“nice”のcは発音違うから別のコード当てよう!」みたいな話で、書き分けがないのであれば同じ文字として統合する方が分かりやすいし、Unicodeの他の文字体系でもそのようになっている。
*3:「すね」2本の二重母音aiを“ai”とする方式と“ayi”とする方式がある。参考: Transliteration Schemes For Mongolian Vertical Script
*4:塩谷茂樹・中嶋善輝(2011)『大阪大学世界言語研究センター 世界の言語シリーズ3 モンゴル語』、大阪大学出版会。初版第1刷 p. 60.
*5:Variation sequenceはUnicodeのStandardizedVariants.txtである程度の標準化がなされているが、抜けがあったり、不十分であるため、ここにおいても改善の議論がある。
*6:“ayi”の方を採用するメリットとして、наймの「すね」1本のiと区別可能という面がある。
*7:第二音節以降を一律にuで転写する方式は「現代の代表的な文語辞典であるレッシング(F. D. Lessing)の辞書が採用する方式」で、一方「歴史的な経過と形態論的な配慮を紙してoとuを表記し分ける方式」は「提案者にちなんでポッペ・モスタールト(Poppe-Mostaert)方式と称され」ていて、両方式が併存しているとのことである。(河野六郎 編(2001)『言語学大辞典 別巻 世界文字辞典』、三省堂。pp. 1038-1044「蒙古文字」の項)
*8:もちろん、現状のエンコーディングで同一形状を判定できるようなルールを作る場合、そのルールはフォント依存となる。
*9:トド文字・シベ文字・満州文字はモンゴル文字の派生であるが、モンゴル文字で書き分けないが異なる音を表すものについて、文字を変形したり、点等の記号を付したりして字形の区別をつくり、曖昧さをなくした(減らした)ものなので、音と文字がよく対応し、音声アプローチでも問題が少ない。
モンゴル文字Unicodeフォントに関する情報が見つけづらいので、リストを作ってまとめておく。暫定公開。抜けや間違い等ありましたら情報提供お願いいたします。
(2018-03-28 追記)
↑この記事で述べた理由により、フォント間の互換性があるとは限りませんので気を付けてください。あるフォントで正しい表示になっても別のフォントでは正しく表示されない可能性があります。
下記のフォントについてはすべて同一の文字列を与えているため、正しい表示になっていないものもあるはずです。ご留意ください。
(追記終)
モンゴル文字フォントの表示例を作成するのに使用した例文は、Mongolian alphabets, pronunciation and languageに倣い、世界人権宣言の文章(ここからとった)の一部を表記変換器を使ってモンゴル文字に直したものである。フォント見本については、Microsoft Word 2013によりフォントの表示を行った。
間違い等あればご指摘願います。また、さらに良い例文をご存知であればご教授ください。
Copyright holder: Microsoft
Author: Founder(方正), Beijing China
Availability: Bundled with Microsoft Windows Vista and later
URL: https://www.microsoft.com/typography/fonts/font.aspx?FMID=2144
Copyright holder: Myataviin Erdenechimeg
Availability: free download from http://www.openmn.org/index.php?nav=4&pageId=6 (included in Mongolian Script tools) or Mongolian Script - Хэрэглэгчийн горим (from Фонт татах)
URL: http://mongol.openmn.org
License: SIL OPEN FONT LICENSE Version 1.1
Copyright holder: Amarjargal Zeerd-Aduun Lkhamsuren
Availability: free download from the URL
URL: http://mongoltolbo.com
Copyright holder: Amarjargal Zeerd-Aduun Lkhamsuren
Availability: free download from the URL
URL: http://mongoltolbo.com/sudar/
URL: http://www.mongolfont.com/en/font/index.html
Fonts are available in ATT (only on Mac) and OpenType format.
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mnglwhiteotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mnglartotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mnglwritingotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mngltitleotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”
Copyright holder: Google Inc.
Author: Monotype Imaging Inc.
Availability: free download from the URL
URL: https://www.google.com/get/noto/#sans-mong
License: SIL OPEN FONT LICENSE Version 1.1
Copyright holder: Menksoft Co.,Ltd.
Availability: free download from the URL
URL: http://www.menksoft.com/site/alias__menkcms/2791/Default.aspx
License: “You may use this font to display and print content as permitted by the license terms for the product in which this font is included. You may only (i) embed this font in content as permitted by the embedding restrictions included in this font; and (ii) temporarily download this font to a printer or other output device to help print content.”
Copyright holder:
Availability: bundled in VertNote, can be downloaded for free from http://www.dusal.net/downloads/vertNote.rar
URL: http://mongol-bichig.dusal.net/243/mongol-bichgeer-bichdeg-vertnote-program.html
License:
モンゴル文字メモ帳VertNoteをインストールするとついてくる。
Copyright holder:
Availability: A shareware demo, can be downloaded for from http://www.alanwood.net/downloads/index.html. Original web site disappeared.
License: Shareware
汎Unicodeフォント。公式サイト消滅。
Copyright holder:
Availability: bundled in VertNote, can be downloaded for free from https://github.com/orhoncms/orhoncms/tree/master/wp-content/languages/fonts
URL: http://www.orhoncms.org/
License:
Copyright holder: Abkai.net?
Availability: free download from 满文字体 « 太清网
URL: http://abkai.net/core/zh/
License: “Abkai fonts and keyboards are offered free of charge to everybody for personal non-commercial use.”
満州文字・シベ文字・ダウール文字用フォント。
MS Word 2013ではうまく表示されなかった。他にもいくつかフォントがあるがそれも同様。どのようにすれば正しく表示されるのだろうか? あるいは、満州文字・シベ文字・ダウール文字用フォントのため、モンゴル文字には対応していない?
(20150701追記: 覗いてみたら、モンゴル文字でしか使わない文字にはモンゴル文字のグリフが入ってなかったので、モンゴル文字には対応してないようだ)
現代日本でモンゴルというと普通はモンゴル国のことを指し(中国の内蒙古と区別して外モンゴルという)、モンゴル国ではソ連の影響でモンゴル語を表記するのに主にキリル文字を用いる。現代日本においてモンゴル語に関する出版物の多くはキリル文字によるものである。
一方で中国内の内モンゴルでモンゴル語の表記使われている文字はモンゴル文字というシリア文字の系統の文字である。
現代日本で出版されているモンゴル文字表記のモンゴル語を扱った書籍は多くないが、第2次世界大戦以前にもモンゴル文字表記による語学書が出版されていた。それらの一部はすでに著作権が切れており、ネット経由で閲覧できる。
この記事では主に国立国会図書館デジタルコレクションのモンゴル文字関連の書籍を調べ、そのリストを作成した。恐らく漏れがあるだろうと思う。もしご存知の情報があれば、情報提供を願う。
モンゴル文字表記一つの指標となるのが出版年である。外モンゴルでモンゴル文字が廃止されキリル文字表記が採用されたのは1942年であるとのことで、1940年代前半頃までに出版された書籍はモンゴル文字によるものだろう。モンゴル文字に関する情報を調べる際の参考にされたい。
(2022-05-29追記)
国立国会図書館デジタルコレクションの送信資料について、個人送信が提供開始されたのでそれへのリンクを追加する。本人確認を伴う利用者登録およびログインをすることで閲覧可能になる。
この辞書については http://www.cneas.tohoku.ac.jp/staff/hkuri/06.pdf も参照。
版がいくつか登録されている。出版年が同じ前2つは同一のものか。
未整理。
送信資料は図書館で、または、利用者登録をし本人確認を済ませた日本在住の人がオンラインで閲覧できる資料。
nixeneko.hatenablog.com
これ、色々応用できるのでは、ということで、Unicodeのモンゴル文字をラテン文字に1:1で変換して表示するというものを作ってみた。
ブラウザのブックマークレットとして動くJavascriptプログラムです。文字の対応に変なところがあったら教えてください。
Firefox だとTwitterとか一部のサイト(Content Security Policyが設定されたサイト)でブックマークレットを実行するには設定を変える必要があるそうです。
(function(){ m={0x9:"[TAB]",0x20:" ",0x1802:",",0x1803:".",0x1804:":",0x180A:"-", 0x180B:"[FVS1]",0x180C:"[FVS2]",0x180D:"[FVS3]",0x180E:"[MVS]", 0x200C:"[ZWNJ]",0x200D:"[ZWJ]",0x202F:"[NNBSP]", 0x1810:"0",0x1811:"1",0x1812:"2",0x1813:"3",0x1814:"4", 0x1815:"5",0x1816:"6",0x1817:"7",0x1818:"8",0x1819:"9", 0x1820:"a",0x1821:"e",0x1827:"ē",0x1822:"i",0x1823:"o", 0x1824:"u",0x1825:"ö",0x1826:"ü", 0x1828:"n",0x1829:"ŋ",0x182A:"b",0x182B:"p",0x182C:"q", 0x182D:"γ",0x182E:"m",0x182F:"l",0x1830:"s",0x1831:"š", 0x1832:"t",0x1833:"d",0x1834:"č",0x1835:"ǰ",0x1836:"y", 0x1837:"r",0x1838:"v",0x1839:"f",0x183A:"k",0x183B:"ķ", 0x183C:"c",0x183D:"z",0x183E:"h",0x183F:"ř",0x1840:"lh", 0x1841:"zh",0x1842:"ch"}; s=""; [...document.getSelection().toString()].forEach(function(v,i,a){ c = v.codePointAt(0); if(c in m){ s += m[c]; }else{ t = v.codePointAt(0).toString(16).toUpperCase(); s += "U+" + Array( Math.max(0,4-t.length)+1 ).join("0") + t + ";"; } }); alert(s); })();
(function(){ m={0x9:"[TAB]",0x20:" ",0x1802:",",0x1803:".",0x1804:":",0x180A:"-", 0x180B:"[FVS1]",0x180C:"[FVS2]",0x180D:"[FVS3]",0x180E:"[MVS]", 0x200C:"[ZWNJ]",0x200D:"[ZWJ]",0x202F:"[NNBSP]", 0x1810:"0",0x1811:"1",0x1812:"2",0x1813:"3",0x1814:"4", 0x1815:"5",0x1816:"6",0x1817:"7",0x1818:"8",0x1819:"9", 0x1820:"a",0x1821:"e",0x1827:"ē",0x1822:"i",0x1823:"o", 0x1824:"u",0x1825:"ö",0x1826:"ü", 0x1828:"n",0x1829:"ŋ",0x182A:"b",0x182B:"p",0x182C:"q", 0x182D:"γ",0x182E:"m",0x182F:"l",0x1830:"s",0x1831:"š", 0x1832:"t",0x1833:"d",0x1834:"č",0x1835:"ǰ",0x1836:"y", 0x1837:"r",0x1838:"v",0x1839:"f",0x183A:"k",0x183B:"ķ", 0x183C:"c",0x183D:"z",0x183E:"h",0x183F:"ř",0x1840:"lh", 0x1841:"zh",0x1842:"ch"}; s=""; [...document.getSelection().toString()].forEach(function(v,i,a){ c = v.codePointAt(0); if(c in m){ s += m[c]; }else{ t = v.codePointAt(0).toString(16).toUpperCase(); s += "U+" + Array( Math.max(0,4-t.length)+1 ).join("0") + t + ";"; } }); console.log(s); })();
調べたのでまとめる。
モンゴル文字は主にモンゴル語を表記するための文字であり、中国内の内モンゴル自治区で使われる。一方でモンゴル国内では一般にキリル文字表記が使われている。
ここではモンゴル語表記の場合についてを書き、モンゴル文字から派生したトド文字、シベ文字、満州文字等については省略する。
Unicode 3.0 で追加された。コードブロックは U+1800-U+18AF 。
コード表は次を参照。
文字のみが符号化されており、それの語の位置によって変化した形(“presentation forms”)は収録されていない。
о(o) と у(u) はどの位置でも同じ形であるにもかかわらず別々のコードポイントが与えられている。 ө(ö) と ү(ü) についても同様。
特殊な formatting characters が表記に使用される。
独立 | 語頭 | 語中 | 語末 | |
---|---|---|---|---|
実際の表示 | ᠠ | ᠠ | ᠋ᠠ | ᠋ᠠ |
Unicode列 | 1820 | 1820 200D | 180B 200D 1820 200D | 180B 200D 1820 |
説明 | A | A ZWJ | FVS1 ZWJ A ZWJ | FVS1 ZWJ A |
独立 | 語頭 | 語中 | 語末 | |
---|---|---|---|---|
実際の表示 | ᠠ | ᠠ᠊ | ᠊ᠠ᠊ | ᠊ᠠ |
Unicode列 | 1820 | 1820 180A | 180A 1820 180A | 180A 1820 |
説明 | A | A NIRUGU | NIRUGU A ZWJ | NIRUGU A |
次のページを元に作成
ただし、2016年2月18日現在 StandardizedVariants.html には問題があるため、改善案が議論されている。
独立/語頭/語中/語末形のそれぞれの形と、FVSを適用した Standardized Variants である。 Unicodeの Standardized Variants に定義されていない欄についてはグレーアウトしている。モンゴル語以外のものは省いた。フォントの対応との間に一部ずれがある。これは Standardized Variants 側が不適切な状態となっているためで、改訂作業が行われている。
Letter | Unicode | Isolate | Initial | Medial | Final |
---|---|---|---|---|---|
A | 1820 | ᠠ | ᠠ | ᠋ᠠ | ᠋ᠠ |
1820 180B | ᠠ᠋ | ᠋ᠠ᠋ | ᠋ᠠ᠋ | ||
1820 180C | ᠋ᠠ᠌ | ||||
E | 1821 | ᠡ | ᠡ | ᠋ᠡ | ᠋ᠡ |
1821 180B | ᠡ᠋ | ᠋ᠡ᠋ | |||
I | 1822 | ᠢ | ᠢ | ᠋ᠢ | ᠋ᠢ |
1822 180B | ᠋ᠢ᠋ | ||||
O | 1823 | ᠣ | ᠣ | ᠋ᠣ | ᠋ᠣ |
1823 180B | ᠋ᠣ᠋ | ᠋ᠣ᠋ | |||
U | 1824 | ᠤ | ᠤ | ᠋ᠤ | ᠋ᠤ |
1824 180B | ᠤ᠋ | ||||
OE | 1825 | ᠥ | ᠥ | ᠋ᠥ | ᠋ᠥ |
1825 180B | ᠋ᠥ᠋ | ᠋ᠥ᠋ | |||
1825 180C | ᠋ᠥ᠌ | ||||
UE | 1826 | ᠦ | ᠦ | ᠋ᠦ | ᠋ᠦ |
1826 180B | ᠦ᠋ | ᠋ᠦ᠋ | ᠋ᠦ᠋ | ||
1826 180C | ᠋ᠦ᠌ | ||||
EE | 1827 | ᠧ | ᠧ | ᠋ᠧ | ᠋ᠧ |
Letter | Unicode | Isolate | Initial | Medial | Final |
---|---|---|---|---|---|
N | 1828 | ᠨ | ᠨ | ᠋ᠨ | ᠋ᠨ |
1828 180B | ᠨ᠋ | ᠋ᠨ᠋ | |||
1828 180C | ᠋ᠨ᠌ | ||||
1828 180D | ᠋ᠨ᠍ | ||||
NG | 1829 | ᠩ | ᠩ | ᠋ᠩ | ᠋ᠩ |
B | 182A | ᠪ | ᠪ | ᠋ᠪ | ᠋ᠪ |
182A 180B | ᠋ᠪ᠋ | ||||
P | 182B | ᠫ | ᠫ | ᠋ᠫ | ᠋ᠫ |
Q | 182C | ᠬ | ᠬ | ᠋ᠬ | ᠋ᠬ |
182C 180B | ᠬ᠋ | ᠬ᠋ | ᠋ᠬ᠋ | ᠋ᠬ᠋ | |
182C 180C | ᠋ᠬ᠌ | ||||
182C 180D | ᠋ᠬ᠍ | ||||
G | 182D | ᠭ | ᠭ | ᠋ᠭ | ᠋ᠭ |
182D 180B | ᠭ᠋ | ᠭ᠋ | ᠋ᠭ᠋ | ᠋ᠭ᠋ | |
182D 180C | ᠋ᠭ᠌ | ᠋ᠭ᠌ | |||
182D 180D | ᠋ᠭ᠍ | ||||
M | 182E | ᠮ | ᠮ | ᠋ᠮ | ᠋ᠮ |
L | 182F | ᠯ | ᠯ | ᠋ᠯ | ᠋ᠯ |
S | 1830 | ᠰ | ᠰ | ᠋ᠰ | ᠋ᠰ |
1830 180B | ᠋ᠰ᠋ | ||||
1830 180C | ᠋ᠰ᠌ | ||||
SH | 1831 | ᠱ | ᠱ | ᠋ᠱ | ᠋ᠱ |
T | 1832 | ᠲ | ᠲ | ᠋ᠲ | ᠋ᠲ |
1832 180B | ᠋ᠲ᠋ | ||||
D | 1833 | ᠳ | ᠳ | ᠋ᠳ | ᠋ᠳ |
1832 180B | ᠳ᠋ | ᠋ᠳ᠋ | ᠋ᠳ᠋ | ||
CH | 1834 | ᠴ | ᠴ | ᠋ᠴ | ᠋ᠴ |
J | 1835 | ᠵ | ᠵ | ᠋ᠵ | ᠋ᠵ |
1835 180B | ᠋ᠵ᠋ | ||||
Y | 1836 | ᠶ | ᠶ | ᠋ᠶ | ᠋ᠶ |
1836 180B | ᠶ᠋ | ᠋ᠶ᠋ | |||
1836 180C | ᠋ᠶ᠌ | ||||
R | 1837 | ᠷ | ᠷ | ᠋ᠷ | ᠋ᠷ |
W | 1838 | ᠸ | ᠸ | ᠋ᠸ | ᠋ᠸ |
1838 180B | ᠋ᠸ᠋ | ||||
F | 1839 | ᠹ | ᠹ | ᠋ᠹ | ᠋ᠹ |
K | 183A | ᠺ | ᠺ | ᠋ᠺ | ᠋ᠺ |
KH | 183B | ᠻ | ᠻ | ᠋ᠻ | ᠋ᠻ |
TS | 183C | ᠼ | ᠼ | ᠋ᠼ | ᠋ᠼ |
Z | 183D | ᠽ | ᠽ | ᠋ᠽ | ᠋ᠽ |
HA | 183E | ᠾ | ᠾ | ᠋ᠾ | ᠋ᠾ |
ZR | 183F | ᠿ | ᠿ | ᠋ᠿ | ᠋ᠿ |
LH | 1840 | ᡀ | ᡀ | ᠋ᡀ | ᠋ᡀ |
ZHI | 1841 | ᡁ | ᡁ | ᠋ᡁ | ᠋ᡁ |
CHI | 1842 | ᡂ | ᡂ | ᠋ᡂ | ᠋ᡂ |
この他にいくつか、子音と母音との特別な合字形をもつものがある。
例として、
Letter | Unicode | Isolate | Initial | Medial | Final |
---|---|---|---|---|---|
BO(BUも同形) | 182A 1823 | ᠪᠣ | ᠪᠣ | ᠋ᠪᠣ | ᠋ᠪᠣ |
BÖ(BÜも同形) | 182A 1825 | ᠪᠥ | ᠪᠥ | ᠋ᠪᠥ | ᠋ᠪᠥ |
PO(PUも同形) | 182B 1823 | ᠫᠣ | ᠫᠣ | ᠋ᠫᠣ | ᠋ᠫᠣ |
GÖ(GÜも同形) | 182D 1825 | ᠭᠥ | ᠭᠥ | ᠋ᠭᠥ | ᠋ᠭᠥ |
MS Office 2007 Word 以降であれば左縦書きが可能。
MS Word 2013 で設定する場合は、メニューの「ファイル」→「オプション」から「Word のオプション」ダイアログを開き、「言語」タブの「編集言語の選択」セクションで「[他の編集言語を追加]」プルダウンボックスから「モンゴル語 (伝統的なモンゴル文字、中国)」を選び「追加(A)」ボタンを押し、「OK」を押してダイアログを閉じる。すると再起動を促されるのでWordを再起動する。再起動後、リボンの「ページレイアウト」の「ページ設定」内「文字列の方向」から「縦書き (モンゴル語)」が選べる様になる。
また、モンゴル語縦書メモ帳のようなものもある。
WebサイトであればCSS 3.0の writing-mode の指定により左縦書き表示ができる。
Windows 7 において、 IE, Firefox では正常な表示が可能。 Chrome はフォントの指定がちゃんとしていれば表示できるようだ。
最新の iOS ではちゃんと表示できる。
Android ではうまく表示されない。フォント設定が悪いのかもしれない。
横書き文章中では display:inline-block; と writing-mode を指定すれば縦にした表示が可能。 Wikipedia で使用されていたCSSを次に示す。
display: inline-block; font-weight:normal; font-family:'Menk Hawang Tig', 'Menk Qagan Tig', 'Menk Garqag Tig', 'Menk Har_a Tig', 'Menk Scnin Tig', 'Mongolian BT', 'Mongolian Baiti', 'Mongol Usug', 'MongolianScript', 'Code2000', 'Menksoft Qagan'; font-size: 1.5em; line-height: 1em; writing-mode: vertical-lr; -webkit-writing-mode: vertical-lr; -o-writing-mode: vertical-lr; -ms-writing-mode: tb-lr; writing-mode: tb-lr; vertical-align:top;
モンゴル文字の ISO 15924 コードは Mong である。
HTML 等の lang 指定は、IETF言語タグ(IETF言語タグ - Wikipedia)に従って“モンゴル語のモンゴル文字表記” mn-Mong あるいは主に中国国内で用いられるため mn-Mong-CN とするといいのかもしれない。
最近のOSなら最初からインストールされている。
フリーで公開されているものもある。
*1:Unicode Standard https://www.unicode.org/versions/Unicode10.0.0/ch13.pdf によると、“The Mongolian and Todo scripts use a set of ten digits derived from the Tibetan digits. In vertical text, numbers are traditionally written from left to right across the width of the column. In modern contexts, they are frequently rotated so that they follow the vertical flow of the text.”とのことであるが、実例をみてないため、詳細不明。普通文中ではアラビア数字でなければ数詞は文字で書くようだ。仏典に用例があったりするのだろうか?