にせねこメモ

はてなダイアリーがUTF-8じゃないので移ってきました。

『モンゴル文字とUnicode』

サークル“ヒュアリニオス”として頒布した『モンゴル文字Unicode』(初出: コミックマーケット100)を公開します。
モンゴル文字の特徴や現在のコンピュータ上で扱う際の問題点などを簡潔に説明するのを目指した漫画です。

更新履歴

  • 2023-12-31 10ページの誤記を修正しました。ご指摘ありがとうございました。

サポートページ

hyalinios.hatenadiary.com

紙版販売

Boothで初版在庫分を販売しています(未修正の誤植などがあります)。紙でほしい場合はどうぞ。停止しています。

ダウンロード

PDFファイルのダウンロードはこちらから: mongol_bichig_ba_unicode.pdf (13.2 MB)

本文

続きを読む

Windows 10のモンゴル文字キーボード配列図

Windows 10にはモンゴル文字のキーボード配列がなぜか2種類入っていて、「モンゴル語 (モンゴル文字)」と「伝統的なモンゴル文字 (標準)」という名前になっている。これらは配置がやや異なる。
モンゴル語 (モンゴル文字)」の方が古くから存在し、「伝統的なモンゴル文字 (標準)」は後から追加されたようだ。čやoの位置、一部記号等が異なっている。

これを使ってキーボード配列図を作成した。

ラテン文字転写は基本的に塩谷 茂樹・中嶋 善輝『モンゴル語 (世界の言語シリーズ3)』大阪大学出版会(2011)に基づいている。


伝統的なモンゴル文字 (標準)

f:id:nixeneko:20200828231947p:plain

ソースコード

現在のUnicodeモンゴル文字の問題点と最近の動き

モンゴル文字は、主にモンゴル語表記のための文字*1である。縦書き専用の文字であり、日本語の場合とは反対に左から右へと行を進める。また、アラビア文字のように続け書きされ、文字が語のどの位置に来るかによって形が変わる。
モンゴル文字は現在も中国の内モンゴル自治区モンゴル語の表記に現役で使用されている。他方モンゴル国ではソ連の影響下でモンゴル語の表記をキリル文字に切り替えたので、モンゴル文字は学校で習いはするものの一般にあまり使われない。

Unicode 3.0からモンゴル文字がシベ文字・トド文字・満州文字と統合されて収録されているため、コンピュータでこの文字を入力するにあたっては、独自の符号化方式を作成するのでなければUnicodeを利用しようとするのが当然に思える。しかし、現状のUnicodeモンゴル文字は致命的な欠陥を抱えている。

このエントリでは、2017年ころからUnicode Technical Committee (UTC)で盛んに議論されているUnicodeモンゴル文字ブロックの問題点と、その改善に向けた動きを、現代モンゴル語の表記を基本として見ていく。

Unicodeのサイトに、モンゴル文字に関するUTC文書がまとめられている。この記事はその最近の文書の内容を元にしている。

致命的な欠陥: 相互運用性がない

Unicodeモンゴル文字の最大で致命的な問題点は、エンコーディングのレベルで相互運用性(interoperability)がないことである。平たく言い替えると、機種依存文字状態になっている。

喩えを用いるのは不適当かもしれないが、ラテン文字の符号化で考えると、

  • 大文字小文字は統合し同一コードポイントとする
  • 大文字小文字の区別のためのvariant selectorを用意し、文字に後置するかしないかによって大文字小文字を区別する
  • 一方、variant selectorを付けた場合と付けない場合のどちらが大文字でどちらが小文字かが未定義なため、両方式のフォントが共存していて、互いに互換性がない

といった状況である。


現状のエンコーディングでは、モンゴル文字の表示はフォント依存である。これは、Unicode公式で明文化されている規則だけではフォントを実装するには情報が足りず(underspecified)、各々のフォントベンダがそれぞれの解釈で実装を進めた結果、ベンダ間で実装が非互換となっている。あるフォントでは正しく表示されるUnicode文字列が、別のフォントでは正しく表示されないということが普通に起こっている。

一例として、「良い」という意味の単語(キリル文字表記はсайн)を挙げる。次図は、L2/17-334 On migration issues of the graphetic modelのAppendixからの引用である。
f:id:nixeneko:20180224162725p:plain
縦は3種類のコードポイントの並びを、横は8つのフォントベンダの実装を示す。黒い単語は正しく表示されているものを、グレーは単語が正しく表示されていないものを表す。フォントベンダは、左からMenksoft (中国)、Delehi (Almasとも, 中国)、IMUCS (中国)、Founder (中国)、Huaguang (中国)、Bolorsoft (モンゴル国)、Microsoft (米国)、Google (米国)である。

どのコードポイントの並びをとっても、全てのフォントで正しく表示できるものは存在しないことが分かる。

ここで挙げられている三種類のコードポイントの組み合わせについて、一体どれが正しいのかというと、Unicodeでは規定されていない。つまり、誰も「何をどう表示すれば正しく実装できたといえるのか」が分かっていないという状態である。


どうしてこうなった: 音声情報の符号化

モンゴル文字が元々複雑だからというのが一つの原因ではあるが、もう一つの原因は現状のUnicodeモンゴル文字が音声情報ベースの符号化であることである。


X3L2/96-054 Joint proposal draft on encoding Mongolian Character Setは1996年にモンゴル国と中国が共同で作成したモンゴル文字符号化の草案であるが、その中で、符号化の方針として次のような記述がある。

● To guarantee the information integrity(not to lose the information) , different characters of the same glyph are coded separately.
The main principle to abide by is “No Information loss”.

(略)
② The sound information of Mongolian is very important especially in data indexing and searching. In many cases, a letter is of different pronunciation and different meaning accordingly. It is rather necessary to encode them all . This will contribute greatly to the information processing of Mongolian script.

http://www.unicode.org/L2/L1996/96054-n1368-mongolian.pdf

という訳で、形が同じだが別の音を表すものであるなら別々の文字としてコード化すべき*2だと言い、音声情報を符号化することを強く推している。

その後の議論については読んでないので分からないが、現状のUnicodeモンゴル文字ブロックも基本的にこの方針でエンコードされている。
この音声情報を符号化することが混乱を引き起こしている。

音声情報ベースで符号化を行うと、ソートが簡単になる、また異音同綴語を区別できるなどの利点はあるが、レンダリングが複雑になり、文字の入力や照合に混乱をもたらすなどの欠点がある。

音声情報を符号化するというのは、モンゴル文字ラテン文字転写とだいたい一対一の対応がとれるということでもある。モンゴル文語の文法書においてはラテン文字転写で説明されていることも多い。
転写とは文字の音声的な特徴を写し取ったもので、形の情報を区別しないことがある。そのため、転写は、一部の文字についてはモンゴル文字で書き分けない文字を書き分けるし、別の文字についてはモンゴル文字で書き分ける文字を書き分けられないという特徴がある。これが転写ひいては符号化されたコードポイントとモンゴル文字の字形との間の対応のずれとなり、どうにか対応付けをするために複雑な仕組みを必要としている。

モンゴル文字の複雑さ

音声情報を符号化したために、モンゴル文字の形状の複雑さはシステムやフォント側が引き受けることとなった。

モンゴル文字がどのように複雑だったり、混乱を招いているのかを見ていく。

母音調和による字形変化

モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。

モンゴル語における母音調和とは、男性母音(a, o, u)と女性母音(e, ö, ü)の2つの母音系列が、原則一語中で混ぜて使われないというものである。他に、どちらの系列とも共存できる中性母音(i)がある。
母音が男性母音または中性母音からなる単語を男性語、女性母音または中性母音からなる単語を女性語という。中性母音のみからなる単語は女性語となる。

子音によっては、男性語と女性語で別の形を使うものがあり、例えば、U+182D MONGOLIAN LETTER GAは、次のように7種類以上の字形に変化する(赤部分。実際には母音等の文字とリガチャになっているものもありフォントグリフとは一致していないので注意)。
f:id:nixeneko:20180302222513p:plain
このように同じコードポイントの文字を、システムとフォントによって適切な形で表示する必要があるのだが、その規則は明示されてない部分も多いため、手探りで実装することになる。

二重母音のi

母音のiは次のような形を取り得る。
f:id:nixeneko:20180303133752p:plain
語中のiは基本的に「すね」(左下に突き出る斜め線のこと; шилбэ 脛)が1本でかかれる。

一方で、本記事の冒頭で掲げた「良い」という意味の単語(キリル文字でсайн)は、「子音s + 二重母音ai + 子音n」という構成になっているのであるが、語中の二重母音の二番目のiは「すね」が2本となり、これを“i”で転写する方式と“yi”と転写する方式とがある*3。それぞれに従うと「良い」сайнの転写は順に“sain”, “sayin”となる。

他方、二重母音の2番目にくるiはすべて「すね」2本なのかというとそうではなく、数字の8(キリル文字でнайм)とその派生語については例外的にiは「すね」1本でかくため、「良い」сайнを“sain”とする場合、同じ“i”でも「すね」が1本のときと2本が存在することになる。
f:id:nixeneko:20180303151408p:plain
また、本来の文字yは基本的に「すね」の先が上に跳ね上がった形でかかれる。そのため、二重母音の「すね」2本のiを“yi”で転写するポッペ式における“sayiqan”という転写は、

  • сайхан「素晴らしい」(yはまっすぐな「すね」)
  • саяхан「つい先ほど」(yは曲がった「すね」)

のどちらの語をも表しうる*4
f:id:nixeneko:20180303151434p:plain
このように、同じ文字が単語ごとに正書法によって複数の形に書き分けられるため、文字の形を変更するvariation sequenceという仕組みが存在している。これは、形を変更したい文字にvariation selectorという専用の符号を後置することで、文字を望んだ形に変更するという仕組みである。しかし、どれを本則として、どれをバリエーションとするかについて定義が不十分であるため、混乱がある*5

まとめると、冒頭で掲げた「良い」(сайн)という単語は、

  1. 語頭・語中の二重母音aiを転写するのに“ai”と“ayi”のどちらを使うか*6。両方採用することも可能。
  2. “ayi”を採用する場合、「基本はyをまっすぐな『すね』で表示して、曲がった形にするためにvariation sequenceという仕組みを用いる」か、あるいはその逆か

という2つの分類で説明できる。
繰り返すがこれについてはどれが正しいかというものは規定されていないため、どの方式にも理があるが、互換性はない。

書き分けない文字に別々のコードポイントを当てる

他にも、同じ見た目の文字でも音が異なるならば別々にコード化するという方針により、語中のどの位置でも書き分けのないo, uに別々のコードポイントが与えられている。ö, üについても同様である。他にも書き分けのない文字はあるが省略する。
f:id:nixeneko:20180303171046p:plain
モンゴル語を理解する人は発音が分かるので、どちらを使えばいいか分かるのではないかという考えもあるかもしれない。しかし、モンゴル文字表記が作られてから時間が経っているため、綴りと発音が乖離しており、発音からo, uのどちらだとわかるとは限らない。また、モンゴル語ではアクセントの関係で、第一音節にある母音ははっきりと発音されるが、第二音節以降の短母音は弱化して曖昧に発音される。そのため、転写方法においても、モンゴル文字で形の区別のないo, uについて、oとuをすべて区別して書き分ける方法と、第一音節のみo, uを書き分け、第二音節以降はuで統一するという方式が併存している*7。転写方法も一様でないし、その転写とほぼ一対一で対応する音声情報ベースのエンコードにおいても表現が一様にならないのは当然という気もする。

結果として同じ見た目になるコードポイント列がたくさん存在し、入力する人にとっても優しくないし、検索を行うにしても、形が同じなのに引っかからないという事態が発生することになる*8
さらに、キーボードのキートップからは同じ形の文字の区別がよくわからないため、「正しい綴り」というものがもし存在したとしても、それを入力するのは難しい。結果的に人にも機械にとっても厳しい仕組みとなっているのが現状である。

現状の問題点まとめ

現状のエンコーディングモデルについて、L2/17-328 Script Ad Hoc Group Recommendations on Mongolian Text Modelでは次のような欠点が挙げられている。

  • モデルが非常に複雑であり、仕様が十分に定義されていない(undespecified)。結果としてテキスト表現が曖昧である(ambiguous)
  • フォントやレンダリングエンジンに非常に複雑な文脈依存ルール(contextual rule)を必要とするが、明確な仕様がない
  • そのルールでは求める表示にならない文字を直すために、大量のvariation sequencesを必要とする
  • フォントの実装や提供を行うことが非常に困難
  • 結果、異なる実装やフォントで事実上相互運用性がない
  • 相互運用性を“修正”するために、不安定な根拠の不安定なパッチ群を必要とする
  • 国際ドメイン名でサポートされることはない(同じ見た目を示す複数のコードポイント列が存在するため、セキュリティ上困難)
  • 標準的なユーザにとって、検索が非常に困難になる可能性がある(入力テキストが曖昧性をもつため)
  • 顕著なセキュリティ上の懸念がある
  • テキスト表現に含まれる音声情報はtext-to-speechにも言語分析にも実際効果的ではない

散々な言われようである。

改善の動き

さすがにこの現状ではまずいだろうと、Unicodeモンゴル文字改善のためのScript Ad Hoc Groupが作られ、改善に向けた動きが活発になっている。

L2/17-243 Script Ad Hoc report and recommendations on Mongolianにおいて、2種類の改善案が出されている。それぞれの特徴を挙げる。

1. 字形アプローチ(Graphetic approach)

  • 文字の形と振舞いを基準に、音でなく形をベースとして文字を特定する
  • あいまいさがなくなり、同じ見た目の語であればコード列が一通りに定まる。見たとおりに入力すればいい
  • 現状のモデルの根本的な再構成であり、非互換
  • 15程度の文字を新規に追加し、混乱の生じない文字については再利用する。既存の文字には変更を加えず、現状のモデルとの共存が可能
  • アラビア文字のようなcursive-joining modelでシンプルに実装できる
  • 現代モンゴル語の表記(Hudumという)にはvariation sequencesを必要としない(歴史的な文書や表記ミスを再現するためにvariation sequencesは必要ではある)
  • 音声情報を持たないため、適切な順番にソートすることが難しく、同綴異義語の区別ができない

2. 音声アプローチ(Phonetic approach)

  • 現状のモデルを全体としては維持する
  • 現在の中国標準規格と整合しやすい
  • 新規に文字は追加せず、現在のvariation selectorsの振舞を修正あるいは廃止して新しく追加するもので置き換えることによって、相互運用性を確保する
  • 現状のモデルの複雑さをほとんど引き継ぐ


字形アプローチについてはL2/17-335 [Draft] A graphetic approach for the Mongolian encoding modelで独立した草案が作成されている。
また、モンゴル文字は字形アプローチとし、モンゴル文字と統合されている他の文字(トド文字・シベ文字・満州文字)については大きく変更せず*9、全体の整合性を整えた案がL2/17-333 A mixed encoding scheme for the Mongolian blockである。

これから字形アプローチ策定者はフォントやシステム等の試験実装を作成し、それによってモンゴル文字の表現において問題があるかどうかを検査していくだろうということである。

各国の反応

さて、Script Ad Hoc Groupは字形アプローチを強く推しているのであるが、中国やモンゴル国はどのように思っているのだろうか。
2017年9月23-25日に中国のフフホトで開催されたWG2 ad hoc meeting on MongolianのレポートがL2/17-347 Mongolian Ad Hoc Report (Hohhot, Inner Mongolia)である。

この文書によると、The Mongolian Working Group (おそらく中国か?)はthe Phonetic modelを支持し、モンゴル国の代表たちもthe Phonetic modelを支持しているとのことである。Unicode Technical Committeeの代表たちはどちらのモデルがよいとは言わなかったが、モンゴル文字テキスト処理の現状を懸念していることを表明した。

どちらにせよ、現状のモデルには多数の問題があり、改善策としてどちらの方式がとられたとしても、長期目標としてはモンゴル文字テキストを交換可能かつ将来にわたってアクセス可能にすること(interchangeable and accessible for future generations)であると会議の出席者は合意している。また、この問題の解決に向けて情報(や知識)を共有したり、協働することに同意したとのことである。

中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。
標準化の会議が年一回なので、公式の規格となるのは早くても2019年のUnicode 12.0以降となる。動向に注目したい。

参考文献

モンゴル文字に関するUTCの文書
Unicodeモンゴル文字の字形(variants)について
Unicode 10.0の、現状のモンゴル文字ブロックについての説明

*1:「用字系(script)」と言った方が適切かもしれないが、記事内では基本的に「文字」で統一した。

*2:「“cake”のcと“nice”のcは発音違うから別のコード当てよう!」みたいな話で、書き分けがないのであれば同じ文字として統合する方が分かりやすいし、Unicodeの他の文字体系でもそのようになっている。

*3:「すね」2本の二重母音aiを“ai”とする方式と“ayi”とする方式がある。参考: Transliteration Schemes For Mongolian Vertical Script

*4:塩谷茂樹・中嶋善輝(2011)『大阪大学世界言語研究センター 世界の言語シリーズ3 モンゴル語』、大阪大学出版会。初版第1刷 p. 60.

*5:Variation sequenceはUnicodeのStandardizedVariants.txtである程度の標準化がなされているが、抜けがあったり、不十分であるため、ここにおいても改善の議論がある。

*6:“ayi”の方を採用するメリットとして、наймの「すね」1本のiと区別可能という面がある。

*7:第二音節以降を一律にuで転写する方式は「現代の代表的な文語辞典であるレッシング(F. D. Lessing)の辞書が採用する方式」で、一方「歴史的な経過と形態論的な配慮を紙してoとuを表記し分ける方式」は「提案者にちなんでポッペ・モスタールト(Poppe-Mostaert)方式と称され」ていて、両方式が併存しているとのことである。(河野六郎 編(2001)『言語学大辞典 別巻 世界文字辞典』、三省堂。pp. 1038-1044「蒙古文字」の項)

*8:もちろん、現状のエンコーディングで同一形状を判定できるようなルールを作る場合、そのルールはフォント依存となる。

*9:トド文字・シベ文字・満州文字モンゴル文字の派生であるが、モンゴル文字で書き分けないが異なる音を表すものについて、文字を変形したり、点等の記号を付したりして字形の区別をつくり、曖昧さをなくした(減らした)ものなので、音と文字がよく対応し、音声アプローチでも問題が少ない。

Unicodeモンゴル文字フォント一覧

モンゴル文字Unicodeフォントに関する情報が見つけづらいので、リストを作ってまとめておく。暫定公開。抜けや間違い等ありましたら情報提供お願いいたします。


(2018-03-28 追記)

↑この記事で述べた理由により、フォント間の互換性があるとは限りませんので気を付けてください。あるフォントで正しい表示になっても別のフォントでは正しく表示されない可能性があります。
下記のフォントについてはすべて同一の文字列を与えているため、正しい表示になっていないものもあるはずです。ご留意ください。
(追記終)

例文

モンゴル文字フォントの表示例を作成するのに使用した例文は、Mongolian alphabets, pronunciation and languageに倣い、世界人権宣言の文章(ここからとった)の一部を表記変換器を使ってモンゴル文字に直したものである。フォント見本については、Microsoft Word 2013によりフォントの表示を行った。

間違い等あればご指摘願います。また、さらに良い例文をご存知であればご教授ください。

Mongolian Baiti

f:id:nixeneko:20160617015731p:plain
Copyright holder: Microsoft
Author: Founder(方正), Beijing China
Availability: Bundled with Microsoft Windows Vista and later
URL: https://www.microsoft.com/typography/fonts/font.aspx?FMID=2144

Windows (Vista以降)に標準搭載されているフォント。

MongolianScript

f:id:nixeneko:20160617015758p:plain
Copyright holder: Myataviin Erdenechimeg
Availability: free download from http://www.openmn.org/index.php?nav=4&pageId=6 (included in Mongolian Script tools) or Mongolian Script - Хэрэглэгчийн горим (from Фонт татах)
URL: http://mongol.openmn.org
License: SIL OPEN FONT LICENSE Version 1.1

Mongol Tolbo (MT-Tolbo)

f:id:nixeneko:20160617015808p:plain
Copyright holder: Amarjargal Zeerd-Aduun Lkhamsuren
Availability: free download from the URL
URL: http://mongoltolbo.com

Mongol Sudar

f:id:nixeneko:20160617015818p:plain
Copyright holder: Amarjargal Zeerd-Aduun Lkhamsuren
Availability: free download from the URL
URL: http://mongoltolbo.com/sudar/

Almas fonts

URL: http://www.mongolfont.com/en/font/index.html
Fonts are available in ATT (only on Mac) and OpenType format.

Mongolian White

f:id:nixeneko:20160617015831p:plain
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mnglwhiteotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”

Mongolian Art

f:id:nixeneko:20160617015840p:plain
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mnglartotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”

Mongolian Writing

f:id:nixeneko:20160617015848p:plain
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mnglwritingotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”

Mongolian Title

f:id:nixeneko:20160617015857p:plain
Copyright holder: Almas Inc.
URL: http://www.mongolfont.com/en/font/mngltitleotf.html
License: “Free for individuals to use, It is not allowed to sale or provide in terms of any kinds of charges.”

Noto Sans Mongolian

f:id:nixeneko:20160617015906p:plain
Copyright holder: Google Inc.
Author: Monotype Imaging Inc.
Availability: free download from the URL
URL: https://www.google.com/get/noto/#sans-mong
License: SIL OPEN FONT LICENSE Version 1.1

Menksoft fonts

Copyright holder: Menksoft Co.,Ltd.
Availability: free download from the URL
URL: http://www.menksoft.com/site/alias__menkcms/2791/Default.aspx
License: “You may use this font to display and print content as permitted by the license terms for the product in which this font is included. You may only (i) embed this font in content as permitted by the embedding restrictions included in this font; and (ii) temporarily download this font to a printer or other output device to help print content.”

Menk Amglang Tig

f:id:nixeneko:20160617015920p:plain

Menk BudunTig

f:id:nixeneko:20160617015954p:plain

Menk Doroge Tig

f:id:nixeneko:20160617020005p:plain

Menk Egulen Tig

f:id:nixeneko:20160617020234p:plain

Menk Erihe Tig

f:id:nixeneko:20160617020243p:plain

Menk Garqag Tig

f:id:nixeneko:20160617020252p:plain

Menk Har_a Tig

f:id:nixeneko:20160617020302p:plain

Menk Hawang Tig

f:id:nixeneko:20160617020309p:plain

Menk Hvlvsvn Tig

f:id:nixeneko:20160617020317p:plain

Menk Lhundb Tig

f:id:nixeneko:20160617020330p:plain

Menk Mcdvnbar Tig

f:id:nixeneko:20160617020338p:plain

Menk Narin Tig

f:id:nixeneko:20160617020346p:plain

Menk OnqaHar_a Tig

f:id:nixeneko:20160617020353p:plain

Menk Qagan Tig

f:id:nixeneko:20160617020400p:plain

Menk Qimed Tig

f:id:nixeneko:20160617020409p:plain

Menk Qimig Tig

f:id:nixeneko:20160617020417p:plain

Menk Qingming Tig

f:id:nixeneko:20160617020423p:plain

Menk Scnin Tig

f:id:nixeneko:20160617020430p:plain

Menk Sidam Tig

f:id:nixeneko:20160617020439p:plain

Menk Svgvnag Tig

f:id:nixeneko:20160617020448p:plain

Menk Svlbiya Tig

f:id:nixeneko:20160617020456p:plain

Menk Tegus Tig

f:id:nixeneko:20160617020503p:plain

Menk Tenigun Tig

f:id:nixeneko:20160617020512p:plain

Menk Tvgvrai Tig

f:id:nixeneko:20160617020519p:plain

Menk Ujug Tig

f:id:nixeneko:20160617020526p:plain

Menk Vran Tig

f:id:nixeneko:20160617020534p:plain

Menk Vyangga Tig

f:id:nixeneko:20160617020541p:plain

Menk Xvsiga Tig

f:id:nixeneko:20160617020549p:plain

Mongol Usug

f:id:nixeneko:20160617020804p:plain
Copyright holder:
Availability: bundled in VertNote, can be downloaded for free from http://www.dusal.net/downloads/vertNote.rar
URL: http://mongol-bichig.dusal.net/243/mongol-bichgeer-bichdeg-vertnote-program.html
License:

モンゴル文字メモ帳VertNoteをインストールするとついてくる。

Code2000

f:id:nixeneko:20160617020850p:plain
Copyright holder:
Availability: A shareware demo, can be downloaded for from http://www.alanwood.net/downloads/index.html. Original web site disappeared.
License: Shareware

Unicodeフォント。公式サイト消滅。

Orhon fonts

Copyright holder:
Availability: bundled in VertNote, can be downloaded for free from https://github.com/orhoncms/orhoncms/tree/master/wp-content/languages/fonts
URL: http://www.orhoncms.org/
License:

OrhonChaganTig

f:id:nixeneko:20160617020904p:plain
モンゴル文字CMSシステムの付属書体。詳細不明。

おまけ

Abkai fonts

Abkai Xanyan (太清白体)

f:id:nixeneko:20160617020653p:plain
Copyright holder: Abkai.net?
Availability: free download from 满文字体 « 太清网
URL: http://abkai.net/core/zh/
License: “Abkai fonts and keyboards are offered free of charge to everybody for personal non-commercial use.”

満州文字・シベ文字・ダウール文字用フォント。
MS Word 2013ではうまく表示されなかった。他にもいくつかフォントがあるがそれも同様。どのようにすれば正しく表示されるのだろうか? あるいは、満州文字・シベ文字・ダウール文字用フォントのため、モンゴル文字には対応していない?
(20150701追記: 覗いてみたら、モンゴル文字でしか使わない文字にはモンゴル文字のグリフが入ってなかったので、モンゴル文字には対応してないようだ)

ネット閲覧可能な(モンゴル文字による)モンゴル語資料

現代日本でモンゴルというと普通はモンゴル国のことを指し(中国の内蒙古と区別して外モンゴルという)、モンゴル国ではソ連の影響でモンゴル語を表記するのに主にキリル文字を用いる。現代日本においてモンゴル語に関する出版物の多くはキリル文字によるものである。

一方で中国内の内モンゴルモンゴル語の表記使われている文字はモンゴル文字というシリア文字の系統の文字である。

現代日本で出版されているモンゴル文字表記のモンゴル語を扱った書籍は多くないが、第2次世界大戦以前にもモンゴル文字表記による語学書が出版されていた。それらの一部はすでに著作権が切れており、ネット経由で閲覧できる。

この記事では主に国立国会図書館デジタルコレクションのモンゴル文字関連の書籍を調べ、そのリストを作成した。恐らく漏れがあるだろうと思う。もしご存知の情報があれば、情報提供を願う。

モンゴル文字表記一つの指標となるのが出版年である。外モンゴルモンゴル文字が廃止されキリル文字表記が採用されたのは1942年であるとのことで、1940年代前半頃までに出版された書籍はモンゴル文字によるものだろう。モンゴル文字に関する情報を調べる際の参考にされたい。

(2022-05-29追記)
国立国会図書館デジタルコレクションの送信資料について、個人送信が提供開始されたのでそれへのリンクを追加する。本人確認を伴う利用者登録およびログインをすることで閲覧可能になる。

辞書類

陸軍省編『蒙古語大辞典』

この辞書については http://www.cneas.tohoku.ac.jp/staff/hkuri/06.pdf も参照。

大阪外国語学校蒙古語部和蒙辞典編纂会『和蒙辞典』

版がいくつか登録されている。出版年が同じ前2つは同一のものか。

蒙古研究会, 『蒙和辞典』, 1917.

モンゴル語-ロシア語-フランス語辞書

Осип М. Ковалевский, «Монгольско-русско-французский словарь», 1844.

オシップ・コワレフスキーによるモンゴル語-ロシア語-フランス語辞書。全3巻。陸軍省編『蒙古語大辞典』の元ネタの一つであるらしい。

モンゴル語-ドイツ語-ロシア語辞書

Isaak Jakob Schmidt, „Mongolisch-Deutsch-Russisches Wörterbuch“, 1835.

モンゴル語-英語辞書

Ferdinand Lessing, “Mongolian-English Dictionary”, University of California Press, 1960

五体清文鑑

御製五体清文鑑

満州語チベット語モンゴル語、ウィグル語、中国語による対照語辞典。
国立国会図書館デジタルコレクション

早稲田大学 古典籍総合データベース

教科書・文法書類

鈴江万太郎, 『実用蒙古語初歩』, 1918.
下永憲次, 『蒙古語教科書. 初級篇』, 文聖舎, 1933.
下永憲次, 『蒙古語教科書. 初級篇 草書体』, 文聖舎, 1933.
村田清平, 『蒙古語独修』, 岡崎屋書店, 1908.
下永憲次, 『日蒙會話』, 川流堂, 1932.
棈松源一, 『蒙古語独習書. 第2巻(単語及文の基礎)』, 甲文堂書店, 1937.

フランス語

Georges Soulié, « Éléments de grammaire mongole », 1903.
Louis Hambis, « Grammaire de la langue mongole écrite », 1945.

ドイツ語

Isaak Jakob Schmidt, „Grammatik der mongolischen Sprache“, 1831.

聖書

Swan and Stallybrass, “The New Testament of Our Lord and Saviour Jesus Christ”, 1846

モンゴル語聖書については次のWikipedia記事に色々かかれている:

その他・詳細不明

[蒙古語単語帳]
李 コウ, 『蒙漢満文三合』, 正蒙印書局, 1913.
汪睿昌, 伊徳欽編.『蒙文教科書』漠南景新社, 1923.
朝鮮司訳院日満蒙語学書断簡

日本語・モンゴル語満州語にハングルで振り仮名がふってある。コマ番号37-43がモンゴル語


他にも国立国会図書館デジタルコレクション及びGoogle Booksには著作権のためネット公開がされていないものが多数ある模様。

リンク

国立国会図書館デジタルコレクション

早稲田大学 古典籍総合データベース

Mongolian Dictionary Online Translation LEXILOGOS >>

Monumenta Altaica

Archive.org

国立国会図書館デジタルコレクション、図書館・個人送信資料

未整理。
送信資料は図書館で、または、利用者登録をし本人確認を済ませた日本在住の人がオンラインで閲覧できる資料。

辞書

教科書その他

モンゴル文字簡易翻字ブックマークレット

nixeneko.hatenablog.com
これ、色々応用できるのでは、ということで、Unicodeモンゴル文字ラテン文字に1:1で変換して表示するというものを作ってみた。
ブラウザのブックマークレットとして動くJavascriptプログラムです。文字の対応に変なところがあったら教えてください。

Firefox だとTwitterとか一部のサイト(Content Security Policyが設定されたサイト)でブックマークレットを実行するには設定を変える必要があるそうです。

コード

alert 版

(function(){
m={0x9:"[TAB]",0x20:" ",0x1802:",",0x1803:".",0x1804:":",0x180A:"-",
0x180B:"[FVS1]",0x180C:"[FVS2]",0x180D:"[FVS3]",0x180E:"[MVS]",
0x200C:"[ZWNJ]",0x200D:"[ZWJ]",0x202F:"[NNBSP]",
0x1810:"0",0x1811:"1",0x1812:"2",0x1813:"3",0x1814:"4",
0x1815:"5",0x1816:"6",0x1817:"7",0x1818:"8",0x1819:"9",
0x1820:"a",0x1821:"e",0x1827:"ē",0x1822:"i",0x1823:"o",
0x1824:"u",0x1825:"ö",0x1826:"ü",
0x1828:"n",0x1829:"ŋ",0x182A:"b",0x182B:"p",0x182C:"q",
0x182D:"γ",0x182E:"m",0x182F:"l",0x1830:"s",0x1831:"š",
0x1832:"t",0x1833:"d",0x1834:"č",0x1835:"ǰ",0x1836:"y",
0x1837:"r",0x1838:"v",0x1839:"f",0x183A:"k",0x183B:"ķ",
0x183C:"c",0x183D:"z",0x183E:"h",0x183F:"ř",0x1840:"lh",
0x1841:"zh",0x1842:"ch"};

s="";
[...document.getSelection().toString()].forEach(function(v,i,a){
    c = v.codePointAt(0);
    if(c in m){
        s += m[c];
    }else{
        t = v.codePointAt(0).toString(16).toUpperCase();
        s += "U+" + Array( Math.max(0,4-t.length)+1 ).join("0") + t + ";";
    }
});
alert(s);
})();

ブックマークレット用リンク: MongolianInspector(Alert)

console.log 版

(function(){
m={0x9:"[TAB]",0x20:" ",0x1802:",",0x1803:".",0x1804:":",0x180A:"-",
0x180B:"[FVS1]",0x180C:"[FVS2]",0x180D:"[FVS3]",0x180E:"[MVS]",
0x200C:"[ZWNJ]",0x200D:"[ZWJ]",0x202F:"[NNBSP]",
0x1810:"0",0x1811:"1",0x1812:"2",0x1813:"3",0x1814:"4",
0x1815:"5",0x1816:"6",0x1817:"7",0x1818:"8",0x1819:"9",
0x1820:"a",0x1821:"e",0x1827:"ē",0x1822:"i",0x1823:"o",
0x1824:"u",0x1825:"ö",0x1826:"ü",
0x1828:"n",0x1829:"ŋ",0x182A:"b",0x182B:"p",0x182C:"q",
0x182D:"γ",0x182E:"m",0x182F:"l",0x1830:"s",0x1831:"š",
0x1832:"t",0x1833:"d",0x1834:"č",0x1835:"ǰ",0x1836:"y",
0x1837:"r",0x1838:"v",0x1839:"f",0x183A:"k",0x183B:"ķ",
0x183C:"c",0x183D:"z",0x183E:"h",0x183F:"ř",0x1840:"lh",
0x1841:"zh",0x1842:"ch"};

s="";
[...document.getSelection().toString()].forEach(function(v,i,a){
    c = v.codePointAt(0);
    if(c in m){
        s += m[c];
    }else{
        t = v.codePointAt(0).toString(16).toUpperCase();
        s += "U+" + Array( Math.max(0,4-t.length)+1 ).join("0") + t + ";";
    }
});
console.log(s);
})();

ブックマークレット用リンク: MongolianInspector(Console)

モンゴル文字とUnicode

調べたのでまとめる。


モンゴル文字は主にモンゴル語を表記するための文字であり、中国内の内モンゴル自治区で使われる。一方でモンゴル国内では一般にキリル文字表記が使われている。

ここではモンゴル語表記の場合についてを書き、モンゴル文字から派生したトド文字、シベ文字、満州文字等については省略する。

特徴

  • 左縦書き。つまり縦書き(上→下)で、かつ行は左→右へ書く(日本語と逆)
  • 語頭形(及び独立形)・語中形・語末形をもち、語のどの位置に書かれるかによって文字の形が異なる。また、それ以外にも特別な別形を持つ文字がある(10種持つ文字もあるらしい)。
  • 単語は空白で区切られるが、単語の中にも空白(字空け)が現れうる。
  • 宗教的なテキストのために、サンスクリット語チベット語表記用の文字が追加されている。
  • チベット数字を元にした独自の数字をもつ。縦書き中でも左→右に横書きされるらしい*1。最近は回転させて文の流れる向きに合わせることも多いらしい。
  • 独自のperiod, comma , colon をもつ。また点4つの記号で章末を表す。他にも、BIRGA は一節(passage)の始まりやフォリオの表面(the recto side of a folio)の始まりを示すものらしい。

Unicode

Unicode 3.0 で追加された。コードブロックは U+1800-U+18AF 。

コード表は次を参照。

文字のみが符号化されており、それの語の位置によって変化した形(“presentation forms”)は収録されていない。

о(o) と у(u) はどの位置でも同じ形であるにもかかわらず別々のコードポイントが与えられている。 ө(ö) と ү(ü) についても同様。


特殊な formatting characters が表記に使用される。

  • U+180B MONGOLIAN FREE VARIATION SELECTOR ONE
  • U+180C MONGOLIAN FREE VARIATION SELECTOR TWO
  • U+180D MONGOLIAN FREE VARIATION SELECTOR THREE
    • FVSとも。 contextual shaping of letters に作用する。前につくグリフの形を変える。視覚表現なし。
    • Unicode Character Database の Standardized Variants に有効なFVS付きの文字のリストがある。
  • U+180E MONGOLIAN VOWEL SEPARATOR
    • MVS とも。語末の a e の直前に挿入され、前後の文字を特別な形に変える。狭い空白をもつ。
  • U+202F NARROW NO-BREAK SPACE
    • 接尾辞がつけられる際に、単語本体と小さな空白で区切られる場合に挿入され、空白を内に含む語を構成する。前後の文字の glyph 選択に影響する。
  • U+200C ZERO WIDTH NON-JOINER (ZWNJ)
  • U+200D ZERO WIDTH JOINER (ZWJ)
    • 独立/語頭/語中/語末形を指定して表示するために使用可能である。
    • ZWJの直前の文字がモンゴル文字でないと(少くともWindowsでは)レイアウトエンジンがうまく動かないようであり、Wikipediaのページの表においては語中・語末形はその前に FVS1 を挿入することで表示していた。
独立 語頭 語中 語末
実際の表示 ᠠ‍᠋‍ᠠ‍ ᠋‍ᠠ
Unicode 1820 1820 200D 180B 200D 1820 200D 180B 200D 1820
説明 A A ZWJ FVS1 ZWJ A ZWJ FVS1 ZWJ A
  • 語頭-語中-語末形の表示には、 U+180A MONGOLIAN NIRUGU ( ᠊ ) を使うこともできる。アラビア文字で Kashida を使って表示するのに近いか。複合語の結合用のハイフンとしてとも使えるらしい。
独立 語頭 語中 語末
実際の表示 ᠠ᠊᠊ᠠ᠊ ᠊ᠠ
Unicode 1820 1820 180A 180A 1820 180A 180A 1820
説明 A A NIRUGU NIRUGU A ZWJ NIRUGU A

Presentation Forms

次のページを元に作成

ただし、2016年2月18日現在 StandardizedVariants.html には問題があるため、改善案が議論されている。


独立/語頭/語中/語末形のそれぞれの形と、FVSを適用した Standardized Variants である。 Unicodeの Standardized Variants に定義されていない欄についてはグレーアウトしている。モンゴル語以外のものは省いた。フォントの対応との間に一部ずれがある。これは Standardized Variants 側が不適切な状態となっているためで、改訂作業が行われている。

Vowels
LetterUnicodeIsolateInitialMedialFinal
A1820ᠠ‍᠋‍ᠠ‍᠋‍ᠠ
1820 180Bᠠ᠋᠋‍ᠠ᠋‍᠋‍ᠠ᠋
1820 180C᠋‍ᠠ᠌‍‍
E1821ᠡ‍᠋‍ᠡ‍᠋‍ᠡ
1821 180Bᠡ᠋‍‍᠋‍ᠡ᠋
I1822ᠢ‍᠋‍ᠢ‍᠋‍ᠢ
1822 180B᠋‍‍ᠢ᠋‍‍
O1823ᠣ‍᠋‍ᠣ‍᠋‍ᠣ
1823 180B᠋‍ᠣ᠋‍᠋‍ᠣ᠋
U1824ᠤ‍᠋‍ᠤ‍‍᠋‍ᠤ
1824 180Bᠤ᠋
OE1825ᠥ‍᠋‍ᠥ‍᠋‍ᠥ
1825 180B᠋‍ᠥ᠋‍᠋‍ᠥ᠋
1825 180C᠋‍ᠥ᠌‍
UE1826ᠦ‍᠋‍ᠦ‍᠋‍ᠦ
1826 180Bᠦ᠋᠋‍ᠦ᠋‍᠋‍ᠦ᠋
1826 180C᠋‍ᠦ᠌‍
EE1827ᠧ‍᠋‍ᠧ‍᠋‍ᠧ
備考

  • EEは外来語の表記に用いる。Eと異なりAと区別することができる。
  • O[FVS1]の語末形᠋‍ᠣ᠋は外来語に用いる。

Consonants
LetterUnicodeIsolateInitialMedialFinal
N1828ᠨ‍᠋‍ᠨ‍᠋‍ᠨ
1828 180Bᠨ᠋‍᠋‍ᠨ᠋‍
1828 180C᠋‍ᠨ᠌‍
1828 180D᠋‍ᠨ᠍‍
NG1829ᠩ‍᠋‍ᠩ‍᠋‍ᠩ
B182Aᠪ‍᠋‍ᠪ‍᠋‍ᠪ
182A 180B᠋‍ᠪ᠋
P182Bᠫ‍᠋‍ᠫ‍᠋‍ᠫ
Q182Cᠬ‍᠋‍ᠬ‍᠋‍ᠬ
182C 180Bᠬ᠋ᠬ᠋‍᠋‍ᠬ᠋‍᠋‍ᠬ᠋
182C 180C᠋‍ᠬ᠌‍
182C 180D᠋‍ᠬ᠍‍
G182Dᠭ‍᠋‍ᠭ‍᠋‍ᠭ
182D 180Bᠭ᠋ᠭ᠋‍᠋‍ᠭ᠋‍᠋‍ᠭ᠋
182D 180C᠋‍ᠭ᠌‍᠋‍ᠭ᠌
182D 180D᠋‍ᠭ᠍‍
M182Eᠮ‍᠋‍ᠮ‍᠋‍ᠮ
L182Fᠯ‍᠋‍ᠯ‍᠋‍ᠯ
S1830ᠰ‍᠋‍ᠰ‍᠋‍ᠰ
1830 180B᠋‍ᠰ᠋
1830 180C᠋‍ᠰ᠌
SH1831ᠱ‍᠋‍ᠱ‍᠋‍ᠱ
T1832ᠲ‍᠋‍ᠲ‍᠋‍ᠲ
1832 180B᠋‍ᠲ᠋‍
D1833ᠳ‍᠋‍ᠳ‍᠋‍ᠳ
1832 180Bᠳ᠋‍᠋‍ᠳ᠋‍᠋‍ᠳ᠋
CH1834ᠴ‍᠋‍ᠴ‍᠋‍ᠴ
J1835ᠵ‍᠋‍ᠵ‍᠋‍ᠵ
1835 180B᠋‍ᠵ᠋‍
Y1836ᠶ‍᠋‍ᠶ‍᠋‍ᠶ
1836 180Bᠶ᠋‍᠋‍ᠶ᠋‍
1836 180C᠋‍ᠶ᠌‍
R1837ᠷ‍᠋‍ᠷ‍᠋‍ᠷ
W1838ᠸ‍᠋‍ᠸ‍᠋‍ᠸ
1838 180B᠋‍ᠸ᠋
F1839ᠹ‍᠋‍ᠹ‍᠋‍ᠹ
K183Aᠺ‍᠋‍ᠺ‍᠋‍ᠺ
KH183Bᠻ‍᠋‍ᠻ‍᠋‍ᠻ
TS183Cᠼ‍᠋‍ᠼ‍᠋‍ᠼ
Z183Dᠽ‍᠋‍ᠽ‍᠋‍ᠽ
HA183Eᠾ‍᠋‍ᠾ‍᠋‍ᠾ
ZR183Fᠿ‍᠋‍ᠿ‍᠋‍ᠿ
LH1840ᡀ‍᠋‍ᡀ‍᠋‍ᡀ
ZHI1841ᡁ‍᠋‍ᡁ‍᠋‍ᡁ
CHI1842ᡂ‍᠋‍ᡂ‍᠋‍ᡂ

この他にいくつか、子音と母音との特別な合字形をもつものがある。
例として、

Ligature forms
LetterUnicodeIsolateInitialMedialFinal
BO(BUも同形)182A 1823ᠪᠣᠪᠣ‍᠋‍ᠪᠣ‍᠋‍ᠪᠣ
BÖ(BÜも同形)182A 1825ᠪᠥᠪᠥ‍᠋‍ᠪᠥ‍᠋‍ᠪᠥ
PO(PUも同形)182B 1823ᠫᠣᠫᠣ‍᠋‍ᠫᠣ‍᠋‍ᠫᠣ
GÖ(GÜも同形)182D 1825ᠭᠥᠭᠥ‍᠋‍ᠭᠥ‍᠋‍ᠭᠥ

縦書きについて

MS Office 2007 Word 以降であれば左縦書きが可能。

MS Word 2013 で設定する場合は、メニューの「ファイル」→「オプション」から「Word のオプション」ダイアログを開き、「言語」タブの「編集言語の選択」セクションで「[他の編集言語を追加]」プルダウンボックスから「モンゴル語 (伝統的なモンゴル文字、中国)」を選び「追加(A)」ボタンを押し、「OK」を押してダイアログを閉じる。すると再起動を促されるのでWordを再起動する。再起動後、リボンの「ページレイアウト」の「ページ設定」内「文字列の方向」から「縦書き (モンゴル語)」が選べる様になる。

また、モンゴル語縦書メモ帳のようなものもある。


WebサイトであればCSS 3.0の writing-mode の指定により左縦書き表示ができる。
Windows 7 において、 IE, Firefox では正常な表示が可能。 Chrome はフォントの指定がちゃんとしていれば表示できるようだ。
最新の iOS ではちゃんと表示できる。
Android ではうまく表示されない。フォント設定が悪いのかもしれない。

横書き文章中では display:inline-block; と writing-mode を指定すれば縦にした表示が可能。 Wikipedia で使用されていたCSSを次に示す。

display: inline-block;
font-weight:normal;
font-family:'Menk Hawang Tig', 'Menk Qagan Tig', 'Menk Garqag Tig', 'Menk Har_a Tig', 'Menk Scnin Tig', 'Mongolian BT', 'Mongolian Baiti', 'Mongol Usug', 'MongolianScript', 'Code2000', 'Menksoft Qagan';
font-size: 1.5em;
line-height: 1em;
writing-mode: vertical-lr;
-webkit-writing-mode: vertical-lr;
-o-writing-mode: vertical-lr;
-ms-writing-mode: tb-lr;
writing-mode: tb-lr;
vertical-align:top;

モンゴル文字の ISO 15924 コードは Mong である。
HTML 等の lang 指定は、IETF言語タグ(IETF言語タグ - Wikipedia)に従って“モンゴル語モンゴル文字表記” mn-Mong あるいは主に中国国内で用いられるため mn-Mong-CN とするといいのかもしれない。

フォント

最近のOSなら最初からインストールされている。

フリーで公開されているものもある。


Microsoftモンゴル文字フォント作成のための情報を提供している。(でも最終更新が2002年と古い…)

参考

電子辞書

*1:Unicode Standard https://www.unicode.org/versions/Unicode10.0.0/ch13.pdf によると、“The Mongolian and Todo scripts use a set of ten digits derived from the Tibetan digits. In vertical text, numbers are traditionally written from left to right across the width of the column. In modern contexts, they are frequently rotated so that they follow the vertical flow of the text.”とのことであるが、実例をみてないため、詳細不明。普通文中ではアラビア数字でなければ数詞は文字で書くようだ。仏典に用例があったりするのだろうか?