にせねこメモ

はてなダイアリーがUTF-8じゃないので移ってきました。

サブセットWebフォントを作成する(Font Squirrel Webfont Generator)

自作や自由ライセンスのフォントなど、Webフォントとして使いたいが、そのままでは容量が大きくて使いづらいことがしばしばあります。

ここで、元々のフォントに含まれている文字の中から実際に必要なものだけを取り出したサブセットフォントを作成すれば、Webフォントを使用しつつその容量を小さくすることができます。その為のソフトやサービスもあります:

などです。

しかし、これらは生成されたフォントにOpenType機能を残さないらしく、例えば「ㇷ゚」(小書きのフに半濁点)などの単独のコードポイントによって表現できない文字が適切に表示できません。
f:id:nixeneko:20150429222557p:plain
これは M+Web FONTS Subsetter で作成したWebフォントですが、赤で示した字が適切に表示できていません。

Font Squirrel Webfont Generator

そこで、 Font Squirrel の Webfont Generator を使うとOpenType機能を残したままフォントのサブセット化ができる様です。

www.fontsquirrel.com

使い方

基本的に見れば分かると思います。

f:id:nixeneko:20150429215426p:plain

  • “Upload Fonts”をクリックしアップロードするフォントを選択します。
  • “Expert...”を選択、すると細かい設定のためのフォームが表示されます


f:id:nixeneko:20150429215504p:plain
Subsetting: で“Custom Subsetting...”を選択します。


f:id:nixeneko:20150429215609p:plain
サブセットする文字を設定するためのフォームが表示されるので、サブセット後に残す文字を指定します。
今回は Single Characters にサブセット後のフォントに残す文字を入力しました。
するとSubset Preview に、サブセットに含まれる文字の一覧が表示されます。


f:id:nixeneko:20150429215657p:plain

  • OpenType Features の Keep All Features を選択します。(あるいは、必要な機能だけを Comma Feature List に書きます)
  • Agreement の Yes, the fonts I'm uploading are legally eligible for web embedding. にチェック
  • Download Your Kit をクリックするとサブセットされたフォントがダウンロードされます(数分から数十分かかるようです)


f:id:nixeneko:20150429222620p:plain
作成されたサブセットフォントではこのように正しく表示されていることがわかります。

参考になるかもしれないサイト

Font Squirrel の Webfont Generator は半手動でサブセットフォントフォントを作成できますが、動的に書き出したいときなど、次のようなページが参考になるかもしれません。

「、」「。」を「,」「.」で表示するフォントをつくる

概要

「、」「。」の文字を「,」「.」の形で表示するフォントを ttx を使って作成し、句読点として「、」「。」を使った文章を、文字列の情報に変更を加えないままで「,」「.」で表示できるようにする。

モチベーション

理系では日本語で論文を書く時には、読点としてカンマ「,」、区点としてピリオド「.」を用いることが通例である。しかし日本語入力のデフォルトはテンマルであって、カンマピリオドを使う場合はIMEの設定を変えるか、入力するキーを変える必要がある*1
私は普段パソコンで文章を書く時はテン・マル「、」「。」を使っており、カンマピリオドを使うためにわざわざ切替えるのは面倒である。そのため、最終的にカンマピリオドで文章を出力しなければならないとすると、文章の中のテンマルをカンマピリオドに置換する必要がある。

そこで、「、」「。」の文字コードをカンマピリオドで表示するようなフォントを作成することができれば、フォントをそれに置き換えるだけで、テンマルがカンマピリオドに置換された様に見える。以下では「、」「。」の文字コードをカンマピリオドで表示するようにフォントを改変する方法について述べる。

やること

今回はフォントの中の cmap を変更した。 cmap とは文字コードをフォント内のグリフで表示するために使われる、Unicode値からフォント内のグリフの内部IDへの割当てである。この割当てを変更すれば、表示されるグリフを変えることができる。

今回関係がある文字とUnicodeの値は以下のようになっている。

U+3001 IDEOGRAPHIC COMMA
U+3002 IDEOGRAPHIC FULL STOP
U+FF0C FULLWIDTH COMMA
U+FF0E FULLWIDTH FULL STOP

U+3001で表示されるグリフをコンマのものに、U+3002で表示されるグリフをピリオドのものに変更できればよい。

用意するもの

今回は、IPAex明朝に ttx を使って変更を加えることにする。今回はWindowsにて行ったが、MacLinuxでも同様にできるはずである。

手順

ttxファイルの作成

コマンドプロンプトでIPAex明朝のフォントファイルと同じディレクトリに移動し、以下のようにコマンドを実行する。

ttx ipaexm.ttf

すると、 ipaexm.ttx ファイルができあがる。これはttfファイルに含まれる情報をテキストベース記したXMLファイルで編集が容易であり、同じ ttx コマンドによってttfファイルに戻すことができる。

ttxファイルの編集

このttxファイルをテキストエディタなどで開く。すると、

      <map code="0xff0c" name="aj636"/><!-- FULLWIDTH COMMA -->
      <map code="0xff0e" name="aj637"/><!-- FULLWIDTH FULL STOP -->

と書かれている部分がある。ここから、「,」(0xff0c)のグリフは“aj636”、「.」(0xff0e)のグリフは“aj637”に結びつけられていることわかる。

また、別のところに次のように書かれている部分がある。(一箇所だけではない)

      <map code="0x3001" name="aj634"/><!-- IDEOGRAPHIC COMMA -->
      <map code="0x3002" name="aj635"/><!-- IDEOGRAPHIC FULL STOP -->

これを次のように変更する。

      <map code="0x3001" name="aj636"/><!-- IDEOGRAPHIC COMMA -->
      <map code="0x3002" name="aj637"/><!-- IDEOGRAPHIC FULL STOP -->

要するに、「、」(0x3001)「。」(0x3002)の文字コードに対して「,」「.」のグリフを示すように変更している。
この変更をファイル内の別の部分についても行う。(自分がやった時には三箇所あった)

変更した後に保存する。

ttfファイルの生成

ttx ipaexm.ttx

を実行すると ipaexm#1.ttf などの名前でフォントファイルが生成され、これが求めるフォントファイルである。
これを普通のIPAex明朝のフォントファイルと置換えるとテンマルがコンマピリオドで表示されるようになる。

まとめ

  • 「、」「。」の文字を「,」「.」の形で表示するフォントを作成する方法を示した。句読点として「、」「。」を使った文章を、文字列の情報に変更を加えないままで「,」「.」の図形で表示できるようになった。
  • この方法によって作成したフォントを埋め込んだPDFでは、画面上では「,」「.」として表示されるが選択してコピーしテキストエディタなどに貼り付けると「、」「。」となる文字が存在する。これは文字コードとしては「、」「。」を保持しているからで、このことが問題になる場合もあるかもしれない。
  • フォントを改変することになるので、フォントのライセンスによってはこの方法は使用することができない。
  • (2015/02/10追記)「、」と「,」および「。」と「.」の形を区別して使っているテキストには用いることができない。句読点以外に使われる例もあり、注意が必要

*1:親指シフト(NICOLA)では「、。」と「.,」は別キーに割り当てられていて打ち分けることができる。また漢直入力用のソフトである漢直Winではモード切替で「、。」と「,.」の入力を切替ることができる

Linux版AFDKOのダウンロード

Linux版AFDKOがどこでダウンロードできるかわからなかったのでメモ。

(a) http://www.adobe.com/devnet/opentype/afdko.html
(b) http://www.adobe.com/devnet/opentype/afdko.edu.html
Linux版のダウンロードリンクがある。
一方、
(c) http://www.adobe.com/jp/devnet/opentype/afdko.html
(d) http://www.adobe.com/jp/devnet/opentype/afdko.edu.html
からはLinux版はダウンロードできない。(ややこしい)

(日本で&日本語環境で)AFDKOでググって一番上に出るのが(c)。
(日本語)Macで(a)や(b)にアクセスしたところ、(d)に飛ばされた。
Macの場合、(d)のページのフッタの下部にある「日本」の右の(変更)をクリックしてChoose Region的な所からUnited Statesを選択すれば(b)にアクセスでき、そこからLinux版がダウンロードできる。
Linux及びWindowsからは(a)にアクセス可能。

どうやら、日本サイトからはダウンロードできないということの様でした。

(2017-09-21追記)
2014年当時とはページ構成が変わっている。
公式からダウンロードできない場合は、GitHubのリリースページを参照するといいらしい。
https://github.com/adobe-type-tools/afdko/releases

簡体字フォントセミナー「中国の文字、いろいろと。」に行ってきた。

4/27日の劉慶さんの簡体字フォントセミナー「中国の文字、いろいろと。」を聞いてきました。
以下メモを起こしたものです。まとまってない上、勘違い等あるかもしれません。間違い等あれば突っ込んでください。

紹介

  • 劉慶(りゅう けい、 英語名は Eric Q. LIU)
  • 北京语言大学卒……HSK(汉语水平考试で有名)

1. 今の中国、どんな文字をつかっているの?

  • 中国教育部言語白書によると、多民族(56)、多言語(80)、多文字(30)
  • 漢民族が91.5%を占める。
  • 方言……七大方言区
  • 北方官話…英語のMandarin
  • 回族(ムスリム)、満州族(満州語母語話者5人以下?)以外の民族はそれぞれの言語をもっている。
  • 普通話でコミュニケーションできる人が全体の53%
  • 規範字を書ける人が95%(→話すより書く方が通じる)
  • 拼音ができる人が68%

f:id:nixeneko:20140506163951p:plain

筆画の名前

  • 筆画名はUnicodeに入っている。
    • (U+31C7 CJK STROKE HP)のHPは 横 héng 撇 piě のこと。
    • (U+31CC CJK STROKE HPWG)は 横 héng 撇 piě 彎 wān 鈎 gōu

漢字の書き順(規範): 「札」順

1 2 3 4 5

の様に対応(4は点か右払い、5はその他)させ、数字を並べることで書き順を示している。

デモ

iPhone中国語入力に「汉语笔画」入力法というものがあり、書き順通りに入力すると漢字が入力できる。(どれにすればいいか分からない時には「*」を押す)
書き順を覚えていないと入力できないので、漢字を忘れて書けなくなることがなくなるかも?


フォントデザイン

f:id:nixeneko:20140506164747p:plain

  • 「亡」の左下、日本の漢字だと曲げるが、中国だと折れる。
  • 「心」の右上の2つの点が、日本では四角いスペースを囲うように配置されているが、中国では平行に並べられている。(日本の漢字はスペースの処理をしすぎ)
  • 「町」、日本では『田』が大きく、『丁』が『田』より下にくるが、中国では『田』は偏なので小さく、『丁』の上が『田』の上の線と同じ位か上にくる。

まとめ

  • 中国では「中国語」という言葉はない
  • 簡体字は中国だけではない(シンガポールもGBを使っている)
  • 中国は簡化字だけではない
  • 漢字を書こう!

2.「規範漢字」とは?

  • 正式な漢字とそうでないものの呼び方について、繁简、正异(異)、正斜などがある。


(字体の年表)

  • 時代劇などで諸葛孔明が楷書を書いているとおかしい。三国志の時代は隷書のはず。イスもない。
  • よく使われる漢字388字のうち、12%の字は秦より前に出ていた。
  • 秦・漢で16%
  • 元で18%
    • 簡化字を定めたのは1950年代ころだが、字自体は古くからあった。

漢字改革への道

  1. 定形…異体字
    • 簡体字
      • 第一批异体字整理表 1955
      • 汉字简化方案 1956
      • (二簡字(第二次汉字简化方案(草案))は廃案)
      • 简化字总表 1964, (1977), 1986
    • 字形問題
      • 印刷通用汉字字形表 1965 →新字形とよばれる
  2. 発音
    • 普通话异读词审音表 1985
  3. 定義 → 辞書
    • 辞源、辞海、新华字典、现代汉语词典、汉语大辞典 など
  4. 定量
    • 现代汉语常用字表 1988
    • 现代汉语通用字表 1988
  5. ローマ字
    • 汉语拼音方案 1958
      • ISOにもなっている
      • (拼音ピンイン。おとをつづる、の意)
  • 50年代と80年代に漢字改革が主に行われている
  • 日本では……
  • 中国は、現在では、新しい字(元素記号など)をつくる時は、台湾と相談するようになった。
古代の文字改革
  • 甲骨文字、金文、大篆、小篆、隷書、楷書
    • などとあるが、小篆とそれ前をまとめて古代文字という。
  • 秦の始皇帝が文字統一を行い、大篆から小篆に文字を変えた(「書同文、車同軌、統一度量衡」)
    • 同じ文字の部首のスタイルを統一(はさむかどうか、など)
    • 部首の位置を確定
    • 異った上首をもつものを統一
    • 統一と調和のために省略したり増画したりした
  • 日本のパスポートも篆書(日本国旅券)
  • 隷変
    • 隷書の例: 乙瑛碑 153
  • 多くの文字を書く必要があったが篆書は速く書くのに向かない
    • 字体の簡略を行い実用性の向上
    • 書きやすくするように直線化と変形
  • 篆書では違う形の部品でも同じ形に統一したものがある
    • →隷書以降は一見して字源を知るのが困難に
  • 漢字の歴史の大きい節目(始皇帝の文字統一より意義が大きい)
  • 日本の紙幣には隷書が使われている。
年表もう一度
  • 1935 第一批简体字表
  • 1948 中華人民共和国
  • 1952 中国文字改革研究委员会
  • 1955 第一批异体字整理表
  • 1956 简化字方案
  • 1965 印刷通用汉字字形表
  • 1972 第二次简化字方案
  • 1986 简化字总表
  • 1988 现代汉语常用字表・现代汉语通用字表
  • 2013 通用规范汉字表
    • 通用规范汉字表の発表によってそれ以前の関連規定は廃止に。
第一批异体字整理表
  • 簡体字
  • (“;”の後は日本の新字体を示す)
    • 字の一部を残す
      • (蟲), 广(廣; 広), (錄; 録), (務), (鄉; 郷), (飛), 齿(齒; 歯), (廠)
    • 新しい会意字
      • (塵)
    • 新しい仮借(同音代替)
      • (穀), (醜), (授), (幹, 乾……ただし「乾隆」などでは乾の字を用いる)
    • 新しい形声字
      • (護), (驚), (膚)
    • 画数の少ない古字などの再利用
      • (從; 従), (雲), (淚; 涙)
    • 偏旁の代替
      • (蠟), (鐘, 鍾)
    • 偏旁部品の簡略化
      • (鄧), (觀; 観), (對; 対)
    • 草書体の楷書化
      • (書), (長), (東), (車), (傳; 伝)
      • 长の筆順は3154(左はらい→横→縦はね→右はらい)
      • 专のように、タテ→ヨコ→ハライの筆画が新しくできた。
简化字总表
  • 1986年
  • 第一表 簡化偏旁として使えない350字
    • (寶), (滅), (認)
  • 第二表 部品として使える132字
    • (愛), (長), (東)
  • 第三表 一表と部首で類推される1754字
    • (曖), (張), (陳)
    • 三表に入ってない漢字は古いままにして、無限に類推することはしない。
  • 簡化偏旁
    • 訁→讠(说 など)
      • 讠の2画目の横→縦の曲がり方は直角だが、どうしても空間が空いてしまうのでデザイナー泣かせ。
    • 爱:沒有心,如何愛?
      • 愛なのに心がない……簡体字を批判したもの
      • 蒋介石も「愛」を『爱』に近い形になっている。王羲之の書でも『心』が『一』になっているものがある。『爱』の形は昔からあった。
国家通用语言文字法

第十七条 本章有关规定中,有下列情形的,可以保留或使用繁体字、异体字:
(一)文物古迹;
(二)姓氏中的异体字;
(三)书法、篆刻等艺术作品;
(四)题词和招牌的手书字;
(五)出版、教学、研究中需要使用的;
(六)经国务院有关部门批准的特殊情况。

http://baike.baidu.com/view/129892.htm
  • 次の場合を除き簡体字を使う: (1)古蹟, (2)姓氏, (3)書法、篆刻、芸術作品, (4)手書き(看板など), (5)出版、教育、研究で必要な時, (6)政府に申請する
印刷通用汉字字形表
  • 1965年1月31日
  • 書き順を入れる
  • 文化部と中国文字改革委員会が共同作成
  • 6196字
  • 活字字形の見本
  • 文字学と印刷業界ではこの作業を「漢字の正形」とよぶ
    • 書き順もある
    • ベースは宋体の骨格
    • Unicode CJKのソース
  • 点の向き
    • (勻), , (戶; 戸)
  • 短い横棒は点
    • ,
  • 画数を減らす
    • (郞), (呂), (盜), (奧), (爭), , (奐)
  • 連筆
    • , , ,
  • その他
    • (曾), , , , , ,
  • 同じ宋体字で複数ある場合、書きやすい方をとる
  • 同じ文字なら宋体を楷書に近づける。(文字学の伝統に完全に従う訳ではない)
通用汉字规范法
  • 2013年6月5日
  • 教育部と国家語言文字工作委員会が共同で作成
  • 即日使用開始
  • 今までの関係規定は使用停止
  • 8105字
    • 一級 3500字(常用字)
    • 二級 3000字(辞書などに使う)
    • 三級 1605字(人名地名、専門用語、義務教育の漢文など)
  • コーパスと人工的作為
    • 1文字(「的」)で4%
    • 500文字で76%
    • 1000文字で89%
    • 2000文字で97%
    • 3500文字で99.2%
    • 8000文字で1000%
  • 1988 通用字表に準拠した字形を採用
    • 異体字などの対照表も載っている
「大同小異」
  • 使われる文字の差……中国-日本f:id:nixeneko:20140508190918p:plain
    • 中国本土「HSK用字」 2905字
    • 日本の旧常用漢字(と対応する簡化字) 1947字
    • 共通: 1752字
    • HSK用字のみ: 1153字
    • HSK用字のみ: 168字
  • 使われる文字の差……中国-台湾f:id:nixeneko:20140508190927p:plain
    • 中国規範字: 3500字
    • 台湾国小用字: 5021字
    • 共通: 3422字
    • 規範字のみ: 78字
    • 台湾国小用字: 1346字
  • 日本と中国の字形比較
同形同码(同形・同コード) 44.47%
微差同码(微かな差・同コード) 21.80%
简化异码(簡化字・別コード) 33.73%
  • 台湾と中国の字形比較
同形同码(同形・同コード) 47.70%
微差同码(微かな差・同コード) 15.77%
简化异码(簡化字・別コード) 36.53%
  • どちらも別コードは1/3程度
  • 同形同コードはよく使われる漢字が多い
  • 一対一対応でない所が落し穴ではあるが、プログラムによって変換ができる(例: 中文Wikipedia)
    • 台湾と中国での語彙の差
  • 大人の事情…
  • Macであれば、システムのサービスから「テキストを繁体字中国語に変換」を選ぶことで簡繁変換ができる。
  • Windowsだと中文バージョンのOfficeの、Wordにその機能がある。

3. GB規格の紹介

  • GB……国家标准(Guójiā Biāozhǔn)のGB
  • GB関連の規格はGB 2313、GBK、GB 18030を覚えておけばよい
GB2313
  • 1990年
  • 6363文字
  • 日本の JIS X 0208 と共通点が多い
GBK
  • 1993年
  • 20902文字
  • GBKのKは扩展(Kuòzhǎn)のK
    • 正式な規格ではない
  • Windows 95の内部コードだった
GB18030
  • 2005年
  • 70244文字
  • 信息技术・中文编码字符集
  • 1バイトで表せる文字: 94文字
  • 2バイトで表せる文字: GBK全てと記号類
  • 4バイトで表せる文字: CJK漢字
    • CJK漢字・拡張Aまでは強制
Adobe-GB1
  • AG1-0はGB 2312-80, GB 1988-89
  • AG1-4でCJK漢字拡張A
  • AG1-5で彝(イ)文字

詳しくは Ken Lunde “CJKV Information Processing” 参照

4. 漢字書体の提案

  • 代表的な書体
    • 楷体
    • 仿宋
    • 宋体
    • 黑体

(書体の年表)

  • 照排とは写植のこと。
  • 宋二、黑二……毛选(毛泽东选集; 毛沢東選集)のために作られた活字
  • 1960年代~70年社前半に作られた原字がずっと使われている。
  • 教科書は楷体を使う
  • 昔は科挙用に館閣体という字体があった。
  • 楷体
    • 65年の原字をそのまま使っている
    • 华文软字と呼んでいる。
  • 宋体
    • 康熙帝が「此後刻書, 凡方體稱宋體字,楷書均稱軟字」と、清刊経廠本『文献通考』改訂本の時に口頭で指示したらしい。
  • 仿宋
    • 641体(64年1月に作ったので)をそのまま使っている。新聞用。少し細い。
    • 1915 朱柏庐治家格言 を元に朱義宝が活字を作成
    • GB/T 9704-2012 「本文は必ず3号の倣宋体で組んで下さい」(他に、ヘッダは赤、番号を振るetc...)
  • 黑体
    • ←→白体
    • 日本から由来
  • 魏碑体

5. 中国語フォント

  • 报宋(新聞用)
  • 书宋(書籍用)
  • 刊宋(雑誌用)
  • 标宋(見出し用)

フォントメーカー

  • 正字
    • 中国国内メディアの九割近く、海外の中国語メディアの八割が利用
    • 北大方正电子有限公司
    • 北京大学中国文字字体设计与研究中心
    • 方正博雅宋
      • 2004年
      • 北京晚报、北京青年报など百紙
      • 平体、大きい字面、広いふところ
      • GBK/GB12345/BIG5
    • 方正兰亭黑
      • 2004年
      • 現代的骨格、広め字面、メリハリ、ファミリー展開
      • GBK/GB12345
      • Mac付属…ExtraLight, DemiBold, Heavy
    • 方正兰亭宋
      • 2003年
      • ウロコが強い、やわらかい。ファミリーはこれから
    • 方正宋刻本秀楷
    • 清刻本悦宋 2010
    • 武英殿
    • 方正苏新诗柳楷
  • 汉仪字库
    • 1993年~
    • 中国印刷科学技术研究所の小会社
    • 組込フォント
      • 羿异字库
    • 汉仪旗黑
      • ウェイトは 25, 55, 105
      • 字面大きめ、重心高め、やわらかい
    • 汉仪全唐诗
      • 扬州印刷厂
    • 汉仪秀英体
  • 华文字库
    • 常州 SinoType
    • フォント名の頭にSTがつく
    • リテールなし
    • Mac, Windows搭載
  • 中易
    • 中标电子信息技术有限公司
    • SimSun.ttf
    • 幼圆(細い丸ゴシック)
台湾形
  • ダイナラブ
    • 極太が多い
    • 簡体字もある
    • バランスは悪い
  • 文鼎字库 アーフィック
  • 应永会
    • 古籍字体のデジタル化

OS搭載フォント

Mac OS X 10.9 Maverics
  • システムフォント /System/Library/Fonts
    • システムフォントなので消すとOSが動かなくなる
    • ST~Light
    • ST~Medium
      • 华文
      • 英字がブロック体っぽい
      • 中国語付属欧文は、『a』『g』は一階建てが多い
        • →拼音のため(教育用……手書きに近い形にする)
  • フォント /Library/Fonts
    • Hei
    • Kai
    • BianKai
    • ビットマップフォントもある
    • 手書き
      • MonotypeMYuppy
      • Hannotate
      • Hanjipen
    • 全部がはじめから搭載されている訳ではなく、必要な時にオプションとしてダウンロードされる
    • XingKai
    • YuanTi
    • Wawa
    • Weikei
    • Lantinghei
    • Baoli
    • LiBian
    • ヒラギノ角ゴ簡体字
      • →システム(言語)によって表記が違う
      • 中国語では: 冬青~
Windows 8
  • SimSun
    • 全て中易
  • Microsoft YaHei 雅黑体 漢字が兰亭黑
  • NSimSun (NはNewのNで、プロポーショナル)
    • 8.1で3ウェイト(それまでは2ウェイト)。黒い。「一一」(漢字の1ふたつ)と二倍ダッシュが区別できない
    • 約物が左に寄らず、おかしい
    • 英字…Segoe UI
    • かな、約物、hintingはモノタイプ
  • Windows 中国語版オフィスをインストールするとフォントが入る
    • 丸ポップ体 彩雲体, 琥珀


「宋二」上海字模廠 60年代と骨格は同じ
メーカー(Adobe, Apple, etc)は漢字を買って、それに英字を合せている。

6. 組版についての考え

  • 中国の組版は、枡形。どう揃うか。字面は固定またはほぼ固定
  • 擺書……組版のこと(擺…ならべる)
フォントの選び方
  • 書体…簡体字より繁体字を細めに
  • 見出し…黑体、本文…宋体が基本
  • 楷体仿宋をアクセントに
  • 手書きやデザイン書体はほどほどに。
号数制
  • 1978年「上海字摸一厂」見本帳
  • 中国では号数制を使っている
  • ワープロでは換算の小数以下の端数は省いている
  • Wordのフォントサイズ指定部分ではまず号数指定が出て、その後にポイント指定が出る。号数指定では上(初号)が一番大きく、下に行くほど(八号)小さくなるが、ptだと数字が大きくなるほど大きくなる。中国でワードを教える時はまず、初号より大きい文字の出し方を教えるとか。
縦横
  • 49年 縦書き
  • 55年1月1日 光明日报が一番始めに横組みにした
  • 56年1月1日 人民日报が横組みに
    • 55年12月31日の本报啓事にて「明日から横書きになって字数が減るから本文は短く書く」とのことが書かれている。
字下げ
  • インデントは2文字分…これは鉄板
記号類
  • 中華民国1年(1919年) 11/29 請頒行新式標点符号議案
  • 漢字と数字間は4分空き
  • 約物は非常に重要
    • 英語より約物が多い
    • 中国語には分析語、文法形態を示す助詞などがないので、約物が重要
    • 曖昧さを避ける
    • 分かち書きがないので読むリズムに影響する
  • 中国語InDesign
    • 标点挤压设置…日本語の「文字組み」に対応(标点…約物)
      • デフォルトは1個しかない
  • 日本の「公用文作成の要領」のようなものが中国にもある
  • 2字下げを基本
  • 列挙は「
  • 「々」などの踊り記号は正式な文書では使用禁止
  • “一、”, “(一)”, “1.”, “(1)” の順で序列
  • GB/T 15834-2011 标点, GB/T 15835-2011 数字
    • T……推薦、強制ではない
    • 漢数字, アラビア数字
    • 千分空/千分撇
    • 「〇」と「零」
      • 九十五点零六
      • 二〇〇一年十月
    • 英数は寝かす
    • 短い数字は漢数字で
    • 点号
      • 读号 ,、;:
      • 句号 。?!
    • 标号 “ ”《》——……-―/
    • 、,;。 の順に区切れが強くなる
    • 点とコンマ……文の区切れを示すのが「,」で、「、」は列挙する時に使う。
  • 间隔号 ·
    • 外国人名などの漢字の間は中丸
    • ·」(U+00B7 MIDDLE DOT)
    • 他にも次の記号が間違って使われることがある。
      • 「•」U+2022 BULLET
      • 「.」U+FF0E FULLWIDTH FULL STOP
      • 「‧」U+2027 HYPHENATION POINT
      • 「・」U+30FB KATAKANA MIDDLE DOT
    • 欧文の直後は下丸「弗·A.巴特利特
    • 中丸はGBでは半角だが、フォントは全角でつくっているものが多い
  • 引号
    • 横書き的に “ ‘~’ ” 式
    • 漢字に合せて『「~」』式(2重が外)
      • 台湾では「『~』」
  • 连接号
  • 着重号.
    • 圏点は黒丸で、文字の下につく
  • 禁則処理
    • 开明」式(開明は出版社の名前)。文末全角、その他は半角。よく使われる。
    • 行末半角
    • 全半角
    • 縦書式
  • 亡くなった人は四角で囲む
    • …、宋永培、…
  • InDesign……号数制なし。本文5号は10.5pt

7. 混植の考え方

  • 時間都合により省略

繁体字フォントセミナー「台湾の文字、いろいろと。」に行ってきた。

柯志杰さんの繁体字フォントセミナー「台湾の文字、いろいろと。」を聞いてきました。
以下メモを起こしたものです。まとまってない上、勘違い等あるかもしれません。間違い等あれば突っ込んでください。

繁体字とは

  • 繁体字というのは簡体字に対応した名称であって元々あった漢字をわざと複雑化したものではない。台湾では正體字(正体字)と呼ばれる。日本の旧字体に近い。

台湾の字形

字形基準の政府基準

  • 常用國字標準字體表(1982)
    • 4808字。字体基準が手書きで示されている*1(そのため曖昧な部分も…)。それまでに字体の基準はなかった。甲表。
  • 次常用國字標準字體表
    • 6000字程度。乙表。
  • 甲表と乙表を併せて1万字ちょっと。

字形

康煕字典信仰が強い。

  • 「全」のいりやねは『入』で書く。「內」(内)の『入』も同様。
  • 「距」の『巨』は5画なので一番下の線は左へ突き出すが、「臨」の『臣』は(康煕字典で)6画なので左の線と下の線はあわせて一画で書き、突き出さない。
  • 「活」の『舌』の一画目ははらう。一方「舐」の『舌』の一画目ははらわない(左から右に横棒をかく)。
  • 「任」の『壬』の一画目ははらわず横棒。「廷」の『壬』ははらう。「程」の『壬』もはらう。『壬』の横向きの3本の長さが字によってばらばら。
  • 「苟」の草冠は4画で書き、横線は突き出す(⺿)。一方「敬」のものは草冠由来でないので、横線は突き出さない(⻀)。
  • 「戶」(戸)は康煕字典の形。「房」などでも同様。ただ「顧」の戸はなぜか少し違う。
    • 「雇」だと戶と同じなのに……。
  • 「冷」はにすいなので点とハネで示すが、「次」「均」のものは漢字の『二』の形に横2本で書く。
  • 「最」のひらびの真中と下の線は左右にくっつけず書く(⺜)。「冒」「塌」も同様。
  • 「朋」は『月』2つで、『月』の中は横2本で書く。「腹」はにくづきなので『月』の中は点とハネで書く(⺼)。「冑」(甲冑の冑で鎧などの意味)と「胄」(世継ぎ,あと継ぎ/血筋)は別字であり、書き分ける。
  • 「祭」はにくづきだから点とハネ、「望」はつきだから点2つで書く。
  • 「夏」の『夊』は突き出すけど、「冬」は突き出さない。「致」の旁は「夏」と同様。「收」の旁『攵』はまた別の形。

俗字を採用したもの。

楷書に由来するもの。

  • 部首を楷書の形で書くもの。
    • 「社」(旧字『社』): 『⺬』でなく『⺭』を使う。
    • 「紙」: いとへんの点の書き方は『⽷』でなく『⺯』。点の向きはすべて左上から右下に向けて。
    • 「飽」: しょくへんの形が『⻞』でなく『⻟』。
    • 「遠」: しんにょうの形が『⻍』でなく『⻎』で、4画で書く。
    • 「羽」(旧字『羽』): 『⽻』ははらい2つではなく点とハネで書く。日本と同じ形。
  • 「雪」「遲」(遅)の点々は『水』の様な向きになる形で書く。
  • 「誰」のふるとりの右上の点の向き。はらわない。
  • 「平」「妥」「曾」(曽)、「遂」の点の向き。
    • ただし「說」(説)の『兌』はそうなってない。
  • 「微」「切」「頓」の偏ははねる。
  • 「食」「今」「令」の3画目は横に書き、点ではない。
  • 「絲」(糸)のように『糸』は偏にくると左から右に3点だが右にくると『小』の様につくられる(真中の線ははねる)。一方下に部品がくるとはねなくなるが、「鷥」「彎」の様に形が異なる謎。
  • 「華」は離して書くがと「畢」はつなげる。
  • 右はらいは一つの文字につき一つ。「返」の『反』はとめる。

……というような政府基準があるが、民間では自由に使われているらしい。標準字体は国語教育以外には使われていないとか。逆に標準字体を使うと堅苦しい印象を受けるとのこと。

質問

  • 台湾の学校の漢字テストでは、突き出す・突き出さない、つける・はなす、とめる・はねるなどの区別でバツにされることはあるのか? → 先生による


台湾と日本で微妙にデザインが違うという字もある。

  • 「町」の『田』と『丁』の位置関係や「趣」の『耳』の上の線の伸び具合。

f:id:nixeneko:20140310003653p:plain

香港の字形

台湾との細かな字形の違い

  • 周告害: 飛び出ないか(台湾)飛び出るか(香港)
  • 茶條米: 離して書くか(台湾)つなげるか(香港)
  • 總: 悤のタのような部分の形
  • 形亦𢇇: はらうか(台湾)まっすぐか(香港)
  • 電: 点々の向き
  • 肅: 横棒が一画多いか(香港)そうでないか(台湾)
  • 求: はねるか(台湾)はねないか(香港)
  • 黃: 田か(台湾)由か(香港)
  • 次: 二か(台湾)⼎か(香港)
  • 於: 旁の上部がひとやねのような形になる(台湾)か旗の旁の上部のような形になるか(香港)
    • 旗などのように『方』が偏に来る場合『方𠂉』は常にセットになっているため、香港の方はそれに揃えている
  • 滋: つくりを兹でかくか(台湾)茲でかくか(香港)
    • 茲については台湾香港で共通

異体字文字コード

  • 台湾ではBig5が有名だが、これはデファクトな規格(民間規格)

台湾の文字コードの歴史

  • Haeger博士が1979年に東亜書籍を電子管理することを考えた
  • その時日本では JIS C 6226 が既に制定されていた
  • 謝清俊教授が、中国語の本が日本語で処理されるのでは? という危機感をもち、台湾の文字コード制定を政府に提案した。
    • 合言葉は「打倒JIS C 6226!」
  • 時代は中日断交=日中国交正常化中華民国国連脱退
  • 文字コード制作は極秘に行われていた
  • そして作られたのが CCCII
    • 繁体字のみならず簡体字や日本の漢字などの異体字を収録していた
    • アメリカの図書館で利用されている ANSI EACC のベースとなった。

f:id:nixeneko:20140316020022p:plain

  • CCCII は行政院の文化建設委員會の下の國字整理小組が作成したが、それを主計處が批判した。
  • 1981年 主計處が中文資訊標準碼を公開するもすぐ撤回。
    • CCCIIにキレた主計處の人が辞書から適当に1万字位拾ったとか。実用性なし。
  • 1982年 中文資訊標準交換碼(主計處)
    • 当初、標準字体表のみの約5千字
    • 2ヶ月後、附表の発表によってコードが変更になった。
    • 1983年 また変更、13053字に。
  • 1984年 Big5を業界が作る。13053文字
    • 国家規格は毎年コードが変わる!
    • 文字プレーン、区点の概念がなく、8bit符号。Shift_JISに近い形式。
    • Big5の名前はしばしば5大ソフトメーカが作ったからと言われるが、実際は5大ソフトウェア(ワープロ表計算、…)のために作られたからこの名前になったとのこと。ただしその5大ソフトウェアは作られなかった。
  • 1986年 CNS 11643
    • 戸籍などに使われる。実装としてはEUC-TWなど。Windowsには実装なし。
  • Big5の13053文字では足りない。
    • 特に人名・地名。
    • 人名には異体字が使われることが多く、標準字体表には含まれない。また台湾語の文字(毜𤆬など)が名字に使われる。先住民族は(漢字であれば)自由に名前をつけることができ、14文字の名前もある。
    • 地名は日本国字(「壽峠」の『峠』)や台湾語の文字(「坔」など)が使われる。
  • DOS時代 倚天拡張文字というメーカーが拡張文字があった。
    • 倚天はメーカーの名前
    • 漢字7文字、ひらがな、カタカナ、キリル文字、罫線要素
    • Windows(Big5-CP950), Macはこの漢字7文字については採用したが、ひらがなやカタカナは不採用
  • 台湾では今でもパソコン通信(BBS)が使われる。有名なところだとptt.ccなど
    • BBSではBig5が主流。不足した文字を補うために様々な亜種が作られた。
    • Big5-UAO
    • 中國海字集という外字集があった
  • CNS 11643
    • 漢字が9万字に。16の文字プレーン。
    • Unicode CJK の最大の規格ソース。Unicodeにない文字は18540文字。
    • 日本の国字ベトナムの漢字など全ての漢字をカバーしている。またUnicodeにある漢字は全て取り入れている。
      • そのためどれが台湾用字なのか分からなくなっている。
  • Adobe-CNS1-6
    • 現在2万字位
    • AC1, AC3, AC4, AC5, AC6の拡張はすべて香港の文字(台湾の文字が入らない!)
  • 台湾ではUnicode基準のフォントが多い
  • 人名用字は2001年まで規程なし。「姓名条例」の第2条で規定されているが、記載が曖昧なので何らかの字書に載っている字なら何でもよいらしい。包摂基準はない。
  • 民主化により、先住民族は自由な命名ができる。漢字であれば何でもよい。
フォントで使われる文字コード

主なもの

その他

  • GB5
  • GB12345
    • GB5とは逆反対に、GBのコードを入力すると繁体字が表示されるフォント。
    • 中国土産のTシャツに書いてある文字に「中國萬裏長城」
      • 「裏(裡)」も「里」も簡体字では「里」なので、GB12345で書かれたものではないか。

フォント

  • 版面は漢字だけなので濃度が均一で、ムラがない。
  • 全体的に黒くなりがち。
  • そのため、太い文字はやや小さめ。字面率を93%位までに抑える。

分類

  • 日本ではオールド、モダンなどの分け方があるが、その分け方では台湾ではほとんどがモダンになってしまう。
  • 台湾の書体を字形によって3種類に分類した
    • 伝統字形
    • 楷書化字形
    • 標準字形
  • しんにょう、竹冠、いとへんなどの形によって分類。
    • 伝統字形は伝統的な明朝体の形。標準字形は教育部が示した標準字体に従ったもの。
呼び方
  • 台湾では活版までは宋體、写植からは明體とよばれる。
  • ただし台湾政府は宋體と呼んでいる。香港や大陸でも宋體(宋体)。
  • 黑體と方體
    • 黑體はサンセリフのこと。黑體と対応するのは白體でセリフありのこと。
    • 方體は日本でいうゴシック体のこと。台湾政府もこの名前を使う。圓體(円体)が丸ゴシック。
  • 仿宋体
    • 1916年に宋刻本の書体をまねて(仿=倣)つくった書体。

書体

  • 華康(ダイナラブ)
    • 華康明體
      • 伝統字形。ファミリーになっていない
    • 華康黑體
      • 伝統字形。ファミリーになっていない。W3が儷黑であったり、太さによってエレメントが全部違う。
    • 華康儷宋
      • 楷書化字形。独特のしんにょうの形をもつ。やさしい感じ。
      • W5が通常のW7相当の太さであり、W3〜W5の間のウェイトがない。
    • 華康儷黑
      • 楷書化字形。茶の下が『木』のように繋がっている。
  • 文鼎(アーフィック)
    • 2000年から新作がほとんどない。現在は組込み用のフォントを主にやっている。
    • 文鼎明體
      • 無機質な感じ。微妙にファミリーになっている。
    • 文鼎黑體
      • 丸ゴシックがベースになっているためか角が微妙に丸くなっていたり、冖の曲がり方が気持ち悪い
      • 太いウェイトの品質が良くない
      • 文鼎黑體Uとはファミリーになっていない
    • 文鼎新黑體
      • UD系。ウェイトによってしめすへんが不統一。
  • 金梅
    • 素材集を販売している会社。筆文字系のフォントを多く出している。品質は悪い。看板でよく使われる。
    • 金梅特黑蹲腿字形
      • すべての文字に脚がついたフォント…このようなフォントもある
  • 蒙納(モノタイプ香港)
    • 蒙納宋
      • 儷宋と同じしんにょうをもつ。
    • 蒙納黑
      • 蒙納宋と同じ骨格で作られた。
    • 繁粗黑
      • たての筆画が左に突き出しを持つ。
  • 方正
    • 写植から。中国のメーカー。
    • 方正博雅方刊宋
      • 伝統字形。
    • 方正新秀麗
      • 伝統字形。なぜか簡体字版がない。
    • 方正平黑/粗黑
      • 伝統字形。なぜか簡体字版がない。
    • 方正蘭亭黑
      • 楷書化字形。Macプリインストール版(蘭亭黑)は台湾字形になっている。
  • Windows搭載書体
    • 細明體(MingLiU)
      • Vistaから標準字形に。ダイナラブ。
      • XPまで『爲』となっていたグリフがVistaから『為』となった。Unicodeとの不統一
    • 標楷體
      • 標準字形。ダイナラブ。公文書や論文に使われる。
    • 微軟正黑體
      • モノタイプ
  • Mac搭載書体
    • 黑體-繁
      • 楷書化字形。上海風。
    • 蘋果儷中黑/儷黑Pro
      • 同じ書体だがTTLからのものとダイナからのものとで違う名前になっている。
    • 蘋果儷細宋/儷宋Pro
    • 宋體-繁
      • 楷書化字形。常州華文。モノタイプに似ている。
    • OS X 10.9 での追加フォントがいろいろある。

本文書体

  • 新聞ではアーフィックの標準宋體、方正の新秀麗、アーフィックの文鼎明體M、など。
    • 蘋果日報のように本文書体にダイナの丸ゴシック(圓體)が使われているものもある。
  • 文字書はダイナの華康明體やアーフィックの文鼎明體が多い。
    • 儷宋は少ない。ウェイトが少ないからか。
  • 香港はモノタイプがほとんど
  • 台湾では引用などの部分に楷書や仿宋体が使われ、イタリックに相当する。

タイトルに使われる書体

  • 康煕字典体をタイトルに使うのが2年ほど前から流行っている。
    • 康煕字典をスキャンしたフォントが配布されている。
  • ヒラギノや小塚書体が多い。
  • フォントは足りていない!
    • Adobe-Japan1-6に含まれないBig5常用字は122字

周期表

Bopomofo, 注音符号

  • 台湾で使われる発音記号。それまでは直音法や反切法を使っていた。
  • カタカナを手本として、形は篆書から作られた
  • 日本では注音字母とよばれる場合もあるが、発音記号の様なものであり現在は通常の文字として使われないので字母とは呼ばない。
  • 入力メソッドでもあり、台湾で主流。発音をBopomofoで入力する。一般に使われるキーボード配列では左の列上からㄅㄆㄇㄈㄉㄊㄋㄌ…とBopomofo順に並んでいる(大千式)。他の配列として、音の近いアルファベットと対応付けた倚天式などがある。
  • ㄧㄨㄩ(介母)の順が一定しない。
    • 真ん中か最後
    • Big5, Unicodeでは最後
  • 香港での入力法
    • 台湾で発明された倉頡輸入法が標準。漢字をいくつかの要素に分解して入力する。分解の仕方がよくわからないものがあったり、よくわからない字形を一つのキーにまとめていたりする。
    • 言語が違うのではBopomofo入力ができないため。
  • その他の入力法
    • 嘸蝦米輸入法
    • アルファベットの形に分解して入力する。「命」はAOP、など。
  • DQN語として注音文というのがある。
    • (日本語でいう「kwsk」「gkbr」とかに近い?)
  • はじめから注音が付いた状態のフォントもある。活版でも同様のものがあった。
    • 同じ漢字でも複数の発音があるものの為に、発音の数だけフォントがある。「和」は5つある。

台湾の組版

  • 句読点は真ん中
    • 縦書き横書きで共用できる。
    • 1950年位には句読点を(振り仮名と同じように)文字の右、真横に置くという方式もあった。
    • 新青年(1919年)が句読点を真中に置いている。(が、政府に?提案したのは右につける方式だった)
    • 日本式もあるが少ない。
  • かぎ括弧も横書きでを使っていたとか。
  • “:「”や“?」”など約物が続いても詰めない。
  • コロン「:」は縦書きでも同じ向き(点が縦に並ぶ)。
  • 段落は2字下げ。
  • 禁則処理は、活版では送り出しか、そのままで組んでいた。InDesignの時代はしている。新聞社などは禁則処理しないため、「,」が上に来ることも。
  • 老貓による枡形組版復活の提案
  • 縦書き本は長体をかける
    • 長体にする人の意見によると、木版印刷明朝体が縦長であり。本文が美しくなる。モノタイプやアーフィックの書体がやや縦長で、ダイナは四角いのでそのまま組むと太く見える。
    • 長体にしない人の意見によると、長体にするのはページ数をコントロールするための技であり、行間をつめてページ数を減らせる
  • 日本語はかなや漢字の画数が少ないので小さいポイントにできる。日本語で6ptにできるものは繁体字では7.5ptにしないと読めない。
  • 真ん中の約物が厄介。
  • 日本語がうらやましい。

リンク

3月8日 繁体字フォントセミナー「台湾の文字、いろいろと。」
繁体字セミナー「台湾の文字、いろいろと。」 - Togetterまとめ

(3月10日0時 香港の字形についてなど追記)
(3月16日2時 文字コードについて追記)
(3月20日16時 フォント、組版などについて追記)
(4月09日23時 脚注としてリンク追加)
(5月08日19時 リンク追加)

マクロン付きのギリシア文字の母音にアクセントや気息記号を付けて表示する

古典ギリシャ語の初級文法では α, ι, υ の長母音を示すためにマクロンを付け(ᾱ, ῑ, ῡ)、さらにこれに気息記号やアクセント記号が付けられる場合がある。しかし、多くの環境では入力・表示ができない。技術的に可能ではあるのだが、対応しているものはほとんどない。

Unicodeで入力する

古典ギリシャ語用の合成済みギリシア文字は Unicode の Greek Extended*1 に収録されている。Unicode 1.0 では Greek Extended は含まれていなかったが、ISO/IEC 10646(の前身)とマージされるに当って整合性の為に追加されたらしい*2。 ᾱ, ῑ, ῡ はあるが、それらに気息記号やアクセントのついた形は収録されていない。そのため、それらは結合文字を使って表すことになる。

古典ギリシャ語用の結合文字は以下のものがある。ラテン文字などのダイアクリティカルマークと包摂されているものも多い。

文字 Unicode 名前 備考
̀ U+0300 COMBINING GRAVE ACCENT 重アクセント記号
́ U+0301 COMBINING ACUTE ACCENT 鋭アクセント記号
̄ U+0304 COMBINING MACRON 長音記号
̆ U+0306 COMBINING BREVE 短音記号
̈ U+0308 COMBINING DIAERESIS 分離記号
̓ U+0313 COMBINING COMMA ABOVE 無気記号
̔ U+0314 COMBINING REVERSED COMMA ABOVE 有気記号
͂ U+0342 COMBINING GREEK PERISPOMENI 曲アクセント記号
̓ U+0343 COMBINING GREEK KORONIS 融音記号(例: κἀγω(=καὶ ἔγω))。U+0300と等価
̈́ U+0344 COMBINING GREEK DIALYTIKA TONOS U+0308 U+0301と等しい。use of this charachter is discouraged
ͅ U+0345 COMBINING GREEK YPOGEGRAMMENI 下書きのイオタ

例えば ἄ にマクロンを付けたものは ᾱ̓́ (ᾱ U+1FB1, ̓ U+0313, ́ U+0301) あるいはᾱ̓́ (α U+03B1, ̄ U+0304, ̓ U+0313, ́ U+0301)などと入力することができる*3

しかし、これを正しく表示するためにはフォントの対応が必要で、ギリシャ語が表示できるフォントでもほとんど対応されてないため大抵はうまく表示できない。

フォント

表示した文章は以下。「時は労苦の医者である」(田中美知太郎・松平千秋『ギリシア語入門 新装版』よりとった)

ὁ χρόνος ῑ̓ᾱτρὸς τῶν πόνων ἐστίν.
ᾱ́ ᾱ̓̀ ᾱ̔́ ᾱ̓ ῑ́ ῑ̓̀ ῑ̔́ ῑ̓ ῡ́ ῡ̓̀ ῡ̔́ ῡ̓

New Athena Unicode, KadmosU, AttikaU, BosporosU

f:id:nixeneko:20131203205328p:plain
対応している稀有なフォントとして、 New Athena Unicode, KadmosU, AttikaU, BosporosU がある。これらは GreekKeys 2008 という有料ソフトの付属フォントらしいが、New Athena Unicodeのみ無料でダウンロードできる。GSUBによって合成済みグリフに置換しているので、‘liga’フィーチャを有効にすることで利用できる。InDesign(CS6)では言語をギリシャ語か英語にする必要があるようだった。

OldStandard (SIL OFL)

Brill (非商用無料)

Cambria (Windows 7などに付属)

基底グリフはマクロン合成済みのものを使うとうまく表示されないようだ。つまり、ᾱ̓́ (ᾱ U+1FB1, ̓ U+0313, ́ U+0301)では正しく表示されず、ᾱ̓́ (α U+03B1, ̄ U+0304, ̓ U+0313, ́ U+0301)などとしないといけないようである。

Asea

f:id:nixeneko:20131203205401p:plain
Asea は合成済みのマクロン付きグリフ自体は持ってこそいるが、結合文字には対応していない。スタイルのセット(stylistic set)として実装されていので、 ἄ などを‘ss16’フィーチャを有効にして表示するとマクロンが付いた形で表示されるようになる。同様に‘ss17’でブレーヴェ付きの形になる。InDesign(CS6)では言語をギリシャ語にしないと正常に表示されなかった。



LaTeXを使って

f:id:nixeneko:20131203223948p:plain
他の方法として、LaTeXのBabelとTeubnerパッケージを使用することで、LaTeXを使って古典ギリシャ語を含むPDFが作成できる。マクロンを含む様々な記号に対応している。

参考: LaTeXの細道・けもの道 http://a011w.broada.jp/wbaefznh35st/latex/babel110.html サンプル(pdf)

Ubuntuではaptでtexlive-lang-greekというパッケージをインストールすれば使える様だ。

まとめ

規格としては入力・表示できるけど、対応がとても悪い。古典ギリシャ語用キーボードでも普通入力できないし、フォントも対応してない。
古典ギリシャ語のマクロンは初級文法かよっぽど専門的なことでないと使わないと思うし、通常のテキストでは書かれない。このため合成済みの記号がUnicode規格に含まれていない。

これを見ると規格で一つの文字として用意されてないと実装は期待できない様に感じた。


(2017-01-09 OldStandard, Brill, ZK Mathesisを追記, サンプル画像は追々……)

*1:http://www.unicode.org/charts/PDF/U1F00.pdf

*2:この辺のいきさつについては http://www.tlg.uci.edu/~opoudjis/unicode/ken_adscripts.html に詳しい

*3:フォントによってはどちらかしか正しく表示できないものもあるので注意を要する。