読者です 読者をやめる 読者になる 読者になる

にせねこメモ

はてなダイアリーがUTF-8じゃないので移ってきました。

繁体字フォントセミナー「台湾の文字、いろいろと。」に行ってきた。

中国語 フォント 組版

柯志杰さんの繁体字フォントセミナー「台湾の文字、いろいろと。」を聞いてきました。
以下メモを起こしたものです。まとまってない上、勘違い等あるかもしれません。間違い等あれば突っ込んでください。

繁体字とは

  • 繁体字というのは簡体字に対応した名称であって元々あった漢字をわざと複雑化したものではない。台湾では正體字(正体字)と呼ばれる。日本の旧字体に近い。

台湾の字形

字形基準の政府基準

  • 常用國字標準字體表(1982)
    • 4808字。字体基準が手書きで示されている*1(そのため曖昧な部分も…)。それまでに字体の基準はなかった。甲表。
  • 次常用國字標準字體表
    • 6000字程度。乙表。
  • 甲表と乙表を併せて1万字ちょっと。

字形

康煕字典信仰が強い。

  • 「全」のいりやねは『入』で書く。「內」(内)の『入』も同様。
  • 「距」の『巨』は5画なので一番下の線は左へ突き出すが、「臨」の『臣』は(康煕字典で)6画なので左の線と下の線はあわせて一画で書き、突き出さない。
  • 「活」の『舌』の一画目ははらう。一方「舐」の『舌』の一画目ははらわない(左から右に横棒をかく)。
  • 「任」の『壬』の一画目ははらわず横棒。「廷」の『壬』ははらう。「程」の『壬』もはらう。『壬』の横向きの3本の長さが字によってばらばら。
  • 「苟」の草冠は4画で書き、横線は突き出す(⺿)。一方「敬」のものは草冠由来でないので、横線は突き出さない(⻀)。
  • 「戶」(戸)は康煕字典の形。「房」などでも同様。ただ「顧」の戸はなぜか少し違う。
    • 「雇」だと戶と同じなのに……。
  • 「冷」はにすいなので点とハネで示すが、「次」「均」のものは漢字の『二』の形に横2本で書く。
  • 「最」のひらびの真中と下の線は左右にくっつけず書く(⺜)。「冒」「塌」も同様。
  • 「朋」は『月』2つで、『月』の中は横2本で書く。「腹」はにくづきなので『月』の中は点とハネで書く(⺼)。「冑」(甲冑の冑で鎧などの意味)と「胄」(世継ぎ,あと継ぎ/血筋)は別字であり、書き分ける。
  • 「祭」はにくづきだから点とハネ、「望」はつきだから点2つで書く。
  • 「夏」の『夊』は突き出すけど、「冬」は突き出さない。「致」の旁は「夏」と同様。「收」の旁『攵』はまた別の形。

俗字を採用したもの。

楷書に由来するもの。

  • 部首を楷書の形で書くもの。
    • 「社」(旧字『社』): 『⺬』でなく『⺭』を使う。
    • 「紙」: いとへんの点の書き方は『⽷』でなく『⺯』。点の向きはすべて左上から右下に向けて。
    • 「飽」: しょくへんの形が『⻞』でなく『⻟』。
    • 「遠」: しんにょうの形が『⻍』でなく『⻎』で、4画で書く。
    • 「羽」(旧字『羽』): 『⽻』ははらい2つではなく点とハネで書く。日本と同じ形。
  • 「雪」「遲」(遅)の点々は『水』の様な向きになる形で書く。
  • 「誰」のふるとりの右上の点の向き。はらわない。
  • 「平」「妥」「曾」(曽)、「遂」の点の向き。
    • ただし「說」(説)の『兌』はそうなってない。
  • 「微」「切」「頓」の偏ははねる。
  • 「食」「今」「令」の3画目は横に書き、点ではない。
  • 「絲」(糸)のように『糸』は偏にくると左から右に3点だが右にくると『小』の様につくられる(真中の線ははねる)。一方下に部品がくるとはねなくなるが、「鷥」「彎」の様に形が異なる謎。
  • 「華」は離して書くがと「畢」はつなげる。
  • 右はらいは一つの文字につき一つ。「返」の『反』はとめる。

……というような政府基準があるが、民間では自由に使われているらしい。標準字体は国語教育以外には使われていないとか。逆に標準字体を使うと堅苦しい印象を受けるとのこと。

質問

  • 台湾の学校の漢字テストでは、突き出す・突き出さない、つける・はなす、とめる・はねるなどの区別でバツにされることはあるのか? → 先生による


台湾と日本で微妙にデザインが違うという字もある。

  • 「町」の『田』と『丁』の位置関係や「趣」の『耳』の上の線の伸び具合。

f:id:nixeneko:20140310003653p:plain

香港の字形

台湾との細かな字形の違い

  • 周告害: 飛び出ないか(台湾)飛び出るか(香港)
  • 茶條米: 離して書くか(台湾)つなげるか(香港)
  • 總: 悤のタのような部分の形
  • 形亦𢇇: はらうか(台湾)まっすぐか(香港)
  • 電: 点々の向き
  • 肅: 横棒が一画多いか(香港)そうでないか(台湾)
  • 求: はねるか(台湾)はねないか(香港)
  • 黃: 田か(台湾)由か(香港)
  • 次: 二か(台湾)⼎か(香港)
  • 於: 旁の上部がひとやねのような形になる(台湾)か旗の旁の上部のような形になるか(香港)
    • 旗などのように『方』が偏に来る場合『方𠂉』は常にセットになっているため、香港の方はそれに揃えている
  • 滋: つくりを兹でかくか(台湾)茲でかくか(香港)
    • 茲については台湾香港で共通

異体字文字コード

  • 台湾ではBig5が有名だが、これはデファクトな規格(民間規格)

台湾の文字コードの歴史

  • Haeger博士が1979年に東亜書籍を電子管理することを考えた
  • その時日本では JIS C 6226 が既に制定されていた
  • 謝清俊教授が、中国語の本が日本語で処理されるのでは? という危機感をもち、台湾の文字コード制定を政府に提案した。
    • 合言葉は「打倒JIS C 6226!」
  • 時代は中日断交=日中国交正常化中華民国国連脱退
  • 文字コード制作は極秘に行われていた
  • そして作られたのが CCCII
    • 繁体字のみならず簡体字や日本の漢字などの異体字を収録していた
    • アメリカの図書館で利用されている ANSI EACC のベースとなった。

f:id:nixeneko:20140316020022p:plain

  • CCCII は行政院の文化建設委員會の下の國字整理小組が作成したが、それを主計處が批判した。
  • 1981年 主計處が中文資訊標準碼を公開するもすぐ撤回。
    • CCCIIにキレた主計處の人が辞書から適当に1万字位拾ったとか。実用性なし。
  • 1982年 中文資訊標準交換碼(主計處)
    • 当初、標準字体表のみの約5千字
    • 2ヶ月後、附表の発表によってコードが変更になった。
    • 1983年 また変更、13053字に。
  • 1984年 Big5を業界が作る。13053文字
    • 国家規格は毎年コードが変わる!
    • 文字プレーン、区点の概念がなく、8bit符号。Shift_JISに近い形式。
    • Big5の名前はしばしば5大ソフトメーカが作ったからと言われるが、実際は5大ソフトウェア(ワープロ表計算、…)のために作られたからこの名前になったとのこと。ただしその5大ソフトウェアは作られなかった。
  • 1986年 CNS 11643
    • 戸籍などに使われる。実装としてはEUC-TWなど。Windowsには実装なし。
  • Big5の13053文字では足りない。
    • 特に人名・地名。
    • 人名には異体字が使われることが多く、標準字体表には含まれない。また台湾語の文字(毜𤆬など)が名字に使われる。先住民族は(漢字であれば)自由に名前をつけることができ、14文字の名前もある。
    • 地名は日本国字(「壽峠」の『峠』)や台湾語の文字(「坔」など)が使われる。
  • DOS時代 倚天拡張文字というメーカーが拡張文字があった。
    • 倚天はメーカーの名前
    • 漢字7文字、ひらがな、カタカナ、キリル文字、罫線要素
    • Windows(Big5-CP950), Macはこの漢字7文字については採用したが、ひらがなやカタカナは不採用
  • 台湾では今でもパソコン通信(BBS)が使われる。有名なところだとptt.ccなど
    • BBSではBig5が主流。不足した文字を補うために様々な亜種が作られた。
    • Big5-UAO
    • 中國海字集という外字集があった
  • CNS 11643
    • 漢字が9万字に。16の文字プレーン。
    • Unicode CJK の最大の規格ソース。Unicodeにない文字は18540文字。
    • 日本の国字ベトナムの漢字など全ての漢字をカバーしている。またUnicodeにある漢字は全て取り入れている。
      • そのためどれが台湾用字なのか分からなくなっている。
  • Adobe-CNS1-6
    • 現在2万字位
    • AC1, AC3, AC4, AC5, AC6の拡張はすべて香港の文字(台湾の文字が入らない!)
  • 台湾ではUnicode基準のフォントが多い
  • 人名用字は2001年まで規程なし。「姓名条例」の第2条で規定されているが、記載が曖昧なので何らかの字書に載っている字なら何でもよいらしい。包摂基準はない。
  • 民主化により、先住民族は自由な命名ができる。漢字であれば何でもよい。
フォントで使われる文字コード

主なもの

その他

  • GB5
  • GB12345
    • GB5とは逆反対に、GBのコードを入力すると繁体字が表示されるフォント。
    • 中国土産のTシャツに書いてある文字に「中國萬裏長城」
      • 「裏(裡)」も「里」も簡体字では「里」なので、GB12345で書かれたものではないか。

フォント

  • 版面は漢字だけなので濃度が均一で、ムラがない。
  • 全体的に黒くなりがち。
  • そのため、太い文字はやや小さめ。字面率を93%位までに抑える。

分類

  • 日本ではオールド、モダンなどの分け方があるが、その分け方では台湾ではほとんどがモダンになってしまう。
  • 台湾の書体を字形によって3種類に分類した
    • 伝統字形
    • 楷書化字形
    • 標準字形
  • しんにょう、竹冠、いとへんなどの形によって分類。
    • 伝統字形は伝統的な明朝体の形。標準字形は教育部が示した標準字体に従ったもの。
呼び方
  • 台湾では活版までは宋體、写植からは明體とよばれる。
  • ただし台湾政府は宋體と呼んでいる。香港や大陸でも宋體(宋体)。
  • 黑體と方體
    • 黑體はサンセリフのこと。黑體と対応するのは白體でセリフありのこと。
    • 方體は日本でいうゴシック体のこと。台湾政府もこの名前を使う。圓體(円体)が丸ゴシック。
  • 仿宋体
    • 1916年に宋刻本の書体をまねて(仿=倣)つくった書体。

書体

  • 華康(ダイナラブ)
    • 華康明體
      • 伝統字形。ファミリーになっていない
    • 華康黑體
      • 伝統字形。ファミリーになっていない。W3が儷黑であったり、太さによってエレメントが全部違う。
    • 華康儷宋
      • 楷書化字形。独特のしんにょうの形をもつ。やさしい感じ。
      • W5が通常のW7相当の太さであり、W3〜W5の間のウェイトがない。
    • 華康儷黑
      • 楷書化字形。茶の下が『木』のように繋がっている。
  • 文鼎(アーフィック)
    • 2000年から新作がほとんどない。現在は組込み用のフォントを主にやっている。
    • 文鼎明體
      • 無機質な感じ。微妙にファミリーになっている。
    • 文鼎黑體
      • 丸ゴシックがベースになっているためか角が微妙に丸くなっていたり、冖の曲がり方が気持ち悪い
      • 太いウェイトの品質が良くない
      • 文鼎黑體Uとはファミリーになっていない
    • 文鼎新黑體
      • UD系。ウェイトによってしめすへんが不統一。
  • 金梅
    • 素材集を販売している会社。筆文字系のフォントを多く出している。品質は悪い。看板でよく使われる。
    • 金梅特黑蹲腿字形
      • すべての文字に脚がついたフォント…このようなフォントもある
  • 蒙納(モノタイプ香港)
    • 蒙納宋
      • 儷宋と同じしんにょうをもつ。
    • 蒙納黑
      • 蒙納宋と同じ骨格で作られた。
    • 繁粗黑
      • たての筆画が左に突き出しを持つ。
  • 方正
    • 写植から。中国のメーカー。
    • 方正博雅方刊宋
      • 伝統字形。
    • 方正新秀麗
      • 伝統字形。なぜか簡体字版がない。
    • 方正平黑/粗黑
      • 伝統字形。なぜか簡体字版がない。
    • 方正蘭亭黑
      • 楷書化字形。Macプリインストール版(蘭亭黑)は台湾字形になっている。
  • Windows搭載書体
    • 細明體(MingLiU)
      • Vistaから標準字形に。ダイナラブ。
      • XPまで『爲』となっていたグリフがVistaから『為』となった。Unicodeとの不統一
    • 標楷體
      • 標準字形。ダイナラブ。公文書や論文に使われる。
    • 微軟正黑體
      • モノタイプ
  • Mac搭載書体
    • 黑體-繁
      • 楷書化字形。上海風。
    • 蘋果儷中黑/儷黑Pro
      • 同じ書体だがTTLからのものとダイナからのものとで違う名前になっている。
    • 蘋果儷細宋/儷宋Pro
    • 宋體-繁
      • 楷書化字形。常州華文。モノタイプに似ている。
    • OS X 10.9 での追加フォントがいろいろある。

本文書体

  • 新聞ではアーフィックの標準宋體、方正の新秀麗、アーフィックの文鼎明體M、など。
    • 蘋果日報のように本文書体にダイナの丸ゴシック(圓體)が使われているものもある。
  • 文字書はダイナの華康明體やアーフィックの文鼎明體が多い。
    • 儷宋は少ない。ウェイトが少ないからか。
  • 香港はモノタイプがほとんど
  • 台湾では引用などの部分に楷書や仿宋体が使われ、イタリックに相当する。

タイトルに使われる書体

  • 康煕字典体をタイトルに使うのが2年ほど前から流行っている。
    • 康煕字典をスキャンしたフォントが配布されている。
  • ヒラギノや小塚書体が多い。
  • フォントは足りていない!
    • Adobe-Japan1-6に含まれないBig5常用字は122字

周期表

Bopomofo, 注音符号

  • 台湾で使われる発音記号。それまでは直音法や反切法を使っていた。
  • カタカナを手本として、形は篆書から作られた
  • 日本では注音字母とよばれる場合もあるが、発音記号の様なものであり現在は通常の文字として使われないので字母とは呼ばない。
  • 入力メソッドでもあり、台湾で主流。発音をBopomofoで入力する。一般に使われるキーボード配列では左の列上からㄅㄆㄇㄈㄉㄊㄋㄌ…とBopomofo順に並んでいる(大千式)。他の配列として、音の近いアルファベットと対応付けた倚天式などがある。
  • ㄧㄨㄩ(介母)の順が一定しない。
    • 真ん中か最後
    • Big5, Unicodeでは最後
  • 香港での入力法
    • 台湾で発明された倉頡輸入法が標準。漢字をいくつかの要素に分解して入力する。分解の仕方がよくわからないものがあったり、よくわからない字形を一つのキーにまとめていたりする。
    • 言語が違うのではBopomofo入力ができないため。
  • その他の入力法
    • 嘸蝦米輸入法
    • アルファベットの形に分解して入力する。「命」はAOP、など。
  • DQN語として注音文というのがある。
    • (日本語でいう「kwsk」「gkbr」とかに近い?)
  • はじめから注音が付いた状態のフォントもある。活版でも同様のものがあった。
    • 同じ漢字でも複数の発音があるものの為に、発音の数だけフォントがある。「和」は5つある。

台湾の組版

  • 句読点は真ん中
    • 縦書き横書きで共用できる。
    • 1950年位には句読点を(振り仮名と同じように)文字の右、真横に置くという方式もあった。
    • 新青年(1919年)が句読点を真中に置いている。(が、政府に?提案したのは右につける方式だった)
    • 日本式もあるが少ない。
  • かぎ括弧も横書きでを使っていたとか。
  • “:「”や“?」”など約物が続いても詰めない。
  • コロン「:」は縦書きでも同じ向き(点が縦に並ぶ)。
  • 段落は2字下げ。
  • 禁則処理は、活版では送り出しか、そのままで組んでいた。InDesignの時代はしている。新聞社などは禁則処理しないため、「,」が上に来ることも。
  • 老貓による枡形組版復活の提案
  • 縦書き本は長体をかける
    • 長体にする人の意見によると、木版印刷明朝体が縦長であり。本文が美しくなる。モノタイプやアーフィックの書体がやや縦長で、ダイナは四角いのでそのまま組むと太く見える。
    • 長体にしない人の意見によると、長体にするのはページ数をコントロールするための技であり、行間をつめてページ数を減らせる
  • 日本語はかなや漢字の画数が少ないので小さいポイントにできる。日本語で6ptにできるものは繁体字では7.5ptにしないと読めない。
  • 真ん中の約物が厄介。
  • 日本語がうらやましい。

リンク

3月8日 繁体字フォントセミナー「台湾の文字、いろいろと。」
繁体字セミナー「台湾の文字、いろいろと。」 - Togetterまとめ

(3月10日0時 香港の字形についてなど追記)
(3月16日2時 文字コードについて追記)
(3月20日16時 フォント、組版などについて追記)
(4月09日23時 脚注としてリンク追加)
(5月08日19時 リンク追加)