ユニコードはどの程度の漢字を使えるか

特殊な祭神名(高龗神など)のほか、漢字の旧字体等は、パソコンでどの程度まで使えるかについては、これまでも書いたことがある。
近年、パソコンで使用するユニコードの文字体系が整備され、使える文字はかなり増えた。しかしちょっと調べてみると、昔の旧字体で出版された活字本の漢字を、そのまま表示できるまでには、なっていないようである。

文字を使える、使えないの問題には、区別して考えなければならない点がある。
 1 文字コードの問題。ディスプレイに文字が表示できるか。一般的な方法で検索や通信が可能か。
 2 字形の問題。文字の字体に間違いないか。パソコンやハードウェアが異なっても同じ字体になるか。OSの提供するフォントの問題。
 3 表示された通り印刷できるか。

さて、近年は「祠を祀る」などの文字が正しく表示される(以前は「しめすへん」は「ネ」のような字形だった)ので、常用漢字の「通用字体」と「旧字体」の対照表を作ることができるのではないかと思った。そこで調べてみると、Wikipediaにそれに近いものがあった。

Wikipediaの 常用漢字一覧 に、表形式の一覧が載っているが、ざっと見たところ、本来あるべき「旧字体」の欄が空白になっているのが多い。

 すぐに80字ほど見つけた(詳細にはもっと多いだろう)
  媛 援 煙 翁 鎌 緩 起 虐 急 券 兼 拳 嫌 謙 誤 采 彩 採 菜 削
  咲 姿 捨 爵 弱 習 週 述 術 肖 宵 消 勝 侵 浸 刃 尋 請 扇 遷
  掃 送 造 尊 妥 隊 濯 暖 彫 調 朕 墜 謄 藤 騰 毒 乳 浮 派 覇
  半 伴 浮 婦 包 抱 泡 胞 砲 飽 望 翻 躍 愉 諭 輸 癒 曜 翌 翼

これだけ多いということは、ページ作成者の見落としではなく、ユニコードに文字がないのではと思い、そこで、《Unicode/CJK統合漢字》 漢字部首検索 で調べたところ、やはりほとんどなかった。
この CJK統合漢字サイトには、「□」という表示だけで字形が表示されない文字コードがかなりある。今回調べた文字が、実際は文字コードはあるが、この□のどれかに該当して表示されないだけかもしれない。それは未調査である。これは前記の「2 字形の問題」であり、使用したPCでたまたま□の表示になっただけかもしれないが、そうだとしてもそういうのはごく僅かであろう。

Wkipediaで「郷」の旧字体欄に「鄕」という字形があるが(PCのフォント環境によって字形が異なるかもしれないが)、この字の中ほどが「皀」となる字形のほうが一般的だと思うが、ユニコードでは使えない。既(旣)、即(卽)は可。
「並」に対して「並」は旧字体のコードだが、同じ字形で表示されるとしたら「2 OSのフォントの問題」である。


以上のほかに、前記の80字には入れてないが、「食へん」や「しんにょう」(「草かんむり」は3画が主流らしいが)……などの漢字を見てゆくと、Windows環境で正しい旧字体で表示できない文字の数は、さらに多いことになる。

そんなわけで、ざっと見ただけでも、これほどの問題があるわけである。昔の書籍の文字のまま再現するのは、困難である。

また、どの字形が本字なのか異体字なのかは諸説があるようである。古い字を使って作文しようと思っても、字形を選ぶのに苦労するだろうし、字音仮名遣よりも厄介かもしれない。
comments (0) | trackbacks (0) | Edit

Comments

Comment Form

icons:

Trackbacks


  page top