パソコンで使えない漢字の表現法

外字パソコンで使用できる文字の数には制限があり、日本の神話に出てくる神さまの名前の漢字表記に苦労することがある。たとえば……

「大日*貴尊(おほひるめのむちのみこと)」。
日本書紀などで天照大神(あまてらすおほみかみ)の別名とされる名だが、*の部分は霊の旧字体の「靈」の字の「巫」を「女」に置き換えた字形である。(私的な電子文書では「霊女」の2字で表している)

「**草葺不合尊」(うがやふきあへずのみこと)
宮崎県の鵜戸神宮の祭神でもある。「**」の字形はどちらも旁(つくり)が「鳥」で、《廬鳥》《茲鳥》というような形。「鵜」の意味である。「鵜草葺不合尊」と表記されることもあるので、こちらで代用することになる。

「闇*神(くらおかみのかみ)、高*神(たかおかみのかみ)」
*の字形は「靈」の字の「巫」を「龍」に置き換えた字形。一種の龍神である。古事記の「淤加美」という表記ですべて代用してしまうが、栃木県などに多い「高*神社」は表記のしようがない。

白山比*命(しらやまひめのみこと)
加賀国一宮の「白山比め神社」の神で、*の字形は「口へんに羊」。神社サイトを見ると、画像イメージでは正しく表記してあるが、テキスト文字では「白山比め」「白山ひめ」と仮名まじりである。「め」の字は、現在使われる日本のパソコンの「IBM拡張漢字」(JISで定められた以外の文字コード)を使うと表記できないことはないので(?v)、個人の電子文書では使用に問題はない。しかしグーグルで「加賀国一宮」と検索すると、検索結果にところどころ「白山比 盗_社」と文字化けしたものがあり、ページを確認すると「拡張漢字」を使用した部分である。神様の名で「盗」という字は縁起が悪い。本家の白山比め神社のサイトで使用しない文字コードなので、WEB文書では使用しないのが良いのだろう。この「め」の字は「〜ひめ」という女神の名で非常に多く使われる。

「伊*波神(いではのかみ)」
「いでは」とは「出羽」のことで出羽地方の神。*は「氏」の下に横棒というか、「低」の旁の部分になる。私的には「弖」で代用することもある。この字は二十八宿の一つで「てい」または「ともぼし」と読むが、ネット上では氏(うぢ)の字をそのまま使って「氏(てい)」などと表現してあるところもあった。

他にも例はあるが、このへんでやめておく。
なかなか難しい問題だが、もっと他に良い表現法はないだろうか。
 * * * * *

玄松子 | 2006/07/07 13:53
お久しぶりです。最近知ったのですが、こういう方法があります。
咩 (咩)
&#x の後ろにunicode の数値を書くと世界共通で利用できるようです。
 * * * * *

●ユニコードを利用した表示例 2006/07/10
孁 孁  大日孁貴尊
鸕 鸕  鸕鶿草葺不合尊
鶿 鶿  (異体字)
咩 咩  白山比咩命
龗 龗  高龗神
氐 氐  伊氐波神
 * * * * *

2006/7/15
鸕鷀 鸕鷀草
2006/7/16
鸕鷀 鸕鷀草 フォントを"MS UI Gothic"に指定
comments (14) | trackbacks (0) | Edit

Comments

京都暗記帖人 | 2006/05/20 21:03
 こんにちは。お久しぶりです。パソコンで使えない漢字の悩み、同感です。私も悩んでいます。
 各寺社のホームページからコピペするしか方法がない時も・・・。どうしようもない場合は、ひらがな表記にしていますが・・・。ではー。
 京都検定ブログ人から京都暗記帖人へとハンドルネームを変えました。よろしくお願いします。
森の番人 | 2006/05/23 00:17
どうも。しばらくです。
古い歴史などに関心の深い人は、どんな分野でも、漢字の問題が出てきそうですね。
そういえば以前紹介した『谷ぐく考』という本の名前も本当はぜんぶ漢字でした。
またそちらも覗いてみます。
橘 正史 | 2006/06/10 02:01
 お邪魔いたします。

 「縦に書け!」という本を最近読みまして、手書きで縦に書くことが大切だと、納得させられました。漢字が自由に駆使出来ない点なども問題なのですね。漢字が自由に駆使出来るソフトが開発されても、どこまで需要があるか、微妙な問題はあるかもしれませんが、出来て欲しいですね。
森の番人 | 2006/06/11 23:05
漢字の書き順は縦書きが前提ですから、縦書きの慣習があったほうが字は上手くなるとは思いますが。
ネットが普及する以前は個人レベルで「外字」を登録すればだいたいまにあっていたのでしょう。
晴代(seidai) | 2006/06/18 22:41
はじめまして。
通常表示ができない漢字表記は、GT書体(フォント)を使って表示しています。
縁起の悪い文字化けについては、フォントにより違ってくるので難しい問題です。
GT書体だと、「佇」となりますが、他に縁起の悪い文字があるかもしれません。
OSのフォントに収録されている漢字数を増やすことなど、雑作もないはずなんですが、需要がないのでしょうね。
森の番人 | 2006/06/21 23:23
情報をありがとうございます。
GT書体フォントについてはいますこし不明なところもあるのですが、期待できるものであれば期待したいものです。
青空文庫のこんなページもありました。
http://www.aozora.gr.jp/newJIS-Kanji/newJIS1.html" target="_blank">http://www.aozora.gr.jp/newJIS-Kanji/newJIS1.html
玄松子 | 2006/07/07 13:53
お久しぶりです。最近知ったのですが、こういう方法があります。

咩 (咩)
&#x の後ろにunicode の数値を書くと世界共通で利用できるようです。
森の番人 | 2006/07/07 20:57
しばらくです、このブログではコメント欄では文字処理が不十分のようで、玄松子さんのコメント文を、記事本文の末尾にコピーしておきましたので、そちらでの表示を見ていただければと思います。
こういう方法があるんですね。少なくともブラウザでは表示されています。
http://www.asahi-net.or.jp/~AX2S-KMTN/ref/jisx0212/jisx0212-1.html" target="_blank">http://www.asahi-net.or.jp/~AX2S-KMTN/ref/jisx0212/jisx0212-1.html
上のページのJIS補助漢字。なるほど、いろんな文字の表示が可能なのですね。
そのページのhtmlソースを見たらunicodeの数値が記述されているだけです。
しかしブラウザの表示文字をコピーして旧来のエディタにペーストすると、IBM拡張漢字のあるものだけそれに変換されて、他の多くはコピー不能です。エディタやWindowsのクリップボードなどは未対応のようです。次期バージョンのWindowsではかなり対応できるような話もありますね……
玄松子 | 2006/07/13 11:49
> ブラウザの表示文字をコピーして旧来のエディタにペーストすると…

僕の環境(メモ帳)では問題なくコピーできますが、エディタのフォントが違うのでしょうか。ちなみに使っているフォントは「MS UI Gothic」です。

また、「うがや」はこれで表示させました。
鸕鷀
森の番人 | 2006/07/14 14:40
Windows98ではできませんでしたので、WindowsXPにして、みましたら、メモ帳にペーストできました。しかし、メモ帳でユニコードの形式でテキストを保存した瞬間に、《茲鳥》の1文字が化けました。この文字はブラウザでは表示フォントを「MS UI Gothic」にして初めて表示されました。
《茲鳥》はユニコードにはある漢字ですが、JIS補助漢字にはないという点で、対応が不十分なのでしょうか。WindowsXPでも古いエディタですとユニコードには対応していないようですので、新しいものを探してみたいところです。
JIS補助漢字のほかにもJIS第3水準、第4水準といったコードもあるようですが、けっきょく、ユニコードが優先されることになるのでしょうね。ユニコードで使える文字はJIS補助漢字+アルファといったところでしょうか。
7/7のコメントでフォントがネット経由でというのは勘違いかもしれません。
玄松子 | 2006/07/15 15:37
ブラウザに設定されているフォントによって、表示できない場合がありますね。

<span style="font-family:'MS UI Gothic';">
&#x9E15;&#x9DC0;
</span>

こんな感じでフォントを指定してしまうと良いかもしれません。(マッキントッシュでは表示できないかもしれません。)
森の番人 | 2006/07/16 17:25
ありがとうございます。
某CDの188字の外字のユニコード対照表を作りました。
http://nire.main.jp/rouman/dic/hsgaiji.htm" target="_blank">http://nire.main.jp/rouman/dic/hsgaiji.htm
見落としなどもあると思いますので、お気づきの点はご一報いただけると幸甚です。
蝸牛歩(管理人) | 2006/07/19 15:07
Googleからキーワード「白山比?v」(ユニコード文字を含む)で検索した結果です。
http://www.google.co.jp/search?&q=%E7%99%BD%E5%B1%B1%E6%AF%94%E5%92%A9" target="_blank">http://www.google.co.jp/search?&q=%E7%99%BD%E5%B1%B1%E6%AF%94%E5%92%A9
現在595件あります。
ユニコードは既にかなり浸透していることがわかります。
加賀の「白山比?v神社」のサイトではまだ使用されていないのに、検索結果のページタイトルにきちんと表示されるのは、ユニコードを使用したテキスト文字でリンクを張っているところがかなりあるためだろうと思われます。
蝸牛歩(管理人) | 2006/07/31 13:49
6/18の晴代さんの記事にある「GT書体」については、フォントをダウンロードしたところ、従来のJIS第1水準と第2水準のコード領域に、別の文字のフォントを二重に収録したものでした。つまり文字コードは第1第2水準漢字のコードを使用しながら1文字ごとに書体指定だけで別の文字を表示させようというものです。1つの文字コードに2つの文字を割り当て、専用ソフトで切替えて表示や印刷をして、それ以外のことは考えないというものでしょう。それ以外とは、検索、IME辞書登録などです。

Comment Form

icons:

Trackbacks


  page top