IME専門用語辞書の公開

最近、パソコンでの漢字変換にマイクロソフト社のIME(漢字変換ソフト)を使い始めている。(これまではWXGというソフトである)
第一印象はなんといっても「語彙を知らない」ということである。ユーザー辞書がまだできていないせいもあるのだが、ここ10年間のうちにIMEソフトは、語彙がが貧しくなったような印象がある。パソコンの世界はハードもソフトも日進月歩といわれているが、IMEのボキャブラリーに関しては退化もありえないことではない。それはたとえば最近の政治家が発する言葉の貧しさ、政治家だけではもちろんないが、そういうことを思えば、想像のつくことである。

「漢字」と変換しようとしたら最初に「感じ」が出てしまい、変換キーを押しているうちに見失ってしまって、カンジと読む人名がずらりと出てきた。40〜50はあるようだ。「ゆうき」と読む人名は80くらいある。これでは非常に効率が悪いので、IMEのプロパティから「人名地名辞書」を削除した。それでもカンジという人名は15例ほど出るので十分だろう。

以前のMEからユーザー辞書の移植を始めてみた。吟味しながらの移植である。その経過や単語リストを日本語IME専門用語辞書の試みというページに公表することにした。単語リスト(辞書テキストファイル)の利用も可能。

★追記
MSIMEの標準辞書の一般語彙の登録語数は7万語くらいだったと思う。「人名地名辞書」だけで同じ数の7万くらいが登録されている。7万のうちの大かたは、「ゆうき」などの最近の子供に名付けられた人名で、漢字の組み合わせ例は大変な数になる。効率が悪いわけである。
こういうケースでは名簿を入力する仕事の人も、いちいち数十の候補から選ぶよりは、漢字を1文字づつ確定したほうが早いのではないだろうか。若い人が自分の名前が漢字変換されたからこのパソコンを買おうという判断基準のためだけにあるようなものだ。
ちなみに1980年代のMS-DOS用NEC漢字変換システムには「ゆうき」とよむ人名は1例も登録されていなかった。そういう人名がほとんどなかったからだろう。
comments (0) | trackbacks (0) | Edit

Comments

Comment Form

icons:

Trackbacks


  page top