hidekatsu-izuno 日々の記録

プログラミング、経済政策など伊津野英克が興味あることについて適当に語ります(旧サイト:A.R.N [日記])

JEF4J v0.9.0 をリリースした。そして謎の文字の話。

JEF4J を久々に更新した。

以前、「JEF4J をリリースしてみた。あるいは、メインフレームの文字コードの話。」というエントリを書いたが、その時点では JEF の最終仕様が掲載されている「FACOM JEF 文字コード索引辞書 (1987年/第三版)」が手に入らなかったため、第二版をベースに他資料を援用して作成していた。

福岡大学の図書館に存在していることはわかっていたのだけれども、さすがに遠方で放置してたのだ。別件で福岡に旅行に来ているので、ついでにコピーを入手してきた。

いろんな文字が追加されているのではという予想を裏切り、JIS83 改正対応がほとんどだったようで、結果的に修正はほぼ必要なかった。

残る謎文字

ワープロ用途の特殊記号や同じ字母を持つものが登録済みの変体仮名を除くと Unicodeマッピングできない文字は次のものだけとなった。

JEF 字形 備考
71E0 武を字母とする変体仮名Unicode には存在せず。
71F7 変体仮名なのだが、字母すら不明。
72A8 得を字母とする変体仮名Unicode には存在せず。
72E1 女を字母とする変体仮名Unicode には存在せず。
73D5 富を字母とする変体仮名Unicode には存在せず。
74B9 変を字母とする変体仮名Unicode には存在せず。
75F2 雄を字母とする変体仮名Unicode には存在せず。
43C7 儲の異体字。違いが微妙すぎるのか、文字情報基盤にも同一字体なし。
6CF4 顛の異体字。違いが微妙すぎるのか、文字情報基盤にも同一字体なし。

マッピングして気づくのは、Unicode 登録の変体仮名はかなり中途半端な代物なのでは、という点だ。JEF が変体仮名をサポートしていたのなら、既存規格に合わせた方がまだ良かったように思える。とはいえ 71F7 の変体仮名については、それ系のサイトをいくつか調べてみたものの該当する文字すら見当たらず本当に謎なのではあるが。

儲、顛の異体字については、JEF79 で採用していた拡張漢字とJIS83 で採用された文字に微妙に差異があったため発生したもので、互換文字みたいなものだと思われる。

今後の予定

文字のマッピングアルゴリズムに多少改善の余地があるのと、Adobe Japan-1 対応を入れる可能性がある。ノー豆腐を目指した Noto Font を含め多くのフォントは Adobe Japan-1 の異体字セレクタはサポートしても、汎用電子の異体字セレクタはサポートしていない。

正直、あまりにもマイナーすぎてそんなに使われているとも思えないライブラリだけれども、今後発生するだろう公共系システムの移行に役立つ局面もあるとは思っているので、要望があればご連絡いただければと。