おおさかヲたのしみ

大阪のオタクがオタ活しながら大阪の話をします。

祖先が名乗っていた漢字を探した話 ~「弥」と「彌」と「𭚶」~

知り合いに「弥永」さんという苗字の方がいます(仮名)。

苗字に使用されている「」の字は本当の字でないそうで、ご先祖様の苗字を名乗りたいが辞書にないと相談を受けました。
法的に他の苗字に変更できるかという話はなしにして、その漢字が実在するのかということを調査しました*1

漢字には、いくつもの「異体字」が存在します。
まず、「」の「異体字*2が目的の漢字だと推測して検索します。

部首弓 + 5 画
総画8画
異体字彌(繁体字, 旧字体), 瓕(古体), 瀰(繁体字
字源「彌」の略体。「彌」は、「弓」+音符「爾(印の象形文字で「璽」の原字)」の形声文字で、「弭(弓の端にあり弦をかける金具「耳」)」に代用したもの(『韻會』)、「弓が弛む」という意味を表したものとも(『説文解字』における「瓕」の解字)。

弥 - ウィクショナリー日本語版

旧字体の「彌」は人名用漢字として指定されており、また「瓕」は旧い漢字でなんとなく般若心境だとかで見たことあるような気もしなくないような漢字です。
実際、「彌永」さんという苗字の方は若干数ですが実在するようで、ありえなくもない話です。
このどっちかだろうと思って先方に確認してみれば、「貴様はその程度か」と言われてしまいました。

・・・はいそうですよね、そんなに簡単に見つかりませんよね。

まぁ最初にどのような感じなのか確認をすればいい話でした。
先方の記憶では、その「」には、「用」が含まれていたそうです。

ここは素直に「 用」でgoogle検索をかけてみることにしました。

f:id:ftmn:20181217201649p:plain https://www.google.com/search?ei=J4UXXNnLGIn28QXzmb6YAw&q=%E5%BC%A5%E3%80%80%E7%94%A8&oq=%E5%BC%A5%E3%80%80%E7%94%A8&gs_l=psy-ab.3..0i30.2098.2416..2693...0.0..0.77.225.3......0....1..gws-wiz.SDDHffI19wc

リンクを開いてみると、

f:id:ftmn:20181217202034p:plain

旧字の「彌」や、その右下を「用」にした俗字について、それらを子供の名に含む出生届を受理してよいかどうか。これに対する法務省民事局長の回答(昭和37年1月20日)は、俗字の方はダメだが、旧字の「彌」は受理してさしつかえない、というものでした。

dictionary.sanseido-publ.co.jp

( ^ω^)あ、それっぽい。

先方も「その漢字だ」と大興奮。

めでたしめでたし。


だと、良かったのですが今回はこの漢字を「使用したい」という話なのでもう少し続きます。


実はこの話の前提として、IPA(独立行政法人 情報処理推進機構)のとある発表があります。

IPAでは、ISO(国際標準化機構)より文字コード国際規格の最新版である「ISO/IEC 10646」(UCS:Universal Coded Character Set)の第5版「ISO/IEC 10646:2017」が12月22日に発行されたことを受け、IPAが「文字情報基盤」として推進してきた漢字5万8861文字に、ISOの統一的な文字コードが割り当てられたことを明らかにした。

 (略)

戸籍統一文字を含めた文字に国際規格として文字コードが割り当てられたことで、今後は、行政機関のデータの相互利用が促進され、外字作成コストが解消されるとする。

k-tai.watch.impress.co.jp

ちょうど1年前の話ではあるのですが、この発表を受けて当時携わっているシステムの人名を「外字」から「Unicode上の番号」へ移管できるかどうか検討するという話があがりました。(当然ではあるのですがその「外字」、導入されている顧客毎に登録情報が異なるために簡単にはできないという結論となりました)
ここで冒頭の相談の話なのですが同じシステムに参加していた先方が「使えたりせえへんのか?」という疑問になったわけです。

当然、先ほどの「」を「外字」として登録すれば使用できるのですが、「他のPCでは使えない」だとか「ビットマップ画像だから拡大するとジャギーがでる」だとかもろもろの問題があります。
故に「可能であればUnicodeの定義上で見つけてほしい」というのが今回の相談です。

しかし、googleで一例がみつかったとはいえ「」はイメージ画像として掲載されており、コピペして検索できるわけでもありません。
また、「」がUnicode上に存在するとすれば、それは「CJK統合漢字」のどこかに存在するのはほぼ間違いなく、その調査対象となる字数は全部で8万8千字超、この量を目視で確認するのはほぼ無理でした。


ここで思いついたのが「漢字構成記述文字列」からの逆引きでした。

「漢字構成記述文字列」とは要は漢字の足し算のことで、「木+林=森」みたいな式を実現する方法です*3。こいつであれば、わかってる構成パーツだけで見つけることができるのではないか、そう考えました。

そうと決まれば、まずは構成パーツの一覧を得なければいけません。
これについては「漢字データベースプロジェクト」にて手に入りました・・・が、ファイルサイズが大きい(約2MB)
ちゃっちなPCでやっていたせいもありロードに多少時間がかかりました。

f:id:ftmn:20181218002025p:plain
こんな感じで登録されています(検索しやすいように加工済み)

あとは「弓」と「用」となにか(上の部分)が合体すれば「」なので、正規表現を使って「弓.+用」とでも調べればいいかなー

・・・あれ?見つかんない。

いろいろ検索しつつ考えなおす

「あぁ、下の部分、【用】じゃなくて【月】か」

ふと閃いて「弓.+月」で検索をしてみます。
f:id:ftmn:20181218004204p:plain
・・・あった、なんかそれっぽい。
先方も先述のサイトも「用」と解釈していたのでまんまと勘違いしていました。

あとはこの文字コードが本当に正しいのかですが、google先生にこのコード(U+2D6B6)で検索を投げかけます。

f:id:ftmn:20181218004715p:plain
u2d6b6 (𭚶) - GlyphWiki

ビンゴ!

これで先方の探していた「」は、ユニコード上「U+2D6B6」に割り振られていることが分かりました。

この辺に表示されるようになる予定⇒「𭚶

こんどこそめでたしめでたし


蛇足ですが、発見したのは良いですが結局この文字はしばらく使えなさそうな雰囲気です。
というのも、「」はUnicodeへ昨年登録されたところ*4漢字で、この文字を使用できるフォントがほとんど存在しないからです。一応「花園フォント」には登録されていることは確認いたしましたが、他のPCでも読み込まれているわけではないのでほぼ確実に文字化けをします。

また、当の「永」さん(仮名)は、この漢字のことを「祖先が誤って戸籍登録した漢字」と思っていたそうです。
もし、PCで入力できないとあきらめている漢字が苗字にふくまれているならば、一度今回の方法などで調べてみるのはいかがでしょうか。

*1:法的には苗字は特殊な事情(結婚)などはない限り変えられず、また戸籍の電子化に伴って使用できない漢字(主に誤字)に該当する場合は当人の同意をもって正しい字に変更されるらしいです。

*2:旧字体とか略字とか

*3:語弊ありまくりですが、正しくは「パーツ毎に区切った漢字の情報を、正確かつ完全に記述する目的で使用する言語」のことです。

*4:Unicode 10.0策定時に追加された