ちまたでは、之繞(しんにょう)の点が1つなのか2つなのかなんてことが話題になることが多いのだけれど、文字はコミュニケーションのためのものなのだから、通じるなら細かいことはどうでもいいと思う。白川さんが言っていたように、「臭は本来、大ではなく犬」だなんてことが(『常用字解』)、聞き入れられる状況ではないし(いろんな意味で)。飛行機内でこの画面を見て、movieのことだと認められない日本人はあまりいないはず

なんでこんなことになっているかというと、Unicodeの漢字(unihan)はCJKV(中国・日本・韓国・ベトナム)の文字を統合しているから。「画」はUnicodeではU+753Bだけれども、中国なんかではのような字形なんだろうね
「骨」なんかも、UnicodeのU+9AA8の例示字体はというかんじで、日本の感覚から言ったら「ねんざ?」しているんだけど、まあ、通じないというほどではない
たとえUnihan DatabaseでU+2FBBに慣れ親しんだを見つけたとしても、こんなものは使ってはいけない。これはいわゆる「ほね」の意味で使われる文字とはぜんぜん違うコードポイントなのだから
本題:細かい字体の違いを気にしないとして、最強のフォントは何かというと、Sun-Extでしょう。ここで言う最強とは、文字がきれいとかそういうことではなくて、どれだけたくさんの文字を収録しているかということ。アラビア文字とかは入ってないけど、漢字に関しては十分なのがHAN NOM、こちらはSourceForgeにあるから導入しやすい。どちらも「Unicode CJK Ext A/B 網羅・約5万字収録のフリーフォント」で紹介されている
どちらかを導入して、みんな大好きUnihan.txtから、Unicode的に部首とされているものを、適当に抜き出すと次のようになる。表示できない文字がある人は、ちょっとかわいそうだねえ
gawk '{if($2=="kRSUnicode" && $3~".*?\\.0") printf("%s; ",$1);}' Unihan.txt | sed -e 's/U+/\&#x/g'
㸦 䍏 䒑 一 丨 丬 丶 丿 乀 乁 乙 乚 乛 乡 亅 二 亠 人 亻 儿 入 八 冂 冖 冫 几 凵 刀 刁 刂 力 勹 匕 匚 匸 十 卜 卩 厂 厶 又 口 囗 土 士 夂 夊 夕 大 夨 女 子 孑 孒 孓 宀 寸 小 尢 尣 尸 屮 山 巛 巜 川 工 己 已 巳 巾 干 幺 广 廴 廾 弋 弓 彐 彑 彡 彳 心 忄 戈 戶 户 戸 手 扌 才 支 攴 攵 文 斗 斤 方 无 日 曰 月 木 朩 欠 止 歹 殳 毋 毌 比 毛 氏 气 水 氵 氺 火 灬 爪 爫 父 爻 爿 片 牙 牛 牜 犬 犭 玄 玉 王 瓜 瓦 甘 生 用 甩 田 由 甲 申 甴 电 疋 疒 癶 白 皮 皿 目 矛 矢 石 示 礻 禸 禾 穴 立 竹 米 糸 糹 纟 缶 网 罒 罓 羊 羽 老 耂 考 而 耒 耳 聿 肀 肉 臣 自 至 臼 舌 舛 舟 艮 色 艸 艹 虍 虫 血 行 衣 衤 襾 西 覀 見 见 角 言 訁 讠 谷 豆 豕 豸 貝 贝 赤 走 赱 足 身 車 车 辛 辰 辵 辶 邑 酉 釆 里 金 釒 钅 長 镸 长 門 门 阜 阝 隶 隹 雨 靑 青 非 面 靣 革 韋 韦 韭 音 頁 页 風 风 飛 飞 食 飠 饣 首 香 馬 马 骨 高 髙 髟 鬥 鬯 鬲 鬼 魚 鱼 鳥 鸟 鹵 鹿 麥 麦 麻 黃 黄 黍 黑 黒 黹 黽 黾 鼎 鼓 鼔 鼠 鼡 鼻 齊 齐 齒 齿 龍 龙 龜 龟 龠 龰 龵 車 龜 龜 金 老 鹿 辰 女 力 龍 里 立 行 見 羽 屮 爫 艹 艹 辶 歹 龜 𠂨 𠃉 𠃊 𠃋 𠃌 𠃍 𠃎 𠃑 𠄌 𠄞 𠄟 𠄠 𠆢 𠋑 𠔇 𠘧 𠘨 𠙴 𠚑 𠚣 𠤎 𠤬 𠧸 𡔷 𡕒 𡤼 𡭔 𡯁 𡯂 𡰣 𡳾 𡿦 𡿨 𢉖 𢌬 𢍺 𢎗 𢎘 𢖩 𣁬 𣂑 𣎳 𣎴 𣥂 𣦋 𣦵 𣦶 𣫬 𣬛 𣱱 𤋳 𤓯 𤓰 𤕪 𤣥 𤣩 𤮺 𤯓 𤰒 𤴓 𤴔 𥘅 𥝌 𥤢 𥫗 𦈢 𦉪 𦉫 𦉭 𦉰 𦍋 𦍌 𦍍 𦓐 𦓤 𦘒 𦣞 𦣹 𦤳 𦤴 𦥑 𦥒 𦥓 𧘇 𧢲 𧥛 𧥜 𧮫 𧰧 𧰨 𧺆 𧾷 𨈏 𨈐 𨈑 𨐋 𨑃 𨑄 𨙨 𨱗 𨱘 𨳇 𨳈 𨸏 𩑋 𩙱 𩙿 𩚀 𩚁 𩚃 𩠐 𩡧 𩰊 𩰋 𩵋 𪐗 𪔂 𪗄 𪚦 𪛉 乁 凵 尢 屮 廾 王 衣 豕 麻 黹 黾 鼻
コメントする