fbpx
维基百科

中日韓統一表意文字擴展區B

中日韓統一表意文字擴展區B(英語:CJK Unified Ideographs Extension B)是一個Unicode區段,在Unicode版本3.1被引入。

中日韓統一表意文字擴展區B
CJK Unified Ideographs Extension B
範圍U+20000..U+2A6DF
(42,720個碼位)
平面表意文字補充平面SIP
文字漢字
已分配42,720個碼位
未分配0個保留碼位
Unicode版本歷史
3.142,711 (+42,711)
13.042,718 (+7)
14.042,720 (+2)
註釋[1][2]

擴展B區包含有42,711個新的漢字,位置在 U+20000–U+2A6DD。根據IRG N777號文件(页面存档备份,存于互联网档案馆),這四萬多個漢字分別從以下字典或字集中取得:

  • 康熙字典》中出現的18,486個未收錄漢字(包括一個在補遺篇出現的漢字);
  • 汉语大字典》中出現的28,914個未收錄漢字;
  • 辭源》中出現的66個未收錄漢字;
  • 辭海》中出現的247個未收錄漢字;
  • 汉语大词典》中出現的553個未收錄漢字;
  • 中国大百科全书》中出現的86個未收錄漢字;
  • 北大方正排版系统中出現的65個未收錄漢字;
  • 四庫全書》中出現的522個未收錄漢字;
  • 香港增補字符集中出現的1,081個未收錄漢字;
  • 日本工業標準的JIS X 0213第3水準及第4水準的302個未收錄漢字;
  • 南韓 PKS 5700-3:1998 中出現的166個未收錄漢字;
  • 北韓 KPS 9566-97 和 KPS 10721-2000 國家標準所收錄的5,642個漢字;
  • 台灣 CNS 11643 的第4至7和15平面所收錄的30,177個漢字;
  • 越南 TCVN、VHN 01:1998 和 VHN 02:1998 所收錄的4,232個喃字

這些漢字中重複的漢字有不少,所以經過整理之後,實際總數只有42,711個漢字。

另外,在 U+2F800–U+2FA1D 的位置,放了542個來自台灣的兼容漢字。

因擴展B區在整理上有缺陷,收錄了以下8個本來應該與其他漢字統一的字:[3][4]

  • U+20457 𠑗 = U+34A8
  • U+2420E 𤈎 = U+3DB7
  • U+27144 𧅄 = U+8641
  • U+27EAF 𧺯 = U+FA23
  • U+23515 𣔕 = U+204F2 𠓲
  • U+249E9 𤧩 = U+249BC 𤦼
  • U+2A415 𪐕 = U+24BD2 𤯒
  • U+26866 𦡦 = U+26842 𦡂

而在 WG2 N1155文件中,亦列出了152對可考慮統一的漢字。

字符列表

以下列表列出了在中日韩统一表意文字扩展区B中的所有文字:

為避免頁面過大,下列提供分段的中日韩统一表意文字扩展区B列表:

参见

參考資料

引用

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容于2016-06-29). 
  3. ^ 存档副本 (PDF). [2011-02-01]. (原始内容 (PDF)于2007-06-12). 
  4. ^ Cook, Richard. Defect Report on Duplicate Encoded CJK Forms (PDF). ISO/IEC JTC1/SC2/WG2. 6 October 2003 [2012-03-28]. (原始内容 (PDF)于2007-06-12). 

來源

  • (英语)

中日韓統一表意文字擴展區b, 英語, unified, ideographs, extension, 是一個unicode區段, 在unicode版本3, 1被引入, unified, ideographs, extension, b範圍u, 20000, 2a6df, 720個碼位, 平面表意文字補充平面, 文字漢字已分配42, 720個碼位未分配0個保留碼位unicode版本歷史3, 註釋, 擴展b區包含有42, 711個新的漢字, 位置在, 20000, 2a6dd, 根據irg, n777號文件, 页面存档. 中日韓統一表意文字擴展區B 英語 CJK Unified Ideographs Extension B 是一個Unicode區段 在Unicode版本3 1被引入 中日韓統一表意文字擴展區BCJK Unified Ideographs Extension B範圍U 20000 U 2A6DF 42 720個碼位 平面表意文字補充平面 SIP 文字漢字已分配42 720個碼位未分配0個保留碼位Unicode版本歷史3 142 711 42 711 13 042 718 7 14 042 720 2 註釋 1 2 擴展B區包含有42 711個新的漢字 位置在 U 20000 U 2A6DD 根據IRG N777號文件 页面存档备份 存于互联网档案馆 這四萬多個漢字分別從以下字典或字集中取得 康熙字典 中出現的18 486個未收錄漢字 包括一個在補遺篇出現的漢字 汉语大字典 中出現的28 914個未收錄漢字 辭源 中出現的66個未收錄漢字 辭海 中出現的247個未收錄漢字 汉语大词典 中出現的553個未收錄漢字 中国大百科全书 中出現的86個未收錄漢字 北大方正排版系统中出現的65個未收錄漢字 四庫全書 中出現的522個未收錄漢字 香港增補字符集中出現的1 081個未收錄漢字 日本工業標準的JIS X 0213第3水準及第4水準的302個未收錄漢字 南韓 PKS 5700 3 1998 中出現的166個未收錄漢字 北韓 KPS 9566 97 和 KPS 10721 2000 國家標準所收錄的5 642個漢字 台灣 CNS 11643 的第4至7和15平面所收錄的30 177個漢字 越南 TCVN VHN 01 1998 和 VHN 02 1998 所收錄的4 232個喃字 這些漢字中重複的漢字有不少 所以經過整理之後 實際總數只有42 711個漢字 另外 在 U 2F800 U 2FA1D 的位置 放了542個來自台灣的兼容漢字 因擴展B區在整理上有缺陷 收錄了以下8個本來應該與其他漢字統一的字 3 4 U 20457 𠑗 U 34A8 㒨 U 2420E 𤈎 U 3DB7 㶷 U 27144 𧅄 U 8641 虁 U 27EAF 𧺯 U FA23 﨣 U 23515 𣔕 U 204F2 𠓲 U 249E9 𤧩 U 249BC 𤦼 U 2A415 𪐕 U 24BD2 𤯒 U 26866 𦡦 U 26842 𦡂而在 WG2 N1155文件中 亦列出了152對可考慮統一的漢字 目录 1 字符列表 2 参见 3 參考資料 3 1 引用 3 2 來源字符列表 编辑以下列表列出了在中日韩统一表意文字扩展区B中的所有文字 中日韩统一表意文字扩展区B列表為避免頁面過大 下列提供分段的中日韩统一表意文字扩展区B列表 中日韩统一表意文字扩展区B列表 20000 215FF 中日韩统一表意文字扩展区B列表 21600 230FF 中日韩统一表意文字扩展区B列表 23100 245FF 中日韩统一表意文字扩展区B列表 24600 260FF 中日韩统一表意文字扩展区B列表 26100 275FF 中日韩统一表意文字扩展区B列表 27600 290FF 中日韩统一表意文字扩展区B列表 29100 2A6DF 参见 编辑中日韩统一表意文字參考資料 编辑引用 编辑 Unicode character database The Unicode Standard 2016 07 09 原始内容存档于2017 09 25 Enumerated Versions of The Unicode Standard The Unicode Standard 2016 07 09 原始内容存档于2016 06 29 存档副本 PDF 2011 02 01 原始内容存档 PDF 于2007 06 12 Cook Richard Defect Report on Duplicate Encoded CJK Forms PDF ISO IEC JTC1 SC2 WG2 6 October 2003 2012 03 28 原始内容存档 PDF 于2007 06 12 來源 编辑 unicode定義的PDF文件 英语 取自 https zh wikipedia org w index php title 中日韓統一表意文字擴展區B amp oldid 68469744, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。