fbpx
维基百科

ISO-IR-165

ISO-IR-165通訊用中文多位元組字符集》(Codes of the Chinese graphic character set for communication)是中國大陸於1992年為国际电信联盟电信标准化部门(CCITT[1] 創製之中文多位元組通訊字符集。该编码在ISO 2022下注册的名称为 ISO-IR-165,可以使用 ISO-2022-CN-EXT 进行编码。

ISO-IR-165 整合 GB 2312(包括 GB/T 6345.1-86《信息交换用汉字 32x32 点阵字模集》新增之字符及調整[2])以及 GB/T 8565.2-88《信息处理文本通信用编码字符集 第二部分:图形字符集》。该标准合共 8446 個字符。

GB/T 6345.1的修订和补充 编辑

GB/T 6345.1-1986《信息交换用汉字 32x32 点阵字模集》(后续改成GB/T 6345.1-2010)包括了对 GB/T 2312 的修正和补充。[2]相关的修订最早是由GB 5007.1–85《信息交换用汉字 24x24 点阵字模集》所加入。

GB/T 6345.1 对现有 GB/T 2312 的修订[2]
区位码 EUC码 GB/T 2312(未修订) GB/T 6341.1 备注
03-71 0xA3E7   ɡ [a]
79-81 0xEFF1 [b]
  1. ^ 对应 Unicode U+FF47 ;但是 GB/T 6341.1 的字形也可以对应至U+0261 ɡ
  2. ^ 原字对应繁体中文的U+937E ,修改后成为简体的U+953A 。《汉字简化方案》内原先将“鍾”合并进“钟”(“鐘”的简化字),后续1986年的《简化字总表》允许在人名中使用“锺”,而相似的标准(如 GB/T 5007.1–85)也将该字修改成使用简体“钅”旁的“锺”。

后续实践 GB/T 2312 的编码(如Windows 的代碼頁936)将 79-81 对应的汉字 Unicode 码从“鍾”改为“锺”。[3]

GB/T 6345.1-86 也在 GB/T 2312 的基础上在第 10 区补充了ISO 646-CN 的半宽字符(3 区的字符为全宽字符)和第 8 区补充了 6 个汉语拼音字符。[2]这些补充也在 GB/T 12345 内出现,而 GB/T 12345 也额外在第 6 区加上了 29 个竖排标点符号。[2][4]

2011年發佈的 GB/T 6345.1-2010 正式在第 11 区增加了對應 8 区 32 个汉语拼音字符(包括新补充的6个字符)的半宽版本。[5]這個補充并未在 GB 18030 内實行。[6]

Classic Mac OS 内的简体中文编码(基于EUC-CN修改)[7]GB 18030 包含了 GB/T 6345.1 补充的 6 个汉语拼音字符(但是不包括半宽版本)和 GB/T 12345 补充的竖排标点符号。[6] 新增的 6 个汉语拼音字符如下:[7]

GB/T 2312 第 8 区的扩充
区位码 EUC码 字符[7][6] 备注
08-27 0xA8BB U+0251 ɑ
08-28 0xA8BC U+1E3F ḿ [a]
08-29 0xA8BD U+0144 ń
08-30 0xA8BE U+0148 ň
08-31 0xA8BF U+01F9 ǹ [b]
08-32 0xA8C0 U+0261   [c]
  1. ^ Windows CP936[8] 和 GB 18030-2000 映射至私用区 U+E7C7,GB 18030-2005 修改成 U+1E3F[6]
  2. ^ 此字符是在 Unicode 3.0 新增的,在这之前该字符一般映射至 U+006E, U+0300[7] Windows CP936 映射至私用区 U+E7C8[8]
  3. ^ 与未修订 GB/T 2312 的 03-71 一样(见上表)。ISO-IR-165 的 Unicode 映射有差异。

GB/T 8565.2 的修订和补充 编辑

GB/T 8565.2-1988《信息处理文本通信用编码字符集第二部分:图形字符集》也定义了 GB/T 2312 的补充字符,在 13-15 区和 90-94 区之间新增了 705 个字符,其中 15 区新增的 69 个字符是非汉字。该修订包括了 GB/T 6345.1 的修订,但是没有包括补充字符。[2]

Unihan 资料库中引用中国大陆来源 GB/T 8565 的汉字使用 G8 来标示。[1]

CCITT 修订 编辑

ISO-IR-165 包括了 GB/T 6345.1 和 GB/T 8565.2 在 GB/T 2312 的新增补充字符。另外,ISO-IR-165 也新增了 161 个字符,其中 139 个汉字是“普通汉字和异体”。[2][9]有时这些 CCITT 的新增字会和 GB/T 8565.2 混淆,包括以前的 Unihan 资料库。[1]

CCITT 在第 6 区新增了对应第 3 区的像字符[9],这些字符和 Mac OS 简体中文[7] 和 GB 18030[6] 的新增字符相撞。

ISO-IR-165 包含了 GB/T 6345.1 的订正,但是其中有两个字符的 Unicode 映射与 GB/T 2312 和 GB/T 6345.1 扩展的映射不同。下表顯示各標準的映射和對應字形,也另附 GB 18030 的對應編碼:

区位码 EUC码 GB/T 2312(未修订) GB/T 6345.1[5] GB/T 6345.1 映射[7] ISO-IR-165[9] ISO-IR-165映射[10] GB 18030[6] GB 18030 映射[6]
03-71 0xA3E7   ɡ U+FF47 ɡ U+0261   U+FF47
08-32 0xA8C0 (无)   U+0261   U+FF47 ɡ U+0261
79-81 0xEFF1 U+953A U+953A U+953A

来源 编辑

  1. ^ 1.0 1.1 1.2 Chung, Jaemin. (PDF). 2018-01-24 [2022-05-05]. ISO/IEC JTC 1/SC 2/WG 2/IRG N2276. (原始内容 (PDF)存档于2022-03-19). 
  2. ^ 2.0 2.1 2.2 2.3 2.4 2.5 2.6 Lunde, Ken Roger. 第二版. O'Reilly. 2008年十二月 [2022-05-06]. ISBN 978-0-596-51447-1. (原始内容存档于2011-08-29). 
  3. ^ Steele, Shawn. . Microsoft, Unicode Consortium. 2000 [2022-05-05]. (原始内容存档于2022-03-18). 
  4. ^ Lunde, Ken. (PDF). CJKV Information Processing (O'Reilly). 1998 [2022-05-05]. ISBN 9781565922242. (原始内容 (PDF)存档于2019-02-02). 
  5. ^ 5.0 5.1 中華人民共和國国家标准化管理委员会. GB/T 6345.1-2010 信息技术 汉字编码字符集(基本集) 32点阵字型 第1部分宋体. 中國. 2011-01-10 (中文(中国大陆)). 
  6. ^ 6.0 6.1 6.2 6.3 6.4 6.5 6.6 Standardization Administration of China (SAC). GB 18030-2005: Information Technology—Chinese coded character set. 2005-11-18. 
  7. ^ 7.0 7.1 7.2 7.3 7.4 7.5 . Apple, Inc. [2022-05-05]. (原始内容存档于2021-02-05). 
  8. ^ 8.0 8.1 Microsoft. . Unicode Consortium. [2022-05-05]. (原始内容存档于2021-01-19). 
  9. ^ 9.0 9.1 9.2 CCITT. (PDF). ITSCJ/IPSJ. 1992-07-13 [2022-05-06]. (原始内容 (PDF)存档于2022-03-10). 
  10. ^ Viswanadha, Raghuram. Unicode to ISO-IR-165 table. International Components for Unicod-e. IBM. 2000-08-30.  (备注:编号根据来源使用 7 位元或 ISO 2022:加上 0×80 生成EUC码,或减去 0×20 生成区位码

外部連結 编辑

通訊用中文多位元組字符集, codes, chinese, graphic, character, communication, 是中國大陸於1992年為国际电信联盟电信标准化部门, ccitt, 創製之中文多位元組通訊字符集, 该编码在iso, 2022下注册的名称为, 可以使用, 2022, 进行编码, 整合, 2312, 包括, 6345, 信息交换用汉字, 32x32, 点阵字模集, 新增之字符及調整, 以及, 8565, 信息处理文本通信用编码字符集, 第二部分, 图形字符集, 该标准合共, 8446, . ISO IR 165 通訊用中文多位元組字符集 Codes of the Chinese graphic character set for communication 是中國大陸於1992年為国际电信联盟电信标准化部门 CCITT 1 創製之中文多位元組通訊字符集 该编码在ISO 2022下注册的名称为 ISO IR 165 可以使用 ISO 2022 CN EXT 进行编码 ISO IR 165 整合 GB 2312 包括 GB T 6345 1 86 信息交换用汉字 32x32 点阵字模集 新增之字符及調整 2 以及 GB T 8565 2 88 信息处理文本通信用编码字符集 第二部分 图形字符集 该标准合共 8446 個字符 目录 1 GB T 6345 1的修订和补充 2 GB T 8565 2 的修订和补充 3 CCITT 修订 4 来源 5 外部連結GB T 6345 1的修订和补充 编辑GB T 6345 1 1986 信息交换用汉字 32x32 点阵字模集 后续改成GB T 6345 1 2010 包括了对 GB T 2312 的修正和补充 2 相关的修订最早是由GB 5007 1 85 信息交换用汉字 24x24 点阵字模集 所加入 GB T 6345 1 对现有 GB T 2312 的修订 2 区位码 EUC码 GB T 2312 未修订 GB T 6341 1 备注03 71 0xA3E7 nbsp ɡ a 79 81 0xEFF1 鍾 锺 b 对应 Unicode U FF47 g 但是 GB T 6341 1 的字形也可以对应至U 0261 ɡ 原字对应繁体中文的U 937E 鍾 修改后成为简体的U 953A 锺 汉字简化方案 内原先将 鍾 合并进 钟 鐘 的简化字 后续1986年的 简化字总表 允许在人名中使用 锺 而相似的标准 如 GB T 5007 1 85 也将该字修改成使用简体 钅 旁的 锺 后续实践 GB T 2312 的编码 如Windows 的代碼頁936 将 79 81 对应的汉字 Unicode 码从 鍾 改为 锺 3 GB T 6345 1 86 也在 GB T 2312 的基础上在第 10 区补充了ISO 646 CN 的半宽字符 3 区的字符为全宽字符 和第 8 区补充了 6 个汉语拼音字符 2 这些补充也在 GB T 12345 内出现 而 GB T 12345 也额外在第 6 区加上了 29 个竖排标点符号 2 4 2011年發佈的 GB T 6345 1 2010 正式在第 11 区增加了對應 8 区 32 个汉语拼音字符 包括新补充的6个字符 的半宽版本 5 這個補充并未在 GB 18030 内實行 6 Classic Mac OS 内的简体中文编码 基于EUC CN修改 7 和 GB 18030 包含了 GB T 6345 1 补充的 6 个汉语拼音字符 但是不包括半宽版本 和 GB T 12345 补充的竖排标点符号 6 新增的 6 个汉语拼音字符如下 7 GB T 2312 第 8 区的扩充 区位码 EUC码 字符 7 6 备注08 27 0xA8BB U 0251 ɑ08 28 0xA8BC U 1E3F ḿ a 08 29 0xA8BD U 0144 n08 30 0xA8BE U 0148 n08 31 0xA8BF U 01F9 ǹ b 08 32 0xA8C0 U 0261 nbsp c Windows CP936 8 和 GB 18030 2000 映射至私用区 U E7C7 GB 18030 2005 修改成 U 1E3F 6 此字符是在 Unicode 3 0 新增的 在这之前该字符一般映射至 U 006E U 0300 7 Windows CP936 映射至私用区 U E7C8 8 与未修订 GB T 2312 的 03 71 一样 见上表 ISO IR 165 的 Unicode 映射有差异 GB T 8565 2 的修订和补充 编辑GB T 8565 2 1988 信息处理文本通信用编码字符集第二部分 图形字符集 也定义了 GB T 2312 的补充字符 在 13 15 区和 90 94 区之间新增了 705 个字符 其中 15 区新增的 69 个字符是非汉字 该修订包括了 GB T 6345 1 的修订 但是没有包括补充字符 2 Unihan 资料库中引用中国大陆来源 GB T 8565 的汉字使用 G8 来标示 1 CCITT 修订 编辑ISO IR 165 包括了 GB T 6345 1 和 GB T 8565 2 在 GB T 2312 的新增补充字符 另外 ISO IR 165 也新增了 161 个字符 其中 139 个汉字是 普通汉字和异体 2 9 有时这些 CCITT 的新增字会和 GB T 8565 2 混淆 包括以前的 Unihan 资料库 1 CCITT 在第 6 区新增了对应第 3 区的像字符 9 这些字符和 Mac OS 简体中文 7 和 GB 18030 6 的新增字符相撞 ISO IR 165 包含了 GB T 6345 1 的订正 但是其中有两个字符的 Unicode 映射与 GB T 2312 和 GB T 6345 1 扩展的映射不同 下表顯示各標準的映射和對應字形 也另附 GB 18030 的對應編碼 区位码 EUC码 GB T 2312 未修订 GB T 6345 1 5 GB T 6345 1 映射 7 ISO IR 165 9 ISO IR 165映射 10 GB 18030 6 GB 18030 映射 6 03 71 0xA3E7 nbsp ɡ U FF47 ɡ U 0261 nbsp U FF4708 32 0xA8C0 无 nbsp U 0261 nbsp U FF47 ɡ U 026179 81 0xEFF1 鍾 锺 U 953A 锺 U 953A 锺 U 953A来源 编辑 1 0 1 1 1 2 Chung Jaemin Pseudo G8 characters PDF 2018 01 24 2022 05 05 ISO IEC JTC 1 SC 2 WG 2 IRG N2276 原始内容 PDF 存档于2022 03 19 2 0 2 1 2 2 2 3 2 4 2 5 2 6 Lunde Ken Roger CJKV Information Processing 第二版 O Reilly 2008年十二月 2022 05 06 ISBN 978 0 596 51447 1 原始内容存档于2011 08 29 请检查 date 中的日期值 帮助 Steele Shawn cp936 to Unicode table Microsoft Unicode Consortium 2000 2022 05 05 原始内容存档于2022 03 18 Lunde Ken Appendix F GB T 12345 PDF CJKV Information Processing O Reilly 1998 2022 05 05 ISBN 9781565922242 原始内容 PDF 存档于2019 02 02 5 0 5 1 中華人民共和國国家标准化管理委员会 GB T 6345 1 2010 信息技术 汉字编码字符集 基本集 32点阵字型 第1部分宋体 中國 2011 01 10 中文 中国大陆 6 0 6 1 6 2 6 3 6 4 6 5 6 6 Standardization Administration of China SAC GB 18030 2005 Information Technology Chinese coded character set 2005 11 18 7 0 7 1 7 2 7 3 7 4 7 5 Mac OS 简体中文版本对 Unicode 3 0 后的映射 Apple Inc 2022 05 05 原始内容存档于2021 02 05 8 0 8 1 Microsoft CODEPAGE 936 PRC GBK XGB ANSI OEM Unicode Consortium 2022 05 05 原始内容存档于2021 01 19 9 0 9 1 9 2 CCITT Codes of the Chinese graphic character set for communication PDF ITSCJ IPSJ 1992 07 13 2022 05 06 原始内容 PDF 存档于2022 03 10 Viswanadha Raghuram Unicode to ISO IR 165 table International Components for Unicod e IBM 2000 08 30 备注 编号根据来源使用 7 位元或 ISO 2022 加上 0 80 生成EUC码 或减去 0 20 生成区位码 外部連結 编辑ISO IR 165 1992 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title ISO IR 165 amp oldid 71797112, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。