fbpx
维基百科

ISO/IEC 8859

ISO/IEC 8859,是国际标准化组织(ISO)国际电工委员会(IEC)联合制定的一系列8位元字符集的标准。除了已废除的ISO/IEC 8859-12,现时该标准定义了15个字符集。目前制定 ISO/IEC 8859的工作组已经解散,该标准由 ISO/IEC 10646 (同等于统一码/Unicode)取代。

ISO 8859 编码家族
标准ISO/IEC 8859
分类8位元扩展ASCII, ISO/IEC 4873 第一级
拓展自US-ASCII
前用ISO/IEC 646
后续ISO/IEC 10646Unicode
其他相关编码ISO/IEC 10367, Windows-125x

引言

ASCII收录了空格及94个“可印刷字符”,足以给英语使用。但是,其他使用拉丁字母的语言(主要是欧洲国家的语言),都有一定数量的附加符号字母,故可以使用ASCII及控制字符以外的区域来储存及表示。

除了使用拉丁字母的语言外,使用西里尔字母的东欧语言、希腊语泰语、现代阿拉伯语希伯来语等,都可以使用这个形式来储存及表示。

1982年,ANSI与ECMA合作开启此项工作。1985年,公布了ECMA-94,即后来的ISO/IEC 8859 parts 1, 2, 3, 4。第5、6、7、8、9、10、11、12、13、14、15、16部分分别公布于1988年、1987年、1987年、1987年、1989年、1992年、2001年、1997年(正式宣布放弃研发)、1998年、1998年、1999年、2001年。

ISO 8859是基于ISO 2022标准的基础上,在ISO 2022规定的G0码位区域表示ISO 646的95个可打印字符;在C0与C1的控制字符码位区域,表示ISO 6429定义的控制字符;而在G1码位区域,则是由ISO 8859的16个部分各自定义扩展的可打印字符。因此,ISO 8859完全兼容7位的ASCII码。ISO 8859没有使用ISO 2022中的G2、G3区域,也不再使用ISO 2022定义的用来在不同的字符编码集或在同一个编码集的G0、G1、G2、G3区域间转换的“控制字符转义序列”。

ISO 8859统一了此前各国各语言的单独编码的混乱局面;废弃了ASCII/ISO 646使用的退格键开始的转义序列来表示变音字母的方法,而是在G1区域直接编码表示变音字母。

ISO 8859是在1980年代中期甚至1990年代才陆续公布的。因此,微软公司与IBM公司等此前已经在其产品,如MS-DOS, IBM PC上使用了各自定义的编码字符集(即“代码页”Codepage)。ISO 8859公布后,也出现了一些广泛使用的代码页兼容并扩充了ISO 8859。例如,Windows代码页1252作为英文及一些西欧语言版Windows操作系统的默认编码(locale),是 ISO 8859-1 的超集。主要扩充之处是把ISO 8859-1 的保留未用的C1区(即码位0x80-0x9F)用来编码一些可打印字符: ƒ ˆ Š Œ Ž ˜ š œ ž Ÿ 共计27个,其中各种引号就有8个。

各种ISO 8859字符集

  • ISO 8859-8-I - 希伯来语(逻辑顺序)

由於英语没有任何重音字母(不计外来词),故可使用以上十五个字集中的任何一个来表示。

至於德语方面,因它除了 A-Z, a-z 外,只用 Ä, Ö, Ü, ä, ö, ß, ü 七个字母,而所有拉丁字集(1-4, 9-10, 13-16)均有此七个字母,故德语可使用以上十个字集中的任何一个来表示。

此系列中没有-12号的原因是,此计划原本要设计成一个包含塞尔特语族字符集的“Latin-7”,但后来塞尔特语族变成了ISO 8859-14 / Latin-8。亦有一说谓-12号本来是预留给印度天城体梵文的,但后来却搁置了。

基本结构

每个字集定义最多96个字母或符号,在0xA0-0xFF根据不同字符集放入不同的字符。

ISO/IEC 8859十五个字符集的比较
Bin Oct Dec Hex 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
10100000 240 160 A0 NBSP
10100001 241 161 A1 ¡ Ą Ħ Ą Ё ¡ Ą ¡ Ą
10100010 242 162 A2 ¢ ˘ ˘ ĸ Ђ ¢ ¢ Ē ¢ ¢ ą
10100011 243 163 A3 £ Ł £ Ŗ Ѓ £ £ £ Ģ £ £ £ Ł
10100100 244 164 A4 ¤ ¤ ¤ ¤ Є ¤ ¤ ¤ Ī ¤ Ċ
10100101 245 165 A5 ¥ Ľ Ĩ Ѕ ¥ ¥ Ĩ ċ ¥
10100110 246 166 A6 ¦ Ś Ĥ Ļ І ¦ ¦ ¦ Ķ ¦ Š Š
10100111 247 167 A7 § § § § Ї § § § § § § §
10101000 250 168 A8 ¨ ¨ ¨ ¨ Ј ¨ ¨ ¨ Ļ Ø š š
10101001 251 169 A9 © Š İ Š Љ © © © Đ © © © ©
10101010 252 170 AA ª Ş Ş Ē Њ ͺ × ª Š Ŗ ª Ș
10101011 253 171 AB « Ť Ğ Ģ Ћ « « « Ŧ « « «
10101100 254 172 AC ¬ Ź Ĵ Ŧ Ќ ، ¬ ¬ ¬ Ž ¬ ¬ Ź
10101101 255 173 AD ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ ­
10101110 256 174 AE ® Ž Ž Ў ® ® Ū ® ® ® ź
10101111 257 175 AF ¯ Ż Ż ¯ Џ ¯ ¯ Ŋ Æ Ÿ ¯ Ż
10110000 260 176 B0 ° ° ° ° А ° ° ° ° ° ° °
10110001 261 177 B1 ± ą ħ ą Б ± ± ± ą ± ± ±
10110010 262 178 B2 ² ˛ ² ˛ В ² ² ² ē ² Ġ ² Č
10110011 263 179 B3 ³ ł ³ ŗ Г ³ ³ ³ ģ ³ ġ ³ ł
10110100 264 180 B4 ´ ´ ´ ´ Д ΄ ´ ´ ī Ž Ž
10110101 265 181 B5 µ ľ µ ĩ Е ΅ µ µ ĩ µ µ
10110110 266 182 B6 ś ĥ ļ Ж Ά ķ
10110111 267 183 B7 · ˇ · ˇ З · · · · · · ·
10111000 270 184 B8 ¸ ¸ ¸ ¸ И Έ ¸ ¸ ļ ø ž ž
10111001 271 185 B9 ¹ š ı š Й Ή ¹ ¹ đ ¹ ¹ č
10111010 272 186 BA º ş ş ē К Ί ÷ º š ŗ º ș
10111011 273 187 BB » ť ğ ģ Л ؛ » » » ŧ » » »
10111100 274 188 BC ¼ ź ĵ ŧ М Ό ¼ ¼ ž ¼ Œ Œ
10111101 275 189 BD ½ ˝ ½ Ŋ Н ½ ½ ½ ½ œ œ
10111110 276 190 BE ¾ ž ž О Ύ ¾ ¾ ū ¾ Ÿ Ÿ
10111111 277 191 BF ¿ ż ż ŋ П ؟ Ώ ¿ ŋ æ ¿ ż
11000000 300 192 C0 À Ŕ À Ā Р ΐ À Ā Ą À À À
11000001 301 193 C1 Á Á Á Á С ء Α Á Á Į Á Á Á
11000010 302 194 C2 Â Â Â Â Т آ Β Â Â Ā Â Â Â
11000011 303 195 C3 Ã Ă Ã У أ Γ Ã Ã Ć Ã Ã Ă
11000100 304 196 C4 Ä Ä Ä Ä Ф ؤ Δ Ä Ä Ä Ä Ä Ä
11000101 305 197 C5 Å Ĺ Ċ Å Х إ Ε Å Å Å Å Å Ć
11000110 306 198 C6 Æ Ć Ĉ Æ Ц ئ Ζ Æ Æ Ę Æ Æ Æ
11000111 307 199 C7 Ç Ç Ç Į Ч ا Η Ç Į Ē Ç Ç Ç
11001000 310 200 C8 È Č È Č Ш ب Θ È Č Č È È È
11001001 311 201 C9 É É É É Щ ة Ι É É É É É É
11001010 312 202 CA Ê Ę Ê Ę Ъ ت Κ Ê Ę Ź Ê Ê Ê
11001011 313 203 CB Ë Ë Ë Ë Ы ث Λ Ë Ë Ė Ë Ë Ë
11001100 314 204 CC Ì Ě Ì Ė Ь ج Μ Ì Ė Ģ Ì Ì Ì
11001101 315 205 CD Í Í Í Í Э ح Ν Í Í Ķ Í Í Í
11001110 316 206 CE Î Î Î Î Ю خ Ξ Î Î Ī Î Î Î
11001111 317 207 CF Ï Ď Ï Ī Я د Ο Ï Ï Ļ Ï Ï Ï
11010000 320 208 D0 Ð Đ Đ а ذ Π Ğ Ð Š Ŵ Ð Đ
11010001 321 209 D1 Ñ Ń Ñ Ņ б ر Ρ Ñ Ņ Ń Ñ Ñ Ń
11010010 322 210 D2 Ò Ň Ò Ō в ز Ò Ō Ņ Ò Ò Ò
11010011 323 211 D3 Ó Ó Ó Ķ г س Σ Ó Ó Ó Ó Ó Ó
11010100 324 212 D4 Ô Ô Ô Ô д ش Τ Ô Ô Ō Ô Ô Ô
11010101 325 213 D5 Õ Ő Ġ Õ е ص Υ Õ Õ Õ Õ Õ Ő
11010110 326 214 D6 Ö Ö Ö Ö ж ض Φ Ö Ö Ö Ö Ö Ö
11010111 327 215 D7 × × × × з ط Χ × Ũ × × Ś
11011000 330 216 D8 Ø Ř Ĝ Ø и ظ Ψ Ø Ø Ų Ø Ø Ű
11011001 331 217 D9 Ù Ů Ù Ų й ع Ω Ù Ų Ł Ù Ù Ù
11011010 332 218 DA Ú Ú Ú Ú к غ Ϊ Ú Ú Ś Ú Ú Ú
11011011 333 219 DB Û Ű Û Û л Ϋ Û Û Ū Û Û Û
11011100 334 220 DC Ü Ü Ü Ü м ά Ü Ü Ü Ü Ü Ü
11011101 335 221 DD Ý Ý Ŭ Ũ н έ İ Ý Ż Ý Ý Ę
11011110 336 222 DE Þ Ţ Ŝ Ū о ή Ş Þ Ž Ŷ Þ Ț
11011111 337 223 DF ß ß ß ß п ί ß ß ฿ ß ß ß ß
11100000 340 224 E0 à ŕ à ā р ـ ΰ א à ā ą à à à
11100001 341 225 E1 á á á á с ف α ב á á į á á á
11100010 342 226 E2 â â â â т ق β ג â â ā â â â
11100011 343 227 E3 ã ă ã у ك γ ד ã ã ć ã ã ă
11100100 344 228 E4 ä ä ä ä ф ل δ ה ä ä ä ä ä ä
11100101 345 229 E5 å ĺ ċ å х م ε ו å å å å å ć
11100110 346 230 E6 æ ć ĉ æ ц ن ζ ז æ æ ę æ æ æ
11100111 347 231 E7 ç ç ç į ч ه η ח ç į ē ç ç ç
11101000 350 232 E8 è č è č ш و θ ט è č č è è è
11101001 351 233 E9 é é é é щ ى ι י é é é é é é
11101010 352 234 EA ê ę ê ę ъ ي κ ך ê ę ź ê ê ê
11101011 353 235 EB ë ë ë ë ы ً λ כ ë ë ė ë ë ë
11101100 354 236 EC ì ě ì ė ь ٌ μ ל ì ė ģ ì ì ì
11101101 355 237 ED í í í í э ٍ ν ם í í ķ í í í
11101110 356 238 EE î î î î ю َ ξ מ î î ī î î î
11101111 357 239 EF ï ď ï ī я ُ ο ן ï ï ļ ï ï ï
11110000 360 240 F0 ð đ đ ِ π נ ğ ð š ŵ ð đ
11110001 361 241 F1 ñ ń ñ ņ ё ّ ρ ס ñ ņ ń ñ ñ ń
11110010 362 242 F2 ò ň ò ō ђ ْ ς ע ò ō ņ ò ò ò
11110011 363 243 F3 ó ó ó ķ ѓ σ ף ó ó ó ó ó ó
11110100 364 244 F4 ô ô ô ô є τ פ ô ô ō ô ô ô
11110101 365 245 F5 õ ő ġ õ ѕ υ ץ õ õ õ õ õ ő
11110110 366 246 F6 ö ö ö ö і φ צ ö ö ö ö ö ö
11110111 367 247 F7 ÷ ÷ ÷ ÷ ї χ ק ÷ ũ ÷ ÷ ś
11111000 370 248 F8 ø ř ĝ ø ј ψ ר ø ø ų ø ø ű
11111001 371 249 F9 ù ů ù ų љ ω ש ù ų ł ù ù ù
11111010 372 250 FA ú ú ú ú њ ϊ ת ú ú ś ú ú ú
11111011 373 251 FB û ű û û ћ ϋ û û ū û û û
11111100 374 252 FC ü ü ü ü ќ ό ü ü ü ü ü ü
11111101 375 253 FD ý ý ŭ ũ § ύ LRM ı ý ż ý ý ę
11111110 376 254 FE þ ţ ŝ ū ў ώ RLM ş þ ž ŷ þ ț
11111111 377 255 FF ÿ · · · џ ÿ ĸ ÿ ÿ ÿ

在0xA0的位置是“不换行空格”。

在0xAD的位置,大部分都放入了“选择性连字号英语Soft hyphen”(即只在一个文字在它的中间换行时才出现的连字号),若你使用的浏览器支援选择性连字号,上表将不会有任何显示。

黄色的是ISO/IEC 8859-7:2003版本及ISO/IEC 8859-8:1999版本新增的符号。LRM是“左至右符号”、RLM是“右至左符号”。

绿色的是该字集未有定义该位置。

0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定义。(控制字符是由ISO/IEC 6429定义)。

ISO 8859与ISO 8859-n的关系

ISO/IEC 8859-n之中,国际标准化组织只替每个字符集定义了最多96个字符(0xA0-0xFF)。

ISO-8859-n(在ISO与8859之间加上一连字号)则是由IANA根据ISO/IEC 8859-n所定义的编码表。它除了ISO/IEC 8859-n的字符外,还包括ASCII(0x20-0x7E)字符及65个控制字符(0x00-0x1F及0x7F-0x9F)。

类似ISO 8859的编码

ISO 8859-12这个号码本来是预留给印度天城体梵文的,但最终未有定义。印度有自己的编码-ISCII

JIS X 0201日语片假名的字符集标准,能与ISO 8859兼容。

VISCII越南语在本土以外的僑民最常用的字符集标准。但因越南语有超过一百个重音字母,故不兼容ISO 8859。越南國家標準另有符合ISO8859標準的字符集,但字符需要組合,像泰文一樣。

ISO 6438是非洲字母的字符集,但甚少被採納。

发展状况

ISO/IEC 8859 标准由 ISO/IEC 第一联合技术委员会第二分委员会第三工作组(ISO/IEC JTC 1/SC 2/WG 3)管理。2004 年 6 月,第三工作组解散,管理工作移交给第二分委员会。这份标准现在不再更新,因为这个分委员会唯一的工作组——第二工作组,正着力于ISO/IEC 10646的开发。

参看

外部链接

  • 由国际标准化组织出版的ISO/IEC 8859标准,可从以下网址获取(需要付费) 及 ANSI eStandards Store(页面存档备份,存于互联网档案馆)。
  • 部分由ISO/IEC JTC 1/SC 2/WG 3出版的部分ISO/IEC 8859最后审核草案(PDF版本),可从 获取:
    • - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)
    • - 8-bit single-byte coded graphic character sets, Part 4: Latin alphabet No. 4 (draft dated February 12, 1998, published July 1, 1998)
    • - 8-bit single-byte coded graphic character sets, Part 7: Latin/Greek alphabet (draft dated June 10, 1999; superseded by ISO/IEC 8859-7:2003, published October 10, 2003)
    • - 8-bit single-byte coded graphic character sets, Part 10: Latin alphabet No. 6 (draft dated February 12, 1998, published July 15, 1998)
    • - 8-bit single-byte coded graphic character sets, Part 11: Latin/Thai character set (draft dated June 22, 1999; superseded by ISO/IEC 8859-11:2001, published Dec 15, 2001)
    • - 8-bit single-byte coded graphic character sets, Part 13: Latin alphabet No. 7 (draft dated April 15, 1998, published October 15, 1998)
    • - 8-bit single-byte coded graphic character sets, Part 15: Latin alphabet No. 9 (draft dated August 1, 1997; superseded by ISO/IEC 8859-15:1999, published March 15, 1999)
    • - 8-bit single-byte coded graphic character sets, Part 16: Latin alphabet No. 10 (draft dated November 15, 1999; superseded by ISO/IEC 8859-16:2001, published July 15, 2001)
  • ECMA standards, which in intent correspond exactly to the ISO/IEC 8859 character set standards, can be found at:
    • Standard ECMA-94(页面存档备份,存于互联网档案馆):8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
    • Standard ECMA-113(页面存档备份,存于互联网档案馆):8-Bit Single-Byte Coded Graphic Character Sets - Latin/Cyrillic Alphabet 3rd edition (December 1999)
    • Standard ECMA-114(页面存档备份,存于互联网档案馆):8-Bit Single-Byte Coded Graphic Character Sets - Latin/Arabic Alphabet 2nd edition (December 2000)
    • :8-Bit Single-Byte Coded Graphic Character Sets - Latin/Greek Alphabet (December 1986)
    • Standard ECMA-121(页面存档备份,存于互联网档案馆):8-Bit Single-Byte Coded Graphic Character Sets - Latin/Hebrew Alphabet 2nd edition (December 2000)
    • Standard ECMA-128(页面存档备份,存于互联网档案馆):8-Bit Single-Byte Coded Graphic Character Sets - Latin Alphabet No. 5 2nd edition (December 1999)
    • Standard ECMA-144(页面存档备份,存于互联网档案馆):8-Bit Single-Byte Coded Character Sets - Latin Alphabet No. 6 3rd edition (December 2000)
  • 中華民國國家標準》制定了9个标准以对应ISO/IEC 8859的字符集
    • CNS 13246(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第1部:拉丁字母第一號)
    • CNS 13247(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第2部:拉丁字母第二號)
    • CNS 13325(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第3部:拉丁字母第三號)
    • CNS 13326(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第4部:拉丁字母第四號)
    • CNS 13327(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第5部:拉丁/斯拉夫字母)
    • CNS 13328(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第9部:拉丁字母第五號)
    • CNS 13384(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第6部:拉丁/阿拉伯字母)
    • CNS 13385(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第7部:拉丁/希臘字母)
    • CNS 13386(页面存档备份,存于互联网档案馆) 資訊處理–8位元單一位元組碼化圖形字元集(第8部:拉丁/希伯來字母)
  • 中华人民共和国国家标准》制定了5个标准以对应ISO/IEC 8859的字符集
    • GB/T 15273.1-1994 信息处理 八位单字节编码图形字符集 第一部分:拉丁字母一
    • GB/T 15273.2-1995 信息处理 八位单字节编码图形字符集 第二部分:拉丁字母二
    • GB/T 15273.3-1995 信息处理 八位单字节编码图形字符集 第三部分:拉丁字母三
    • GB/T 15273.4-1995 信息处理 八位单字节编码图形字符集 第四部分:拉丁字母四
    • GB/T 15273.7-1996 信息处理 八位单字节编码图形字符集 第七部分:拉丁/希腊字母
  • 各种ISO 8859与Unicode的 对照表(页面存档备份,存于互联网档案馆) 可到Unicode的网站查阅
  • Informal descriptions and code charts for most ISO 8859 standards are available in ISO 8859 Alphabet Soup(页面存档备份,存于互联网档案馆

8859, 是国际标准化组织, 及国际电工委员会, 联合制定的一系列8位元字符集的标准, 除了已废除的, 现时该标准定义了15个字符集, 目前制定, 的工作组已经解散, 该标准由, 10646, 同等于统一码, unicode, 取代, 8859, 编码家族标准分类8位元扩展ascii, 4873, 第一级拓展自us, ascii前用iso, 646后续iso, 10646, unicode, 其他相关编码iso, 10367, windows, 125x查论编, 目录, 引言, 各种iso, 8859字符集, 基. ISO IEC 8859 是国际标准化组织 ISO 及国际电工委员会 IEC 联合制定的一系列8位元字符集的标准 除了已废除的ISO IEC 8859 12 现时该标准定义了15个字符集 目前制定 ISO IEC 8859的工作组已经解散 该标准由 ISO IEC 10646 同等于统一码 Unicode 取代 ISO 8859 编码家族标准ISO IEC 8859分类8位元扩展ASCII ISO IEC 4873 第一级拓展自US ASCII前用ISO IEC 646后续ISO IEC 10646 Unicode 其他相关编码ISO IEC 10367 Windows 125x查论编 目录 1 引言 2 各种ISO 8859字符集 3 基本结构 4 ISO 8859与ISO 8859 n的关系 5 类似ISO 8859的编码 6 发展状况 7 参看 8 外部链接引言 编辑ASCII收录了空格及94个 可印刷字符 足以给英语使用 但是 其他使用拉丁字母的语言 主要是欧洲国家的语言 都有一定数量的附加符号字母 故可以使用ASCII及控制字符以外的区域来储存及表示 除了使用拉丁字母的语言外 使用西里尔字母的东欧语言 希腊语 泰语 现代阿拉伯语 希伯来语等 都可以使用这个形式来储存及表示 1982年 ANSI与ECMA合作开启此项工作 1985年 公布了ECMA 94 即后来的ISO IEC 8859 parts 1 2 3 4 第5 6 7 8 9 10 11 12 13 14 15 16部分分别公布于1988年 1987年 1987年 1987年 1989年 1992年 2001年 1997年 正式宣布放弃研发 1998年 1998年 1999年 2001年 ISO 8859是基于ISO 2022标准的基础上 在ISO 2022规定的G0码位区域表示ISO 646的95个可打印字符 在C0与C1的控制字符码位区域 表示ISO 6429定义的控制字符 而在G1码位区域 则是由ISO 8859的16个部分各自定义扩展的可打印字符 因此 ISO 8859完全兼容7位的ASCII码 ISO 8859没有使用ISO 2022中的G2 G3区域 也不再使用ISO 2022定义的用来在不同的字符编码集或在同一个编码集的G0 G1 G2 G3区域间转换的 控制字符转义序列 ISO 8859统一了此前各国各语言的单独编码的混乱局面 废弃了ASCII ISO 646使用的退格键开始的转义序列来表示变音字母的方法 而是在G1区域直接编码表示变音字母 ISO 8859是在1980年代中期甚至1990年代才陆续公布的 因此 微软公司与IBM公司等此前已经在其产品 如MS DOS IBM PC上使用了各自定义的编码字符集 即 代码页 Codepage ISO 8859公布后 也出现了一些广泛使用的代码页兼容并扩充了ISO 8859 例如 Windows代码页1252作为英文及一些西欧语言版Windows操作系统的默认编码 locale 是 ISO 8859 1 的超集 主要扩充之处是把ISO 8859 1 的保留未用的C1区 即码位0x80 0x9F 用来编码一些可打印字符 ƒ ˆ S Œ Z s œ z Ÿ 共计27个 其中各种引号就有8个 各种ISO 8859字符集 编辑ISO IEC 8859 1 Latin 1 西欧语言 ISO IEC 8859 2 Latin 2 中欧语言 ISO IEC 8859 3 Latin 3 南欧语言 世界语也可用此字符集显示 ISO IEC 8859 4 Latin 4 北欧语言 ISO IEC 8859 5 Cyrillic 斯拉夫语言 ISO IEC 8859 6 Arabic 阿拉伯语 ISO IEC 8859 7 Greek 希腊语 ISO IEC 8859 8 Hebrew 希伯来语 视觉顺序 ISO 8859 8 I 希伯来语 逻辑顺序 ISO IEC 8859 9 Latin 5 或 Turkish 它把Latin 1的冰岛语字母换走 加入土耳其语字母 ISO IEC 8859 10 Latin 6 或 Nordic 北日耳曼语支 用来代替Latin 4 ISO IEC 8859 11 Thai 泰语 从泰国的 TIS620 标准字集演化而来 ISO IEC 8859 13 Latin 7 或 Baltic Rim 波罗的语族 ISO IEC 8859 14 Latin 8 或 Celtic 凯尔特语族 ISO IEC 8859 15 Latin 9 西欧语言 加入Latin 1欠缺的芬兰语字母和大写法语重音字母 以及欧元 符号 ISO IEC 8859 16 Latin 10 东南欧语言 主要供罗马尼亚语使用 并加入欧元符号 由於英语没有任何重音字母 不计外来词 故可使用以上十五个字集中的任何一个来表示 至於德语方面 因它除了 A Z a z 外 只用 A O U a o ss u 七个字母 而所有拉丁字集 1 4 9 10 13 16 均有此七个字母 故德语可使用以上十个字集中的任何一个来表示 此系列中没有 12号的原因是 此计划原本要设计成一个包含塞尔特语族字符集的 Latin 7 但后来塞尔特语族变成了ISO 8859 14 Latin 8 亦有一说谓 12号本来是预留给印度天城体梵文的 但后来却搁置了 基本结构 编辑每个字集定义最多96个字母或符号 在0xA0 0xFF根据不同字符集放入不同的字符 ISO IEC 8859十五个字符集的比较 Bin Oct Dec Hex 1 2 3 4 5 6 7 8 9 10 11 13 14 15 1610100000 240 160 A0 NBSP10100001 241 161 A1 A Ħ A Yo A k Ḃ A10100010 242 162 A2 ĸ Ђ E kh ḃ a10100011 243 163 A3 L Ŗ Ѓ G kh L10100100 244 164 A4 Ye i kh Ċ 10100101 245 165 A5 Ľ Ĩ Ѕ Ĩ Kh ċ 10100110 246 166 A6 S Ĥ L I k kh Ḋ S S10100111 247 167 A7 Yi ng 10101000 250 168 A8 Ј L c O Ẁ s s10101001 251 169 A9 c S I S Љ c c c Đ ch c c c c 10101010 252 170 AA ª S S E Њ ͺ ª S ch Ŗ Ẃ ª Ș10101011 253 171 AB T G G Ћ Ŧ s ḋ 10101100 254 172 AC Z Ĵ Ŧ Ќ Z ch Ỳ Z10101101 255 173 AD y 10101110 256 174 AE Z Z Ў u d z10101111 257 175 AF Z Z Џ Ŋ t AE Ÿ Z10110000 260 176 B0 A th Ḟ 10110001 261 177 B1 a ħ a B a th ḟ 10110010 262 178 B2 V e th Ġ C10110011 263 179 B3 l ŗ G g n ġ l10110100 264 180 B4 D i d Ṁ Z Z10110101 265 181 B5 µ ľ µ ĩ E µ µ ĩ t µ ṁ µ 10110110 266 182 B6 s ĥ l Zh A k th 10110111 267 183 B7 ˇ ˇ Z th Ṗ 10111000 270 184 B8 I E l th o ẁ z z10111001 271 185 B9 s i s J H đ n ṗ c10111010 272 186 BA º s s e K I º s b ŗ ẃ º ș10111011 273 187 BB t g g L ŧ p Ṡ 10111100 274 188 BC z ĵ ŧ M O z ph ỳ Œ Œ10111101 275 189 BD Ŋ N f Ẅ œ œ10111110 276 190 BE z z O Y u ph ẅ Ÿ Ÿ10111111 277 191 BF z z ŋ P W ŋ f ae ṡ z11000000 300 192 C0 A Ŕ A A R i A A ph A A A A11000001 301 193 C1 A A A A S ء A A A m Į A A A11000010 302 194 C2 A A A A T آ B A A y A A A A11000011 303 195 C3 A Ă A U أ G A A r C A A Ă11000100 304 196 C4 A A A A F ؤ D A A v A A A A11000101 305 197 C5 A Ĺ Ċ A H إ E A A l A A A C11000110 306 198 C6 AE C Ĉ AE C ئ Z AE AE l e AE AE AE11000111 307 199 C7 C C C Į Ch ا H C Į w E C C C11001000 310 200 C8 E C E C Sh ب 8 E C s C E E E11001001 311 201 C9 E E E E Sh ة I E E s E E E E11001010 312 202 CA E e E e ت K E e s Z E E E11001011 313 203 CB E E E E Y ث L E E h Ė E E E11001100 314 204 CC I E I Ė ج M I Ė l G I I I11001101 315 205 CD I I I I E ح N I I x k I I I11001110 316 206 CE I I I I Yu خ 3 I I h i I I I11001111 317 207 CF I D I i Ya د O I I L I I I11010000 320 208 D0 D Đ Đ a ذ P G D a S Ŵ D Đ11010001 321 209 D1 N N N N b ر R N N N N N N11010010 322 210 D2 O N O Ō v ز O Ō a N O O O11010011 323 211 D3 o o o k g س S o o a o o o o11010100 324 212 D4 O O O O d ش T O O i Ō O O O11010101 325 213 D5 O O Ġ O e ص Y O O i O O O O11010110 326 214 D6 O O O O zh ض F O O u O O O O11010111 327 215 D7 z ط X Ũ u Ṫ S11011000 330 216 D8 O R Ĝ O i ظ PS O O u Ų O O U11011001 331 217 D9 U U U Ų j ع W U Ų u L U U U11011010 332 218 DA U U U U k غ I U U S U U U11011011 333 219 DB U U U U l Y U U u U U U11011100 334 220 DC U U U U m a U U U U U U11011101 335 221 DD Y Y Ŭ Ũ n e I Y Z Y Y e11011110 336 222 DE TH Ţ Ŝ u o h S TH Z Ŷ TH Ț11011111 337 223 DF ss ss ss ss p i ss ss ss ss ss ss11100000 340 224 E0 a ŕ a a r ـ y א a a e a a a a11100001 341 225 E1 a a a a s ف a ב a a ae į a a a11100010 342 226 E2 a a a a t ق b ג a a o a a a a11100011 343 227 E3 a ă a u ك g ד a a i c a a ă11100100 344 228 E4 a a a a f ل d ה a a i a a a a11100101 345 229 E5 a ĺ ċ a h م e ו a a i a a a c11100110 346 230 E6 ae c ĉ ae c ن z ז ae ae e ae ae ae11100111 347 231 E7 c c c į ch ه h ח c į e c c c11101000 350 232 E8 e c e c sh و 8 ט e c c e e e11101001 351 233 E9 e e e e sh ى i י e e e e e e11101010 352 234 EA e e e e ي k ך e e z e e e11101011 353 235 EB e e e e y l כ e e e e e e11101100 354 236 EC i e i e m ל i e g i i i11101101 355 237 ED i i i i e n ם i i k i i i11101110 356 238 EE i i i i yu 3 מ i i i i i i11101111 357 239 EF i d i i ya o ן i i l i i i11110000 360 240 F0 d đ đ p נ g d 0 s ŵ d đ11110001 361 241 F1 n n n n yo r ס n n 1 n n n n11110010 362 242 F2 o n o ō ђ s ע o ō 2 n o o o11110011 363 243 F3 o o o k ѓ s ף o o 3 o o o o11110100 364 244 F4 o o o o ye t פ o o 4 ō o o o11110101 365 245 F5 o o ġ o ѕ y ץ o o 5 o o o o11110110 366 246 F6 o o o o i f צ o o 6 o o o o11110111 367 247 F7 yi x ק ũ 7 ṫ s11111000 370 248 F8 o r ĝ o ј ps ר o o 8 u o o u11111001 371 249 F9 u u u u љ w ש u u 9 l u u u11111010 372 250 FA u u u u њ i ת u u s u u u11111011 373 251 FB u u u u ћ y u u u u u u11111100 374 252 FC u u u u ќ o u u u u u u11111101 375 253 FD y y ŭ ũ y LRM i y z y y e11111110 376 254 FE th ţ ŝ u y w RLM s th z ŷ th ț11111111 377 255 FF y џ y ĸ y y y在0xA0的位置是 不换行空格 在0xAD的位置 大部分都放入了 选择性连字号 英语 Soft hyphen 即只在一个文字在它的中间换行时才出现的连字号 若你使用的浏览器支援选择性连字号 上表将不会有任何显示 黄色 的是ISO IEC 8859 7 2003版本及ISO IEC 8859 8 1999版本新增的符号 LRM是 左至右符号 RLM是 右至左符号 绿色 的是该字集未有定义 该位置 0x00 0x1F 0x7F 0x80 0x9F在此字符集中未有定义 控制字符是由ISO IEC 6429定义 ISO 8859与ISO 8859 n的关系 编辑在ISO IEC 8859 n之中 国际标准化组织只替每个字符集定义了最多96个字符 0xA0 0xFF ISO 8859 n 在ISO与8859之间加上一连字号 则是由IANA根据ISO IEC 8859 n所定义的编码表 它除了ISO IEC 8859 n的字符外 还包括ASCII 0x20 0x7E 字符及65个控制字符 0x00 0x1F及0x7F 0x9F 类似ISO 8859的编码 编辑ISO 8859 12这个号码本来是预留给印度天城体梵文的 但最终未有定义 印度有自己的编码 ISCII JIS X 0201是日语片假名的字符集标准 能与ISO 8859兼容 VISCII是越南语在本土以外的僑民最常用的字符集标准 但因越南语有超过一百个重音字母 故不兼容ISO 8859 越南國家標準另有符合ISO8859標準的字符集 但字符需要組合 像泰文一樣 ISO 6438是非洲字母的字符集 但甚少被採納 发展状况 编辑ISO IEC 8859 标准由 ISO IEC 第一联合技术委员会第二分委员会第三工作组 ISO IEC JTC 1 SC 2 WG 3 管理 2004 年 6 月 第三工作组解散 管理工作移交给第二分委员会 这份标准现在不再更新 因为这个分委员会唯一的工作组 第二工作组 正着力于ISO IEC 10646的开发 参看 编辑ASCII ISO IEC 646 ISO IEC 8859 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 国际标准化组织 ISO 外部链接 编辑由国际标准化组织出版的ISO IEC 8859标准 可从以下网址获取 需要付费 ISO catalogue site 及 ANSI eStandards Store 页面存档备份 存于互联网档案馆 部分由ISO IEC JTC 1 SC 2 WG 3出版的部分ISO IEC 8859最后审核草案 PDF版本 可从 WG 3网站 获取 ISO IEC 8859 1 1998 8 bit single byte coded graphic character sets Part 1 Latin alphabet No 1 draft dated February 12 1998 published April 15 1998 ISO IEC 8859 4 1998 8 bit single byte coded graphic character sets Part 4 Latin alphabet No 4 draft dated February 12 1998 published July 1 1998 ISO IEC 8859 7 1999 8 bit single byte coded graphic character sets Part 7 Latin Greek alphabet draft dated June 10 1999 superseded by ISO IEC 8859 7 2003 published October 10 2003 ISO IEC 8859 10 1998 8 bit single byte coded graphic character sets Part 10 Latin alphabet No 6 draft dated February 12 1998 published July 15 1998 ISO IEC 8859 11 1999 8 bit single byte coded graphic character sets Part 11 Latin Thai character set draft dated June 22 1999 superseded by ISO IEC 8859 11 2001 published Dec 15 2001 ISO IEC 8859 13 1998 8 bit single byte coded graphic character sets Part 13 Latin alphabet No 7 draft dated April 15 1998 published October 15 1998 ISO IEC 8859 15 1998 8 bit single byte coded graphic character sets Part 15 Latin alphabet No 9 draft dated August 1 1997 superseded by ISO IEC 8859 15 1999 published March 15 1999 ISO IEC 8859 16 2000 8 bit single byte coded graphic character sets Part 16 Latin alphabet No 10 draft dated November 15 1999 superseded by ISO IEC 8859 16 2001 published July 15 2001 ECMA standards which in intent correspond exactly to the ISO IEC 8859 character set standards can be found at Standard ECMA 94 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Graphic Character Sets Latin Alphabets No 1 to No 4 2nd edition June 1986 Standard ECMA 113 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Graphic Character Sets Latin Cyrillic Alphabet 3rd edition December 1999 Standard ECMA 114 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Graphic Character Sets Latin Arabic Alphabet 2nd edition December 2000 Standard ECMA 118 8 Bit Single Byte Coded Graphic Character Sets Latin Greek Alphabet December 1986 Standard ECMA 121 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Graphic Character Sets Latin Hebrew Alphabet 2nd edition December 2000 Standard ECMA 128 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Graphic Character Sets Latin Alphabet No 5 2nd edition December 1999 Standard ECMA 144 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Character Sets Latin Alphabet No 6 3rd edition December 2000 中華民國國家標準 制定了9个标准以对应ISO IEC 8859的字符集 CNS 13246 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第1部 拉丁字母第一號 CNS 13247 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第2部 拉丁字母第二號 CNS 13325 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第3部 拉丁字母第三號 CNS 13326 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第4部 拉丁字母第四號 CNS 13327 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第5部 拉丁 斯拉夫字母 CNS 13328 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第9部 拉丁字母第五號 CNS 13384 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第6部 拉丁 阿拉伯字母 CNS 13385 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第7部 拉丁 希臘字母 CNS 13386 页面存档备份 存于互联网档案馆 資訊處理 8位元單一位元組碼化圖形字元集 第8部 拉丁 希伯來字母 中华人民共和国国家标准 制定了5个标准以对应ISO IEC 8859的字符集 GB T 15273 1 1994 信息处理 八位单字节编码图形字符集 第一部分 拉丁字母一 GB T 15273 2 1995 信息处理 八位单字节编码图形字符集 第二部分 拉丁字母二 GB T 15273 3 1995 信息处理 八位单字节编码图形字符集 第三部分 拉丁字母三 GB T 15273 4 1995 信息处理 八位单字节编码图形字符集 第四部分 拉丁字母四 GB T 15273 7 1996 信息处理 八位单字节编码图形字符集 第七部分 拉丁 希腊字母各种ISO 8859与Unicode的 对照表 页面存档备份 存于互联网档案馆 可到Unicode的网站查阅 Informal descriptions and code charts for most ISO 8859 standards are available in ISO 8859 Alphabet Soup 页面存档备份 存于互联网档案馆 Mirror 取自 https zh wikipedia org w index php title ISO IEC 8859 amp oldid 76592810, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。