fbpx
维基百科

ISO/IEC 8859-1

ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母符号,藉以供使用附加符号拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。

ISO-8859-1的别名有: iso-ir-100csISOLatin1latin1l1IBM819Oracle数据库WE8ISO8859P1[1]

与Windows-1252的区别

互联网上,常见把Windows-1252编码的文本误标称为ISO-8859-1,最常见后果是引号与撇号‘ ’“ ”在非Windows环境下被当作不识别字符显示为问号或方块(boxes)字符。大部分现代网页浏览器与e-mail客户端把互联网媒体类型字符集为ISO-8859-1当作Windows-1252来处理。HTML5标准要求把宣称为ISO-8859-1的文本当作Windows-1252编码来解析。[2]

截至2017年10月 (2017-10),4.5%声明是ISO 8859-1编码。[3]这包含了未知数量的实际上是Windows-1252或UTF-8编码的网页常常被浏览器识别为ISO 8859-1编码。

ISO-8859-1与Windows-1252代码页的区别是:码位128至159(十六进制80至9F)原本是罕用的C1控制字符编码范围,被替换为额外的一些常用但未包含在ISO-8859-1中的字符。实际上Windows-1252代码页包含了所有出现在ISO-8859-15中的字符。ISO-8859-1对应的Windows代码页是Windows-28591[4]然而,英文版的Windows 7、Windows10家庭中文版系统上没有Windows-28591代码页。

与ISO/IEC 10646即Unicode的关系

ISO-8859-1对应于ISO/IEC 10646即Unicode的前256个码位。

适用语言

此字符集支持部分于欧洲使用的语言,包括阿尔巴尼亚语巴斯克语布列塔尼语加泰罗尼亚语丹麦语荷兰语法罗语弗里西语加利西亚语德语格陵兰语冰岛语爱尔兰盖尔语意大利语拉丁语卢森堡语挪威语葡萄牙语里托罗曼斯语苏格兰盖尔语西班牙语瑞典语

英语虽然没有重音字母,但仍会标明为ISO/IEC 8859-1编码。除此之外,欧洲以外的部分语言,如南非荷兰语斯瓦希里语印尼语马来语、菲律宾他加洛语等也可使用ISO/IEC 8859-1编码。

法语芬兰语本来也使用ISO/IEC 8859-1来表示。但因它没有法语使用的 œŒŸ 三个字母及芬兰语使用的 ŠšŽž ,故于1998年被ISO/IEC 8859-15所取代。(ISO 8859-15同时加入了欧元符号)

字符集

ISO/IEC 8859-1
  x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x  
1x  
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~  
8x  
9x  
Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
Bx ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

在上表中,0x20是空格、0xA0是不换行空格、0xAD是选择性连接号

0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定义。(控制字符是由ISO/IEC 6429定义)。

參考資料

  1. ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Law, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie. Appendix A: Locale Data. Oracle9i Database Globalization Support Guide (PDF) Release 2 (9.2). Oracle Corporation. 2002 [1996] [2017-02-14]. Oracle A96529-01. (原始内容 (PDF)于2017-02-14). 
  2. ^ . WHATWG. sec. 5.2 Names and labels. 27 January 2015 [4 February 2015]. (原始内容存档于2015-02-04). 
  3. ^ . [2017-10-24]. (原始内容存档于2021-03-03). 
  4. ^ Code Page Identifiers. Microsoft Corporation. [2010-12-19]. (原始内容于2010-12-15). 

参閲

外部链接

  • 到国际标准化组织购买此标准(页面存档备份,存于互联网档案馆
  • - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)
  • Standard ECMA-94(页面存档备份,存于互联网档案馆):8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
  • Right-Hand Part of Latin Alphabet No.1 (February 1, 1986)
  • 中國國家標準(中華民國)CNS 13246(页面存档备份,存于互联网档案馆

8859, 8859, 正式编号为, 1998, 又称latin, 1或, 西欧语言, 是国际标准化组织内iso, 8859的第一个8位字符集, 它以ascii为基础, 在空置的0xa0, 0xff的范围内, 加入96个字母及符号, 藉以供使用附加符号的拉丁字母语言使用, 曾推出过, 8859, 1987, 8859, 1的别名有, csisolatin1, latin1, ibm819, oracle数据库称we8iso8859p1, 目录, 与windows, 1252的区别, 与iso, 10646即unic. ISO 8859 1 正式编号为ISO IEC 8859 1 1998 又称Latin 1或 西欧语言 是国际标准化组织内ISO IEC 8859的第一个8位字符集 它以ASCII为基础 在空置的0xA0 0xFF的范围内 加入96个字母及符号 藉以供使用附加符号的拉丁字母语言使用 曾推出过 ISO 8859 1 1987 版 ISO 8859 1的别名有 iso ir 100 csISOLatin1 latin1 l1 IBM819 Oracle数据库称WE8ISO8859P1 1 目录 1 与Windows 1252的区别 2 与ISO IEC 10646即Unicode的关系 3 适用语言 4 字符集 5 參考資料 6 参閲 7 外部链接与Windows 1252的区别 编辑互联网上 常见把Windows 1252编码的文本误标称为ISO 8859 1 最常见后果是引号与撇号 在非Windows环境下被当作不识别字符显示为问号或方块 boxes 字符 大部分现代网页浏览器与e mail客户端把互联网媒体类型字符集为ISO 8859 1当作Windows 1252来处理 HTML5标准要求把宣称为ISO 8859 1的文本当作Windows 1252编码来解析 2 截至2017年10月 2017 10 update 4 5 声明是ISO 8859 1编码 3 这包含了未知数量的实际上是Windows 1252或UTF 8编码的网页常常被浏览器识别为ISO 8859 1编码 ISO 8859 1与Windows 1252代码页的区别是 码位128至159 十六进制80至9F 原本是罕用的C1控制字符编码范围 被替换为额外的一些常用但未包含在ISO 8859 1中的字符 实际上Windows 1252代码页包含了所有出现在ISO 8859 15中的字符 ISO 8859 1对应的Windows代码页是Windows 28591 4 然而 英文版的Windows 7 Windows10家庭中文版系统上没有Windows 28591代码页 与ISO IEC 10646即Unicode的关系 编辑ISO 8859 1对应于ISO IEC 10646即Unicode的前256个码位 适用语言 编辑此字符集支持部分于欧洲使用的语言 包括阿尔巴尼亚语 巴斯克语 布列塔尼语 加泰罗尼亚语 丹麦语 荷兰语 法罗语 弗里西语 加利西亚语 德语 格陵兰语 冰岛语 爱尔兰盖尔语 意大利语 拉丁语 卢森堡语 挪威语 葡萄牙语 里托罗曼斯语 苏格兰盖尔语 西班牙语及瑞典语 英语虽然没有重音字母 但仍会标明为ISO IEC 8859 1编码 除此之外 欧洲以外的部分语言 如南非荷兰语 斯瓦希里语 印尼语及马来语 菲律宾他加洛语等也可使用ISO IEC 8859 1编码 法语及芬兰语本来也使用ISO IEC 8859 1来表示 但因它没有法语使用的 œ Œ Ÿ 三个字母及芬兰语使用的 S s Z z 故于1998年被ISO IEC 8859 15所取代 ISO 8859 15同时加入了欧元符号 字符集 编辑ISO IEC 8859 1 x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF0x 1x 2x SP amp 3x 0 1 2 3 4 5 6 7 8 9 lt gt 4x A B C D E F G H I J K L M N O5x P Q R S T U V W X Y Z 6x a b c d e f g h i j k l m n o7x p q r s t u v w x y z 8x 9x Ax NBSP c ª SHY Bx µ º Cx A A A A A A AE C E E E E I I I IDx D N O o O O O O U U U U Y TH ssEx a a a a a a ae c e e e e i i i iFx d n o o o o o o u u u u y th y在上表中 0x20是空格 0xA0是不换行空格 0xAD是选择性连接号 0x00 0x1F 0x7F 0x80 0x9F在此字符集中未有定义 控制字符是由ISO IEC 6429定义 參考資料 编辑 Baird Cathy Chiba Dan Chu Winson Fan Jessica Ho Claire Law Simon Lee Geoff Linsley Peter Matsuda Keni Oscroft Tamzin Takeda Shige Tanaka Linus Tozawa Makoto Trute Barry Tsujimoto Mayumi Wu Ying Yau Michael Yu Tim Wang Chao Wong Simon Zhang Weiran Zheng Lei Zhu Yan Moore Valarie Appendix A Locale Data Oracle9i Database Globalization Support Guide PDF Release 2 9 2 Oracle Corporation 2002 1996 2017 02 14 Oracle A96529 01 原始内容存档 PDF 于2017 02 14 Encoding WHATWG sec 5 2 Names and labels 27 January 2015 4 February 2015 原始内容存档于2015 02 04 Historical trends in the usage of character encodings October 2016 2017 10 24 原始内容存档于2021 03 03 Code Page Identifiers Microsoft Corporation 2010 12 19 原始内容存档于2010 12 15 参閲 编辑ASCII ISO IEC 646 ISO IEC 8859 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16外部链接 编辑到国际标准化组织购买此标准 页面存档备份 存于互联网档案馆 ISO IEC 8859 1 1998 8 bit single byte coded graphic character sets Part 1 Latin alphabet No 1 draft dated February 12 1998 published April 15 1998 Standard ECMA 94 页面存档备份 存于互联网档案馆 8 Bit Single Byte Coded Graphic Character Sets Latin Alphabets No 1 to No 4 2nd edition June 1986 ISO IR 100 Right Hand Part of Latin Alphabet No 1 February 1 1986 中國國家標準 中華民國 CNS 13246 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title ISO IEC 8859 1 amp oldid 74886743, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。