fbpx
维基百科

ASCII

ASCII發音: /ˈæski/ ASS-kee[1]American Standard Code for Information Interchange美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其擴展版本延伸美国标准信息交换码則可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646

1968年版ASCII編碼速見表

美国信息交换标准代码是这套编码系统的传统命名,互联网号码分配局现在更倾向于使用它的新名字US-ASCII[2]

美国信息交换标准代码是美國電氣和電子工程師協會里程碑之一。

ASCII 由电报码发展而来。第一版标准发布于1963年[3][4],1967年经历了一次主要修订[5][6],最後一次更新則是在1986年,至今為止共定義了128個字元;其中33個字元無法顯示(一些终端提供了扩展,使得这些字符可顯示为諸如笑臉、撲克牌花式等8-bit符號),且這33個字元多數都已是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。在33個字元之外的是95個可顯示的字元。用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元(顯示為空白)。

技术背景

在计算机中,所有的数据在存储和运算时都要使用二进制数表示。例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,这就是编码。如果不同的计算机要想互相通信而不造成混乱,那么每台计算机就必须使用相同的编码规则,于是美国有关的标准化组织就推出了ASCII编码。

ASCII是由美国国家标准学会(American National Standard Institute,ANSI)制定的,使用标准的单字节字符编码方案,用于基于文本的数据。方案起始于50年代后期,在1967年定案。它最初是美国的标准,供不同计算机在相互通信时需共同遵守的西文字符编码标准。现已被国际标准化组织(International Organization for Standardization,ISO)定为国际标准(ISO/IEC 646),适用于所有拉丁字母。

控制字符

ASCII控制字符的编号范围是0-31和127(16进制:0x00-0x1F和0x7F),共33个字符。

为方便人类用户阅读,各个控制字符均有Unicode表示法和脫出字元表示法:

  • Unicode表示法:當想在畫面或紙上表示這些控制字元時,就會顯示成這個樣子。過於老舊的系統或瀏覽器可能會看不到。使用微軟任一中文輸入法,輸入`U2400即可看到␀,輸入`U2401可看到␁,依此類推。
  • 脫出字元表示法:通常用於終端機連線(例如Telnet通訊協定),以脫出字元^開頭,再接一個符號,用來讓這些控制字元得以在畫面上顯現。雖然看起來是兩個字元,但在終端機上實際只有一個字元。在絕大部分的終端機系統中,包括Windows命令提示字元(cmd.exe)、LinuxFreeBSD,都可用Ctrl代表脫出字元,輸入想要的ASCII控制字元。例如想輸入空字符,就要輸入Ctrl+2,而非^@,後者會顯示成兩字元,前者只會顯示成一字元。
ASCII控制字符(共33个)
二进制 十进制 十六进制 缩写 Unicode
表示法
脫出字元
表示法
名称/意义
0000 0000 0 00 NUL ^@ 空字符(Null)
0000 0001 1 01 SOH ^A 标题开始
0000 0010 2 02 STX ^B 本文开始
0000 0011 3 03 ETX ^C 本文结束
0000 0100 4 04 EOT ^D 傳輸结束
0000 0101 5 05 ENQ ^E 请求
0000 0110 6 06 ACK ^F 確認回應
0000 0111 7 07 BEL ^G 响铃
0000 1000 8 08 BS ^H 退格
0000 1001 9 09 HT ^I 水平定位符號
0000 1010 10 0A LF ^J 换行键
0000 1011 11 0B VT ^K 垂直定位符號
0000 1100 12 0C FF ^L 换页键
0000 1101 13 0D CR ^M CR (字元)
0000 1110 14 0E SO ^N 取消變换(Shift out)
0000 1111 15 0F SI ^O 启用變换(Shift in)
0001 0000 16 10 DLE ^P 跳出数据通讯
0001 0001 17 11 DC1 ^Q 設備控制一(XON 啟用軟體速度控制)
0001 0010 18 12 DC2 ^R 設備控制二
0001 0011 19 13 DC3 ^S 設備控制三(XOFF 停用軟體速度控制)
0001 0100 20 14 DC4 ^T 設備控制四
0001 0101 21 15 NAK ^U 確認失敗回應
0001 0110 22 16 SYN ^V 同步用暫停
0001 0111 23 17 ETB ^W 區塊傳輸结束
0001 1000 24 18 CAN ^X 取消
0001 1001 25 19 EM ^Y 連線介质中断
0001 1010 26 1A SUB ^Z 替換
0001 1011 27 1B ESC ^[ 退出键
0001 1100 28 1C FS ^\ 文件分割符
0001 1101 29 1D GS ^] 群組分隔符
0001 1110 30 1E RS ^^ 记录分隔符
0001 1111 31 1F US ^_ 单元分隔符
0111 1111 127 7F DEL ^? Delete字符

可显示字符

可显示字符编号范围是32-126(0x20-0x7E),共95个字符。

32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

ASCII可显示字符(共95个)
二进制 十进制 十六进制 图形
0010 0000 32 20 (space)
0010 0001 33 21 !
0010 0010 34 22 "
0010 0011 35 23 #
0010 0100 36 24 $
0010 0101 37 25 %
0010 0110 38 26 &
0010 0111 39 27 '
0010 1000 40 28 (
0010 1001 41 29 )
0010 1010 42 2A *
0010 1011 43 2B +
0010 1100 44 2C ,
0010 1101 45 2D -
0010 1110 46 2E .
0010 1111 47 2F /
0011 0000 48 30 0
0011 0001 49 31 1
0011 0010 50 32 2
0011 0011 51 33 3
0011 0100 52 34 4
0011 0101 53 35 5
0011 0110 54 36 6
0011 0111 55 37 7
0011 1000 56 38 8
0011 1001 57 39 9
0011 1010 58 3A :
0011 1011 59 3B ;
0011 1100 60 3C <
0011 1101 61 3D =
0011 1110 62 3E >
0011 1111 63 3F ?
二进制 十进制 十六进制 图形
0100 0000 64 40 @
0100 0001 65 41 A
0100 0010 66 42 B
0100 0011 67 43 C
0100 0100 68 44 D
0100 0101 69 45 E
0100 0110 70 46 F
0100 0111 71 47 G
0100 1000 72 48 H
0100 1001 73 49 I
0100 1010 74 4A J
0100 1011 75 4B K
0100 1100 76 4C L
0100 1101 77 4D M
0100 1110 78 4E N
0100 1111 79 4F O
0101 0000 80 50 P
0101 0001 81 51 Q
0101 0010 82 52 R
0101 0011 83 53 S
0101 0100 84 54 T
0101 0101 85 55 U
0101 0110 86 56 V
0101 0111 87 57 W
0101 1000 88 58 X
0101 1001 89 59 Y
0101 1010 90 5A Z
0101 1011 91 5B [
0101 1100 92 5C \
0101 1101 93 5D ]
0101 1110 94 5E ^
0101 1111 95 5F _
二进制 十进制 十六进制 图形
0110 0000 96 60 `
0110 0001 97 61 a
0110 0010 98 62 b
0110 0011 99 63 c
0110 0100 100 64 d
0110 0101 101 65 e
0110 0110 102 66 f
0110 0111 103 67 g
0110 1000 104 68 h
0110 1001 105 69 i
0110 1010 106 6A j
0110 1011 107 6B k
0110 1100 108 6C l
0110 1101 109 6D m
0110 1110 110 6E n
0110 1111 111 6F o
0111 0000 112 70 p
0111 0001 113 71 q
0111 0010 114 72 r
0111 0011 115 73 s
0111 0100 116 74 t
0111 0101 117 75 u
0111 0110 118 76 v
0111 0111 119 77 w
0111 1000 120 78 x
0111 1001 121 79 y
0111 1010 122 7A z
0111 1011 123 7B {
0111 1100 124 7C |
0111 1101 125 7D }
0111 1110 126 7E ~

缺點

ASCII的局限在於只能顯示26個基本拉丁字母、阿拉伯數字和英式標點符號,因此只能用於顯示現代美國英語(且處理naïve、café、élite等外來語時,必須去除附加符號)。雖然EASCII解決了部分西歐語言的顯示問題,但對更多其他語言依然無能為力。因此,現在的软件系统大多采用Unicode,特别是与ASCII向下兼容的UTF-8

参见

参考资料

  1. ^ ASCII的口語發音 (页面存档备份,存于互联网档案馆). Merriam Webster. Accessed 2008-04-14.
  2. ^ Internet Assigned Numbers Authority (IANA) (May 14, 2007). "Character Sets (页面存档备份,存于互联网档案馆)". Accessed 2008-04-14.
  3. ^ Brandel, Mary. 1963: The Debut of ASCII. CNN. July 6, 1999 [2008-04-14]. (原始内容于2013-06-17). 
  4. ^ . American Standards Association (ASA). 1963-06-17 [2018-09-28]. (原始内容存档于2018-09-28). 
  5. ^ USA Standard Code for Information Interchange, USAS X3.4-1967. United States of America Standards Institute (USASI). July 7, 1967. 
  6. ^ Jennings, Thomas Daniel. . World Power Systems (WPS). 2016-04-20 [1999] [2018-09-28]. (原始内容存档于2018-09-28). 

ascii, 此條目需要补充更多来源, 2018年9月9日, 请协助補充多方面可靠来源以改善这篇条目, 无法查证的内容可能會因為异议提出而移除, 致使用者, 请搜索一下条目的标题, 来源搜索, 网页, 新闻, 书籍, 学术, 图像, 以检查网络上是否存在该主题的更多可靠来源, 判定指引, 提示, 此条目的主题不是ms, windows, 1252, 或者, 此條目介紹的是字符编码, 关于其他用法, 请见, 消歧义, 發音, american, standard, code, information, interch. 此條目需要补充更多来源 2018年9月9日 请协助補充多方面可靠来源以改善这篇条目 无法查证的内容可能會因為异议提出而移除 致使用者 请搜索一下条目的标题 来源搜索 ASCII 网页 新闻 书籍 学术 图像 以检查网络上是否存在该主题的更多可靠来源 判定指引 提示 此条目的主题不是MS Windows 1252 或者 EASCII 此條目介紹的是字符编码 关于其他用法 请见 ASCII 消歧义 ASCII 發音 ˈ ae s k i ASS kee 1 American Standard Code for Information Interchange 美国信息交换标准代码 是基于拉丁字母的一套电脑编码系统 它主要用于显示现代英语 而其擴展版本延伸美国标准信息交换码則可以部分支持其他西欧语言 并等同于国际标准ISO IEC 646 1968年版ASCII編碼速見表 美国信息交换标准代码是这套编码系统的传统命名 互联网号码分配局现在更倾向于使用它的新名字US ASCII 2 美国信息交换标准代码是美國電氣和電子工程師協會里程碑之一 ASCII 由电报码发展而来 第一版标准发布于1963年 3 4 1967年经历了一次主要修订 5 6 最後一次更新則是在1986年 至今為止共定義了128個字元 其中33個字元無法顯示 一些终端提供了扩展 使得这些字符可顯示为諸如笑臉 撲克牌花式等8 bit符號 且這33個字元多數都已是陳廢的控制字元 控制字元的用途主要是用來操控已經處理過的文字 在33個字元之外的是95個可顯示的字元 用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元 顯示為空白 目录 1 技术背景 2 控制字符 3 可显示字符 4 缺點 5 参见 6 参考资料技术背景 编辑在计算机中 所有的数据在存储和运算时都要使用二进制数表示 例如 像a b c d这样的52个字母 包括大写 以及0 1等数字还有一些常用的符号 例如 等 在计算机中存储时也要使用二进制数来表示 而具体用哪些二进制数字表示哪个符号 这就是编码 如果不同的计算机要想互相通信而不造成混乱 那么每台计算机就必须使用相同的编码规则 于是美国有关的标准化组织就推出了ASCII编码 ASCII是由美国国家标准学会 American National Standard Institute ANSI 制定的 使用标准的单字节字符编码方案 用于基于文本的数据 方案起始于50年代后期 在1967年定案 它最初是美国的标准 供不同计算机在相互通信时需共同遵守的西文字符编码标准 现已被国际标准化组织 International Organization for Standardization ISO 定为国际标准 ISO IEC 646 适用于所有拉丁字母 控制字符 编辑ASCII控制字符的编号范围是0 31和127 16进制 0x00 0x1F和0x7F 共33个字符 为方便人类用户阅读 各个控制字符均有Unicode表示法和脫出字元表示法 Unicode表示法 當想在畫面或紙上表示這些控制字元時 就會顯示成這個樣子 過於老舊的系統或瀏覽器可能會看不到 使用微軟任一中文輸入法 輸入 U2400即可看到 輸入 U2401可看到 依此類推 脫出字元表示法 通常用於終端機連線 例如Telnet通訊協定 以脫出字元 開頭 再接一個符號 用來讓這些控制字元得以在畫面上顯現 雖然看起來是兩個字元 但在終端機上實際只有一個字元 在絕大部分的終端機系統中 包括Windows的命令提示字元 cmd exe Linux和FreeBSD 都可用Ctrl代表脫出字元 輸入想要的ASCII控制字元 例如想輸入空字符 就要輸入Ctrl 2 而非 後者會顯示成兩字元 前者只會顯示成一字元 ASCII控制字符 共33个 二进制 十进制 十六进制 缩写 Unicode表示法 脫出字元表示法 名称 意义0000 0000 0 00 NUL 空字符 Null 0000 0001 1 01 SOH A 标题开始0000 0010 2 02 STX B 本文开始0000 0011 3 03 ETX C 本文结束0000 0100 4 04 EOT D 傳輸结束0000 0101 5 05 ENQ E 请求0000 0110 6 06 ACK F 確認回應0000 0111 7 07 BEL G 响铃0000 1000 8 08 BS H 退格0000 1001 9 09 HT I 水平定位符號0000 1010 10 0A LF J 换行键0000 1011 11 0B VT K 垂直定位符號0000 1100 12 0C FF L 换页键0000 1101 13 0D CR M CR 字元 0000 1110 14 0E SO N 取消變换 Shift out 0000 1111 15 0F SI O 启用變换 Shift in 0001 0000 16 10 DLE P 跳出数据通讯0001 0001 17 11 DC1 Q 設備控制一 XON 啟用軟體速度控制 0001 0010 18 12 DC2 R 設備控制二0001 0011 19 13 DC3 S 設備控制三 XOFF 停用軟體速度控制 0001 0100 20 14 DC4 T 設備控制四0001 0101 21 15 NAK U 確認失敗回應0001 0110 22 16 SYN V 同步用暫停0001 0111 23 17 ETB W 區塊傳輸结束0001 1000 24 18 CAN X 取消0001 1001 25 19 EM Y 連線介质中断0001 1010 26 1A SUB Z 替換0001 1011 27 1B ESC 退出键0001 1100 28 1C FS 文件分割符0001 1101 29 1D GS 群組分隔符0001 1110 30 1E RS 记录分隔符0001 1111 31 1F US 单元分隔符0111 1111 127 7F DEL Delete字符可显示字符 编辑可显示字符编号范围是32 126 0x20 0x7E 共95个字符 32 126 共95个 是字符 32是空格 其中48 57为0到9十个阿拉伯数字 65 90为26个大写英文字母 97 122号为26个小写英文字母 其余为一些标点符号 运算符号等 ASCII可显示字符 共95个 二进制 十进制 十六进制 图形0010 0000 32 20 space 0010 0001 33 21 0010 0010 34 22 0010 0011 35 23 0010 0100 36 24 0010 0101 37 25 0010 0110 38 26 amp 0010 0111 39 27 0010 1000 40 28 0010 1001 41 29 0010 1010 42 2A 0010 1011 43 2B 0010 1100 44 2C 0010 1101 45 2D 0010 1110 46 2E 0010 1111 47 2F 0011 0000 48 30 00011 0001 49 31 10011 0010 50 32 20011 0011 51 33 30011 0100 52 34 40011 0101 53 35 50011 0110 54 36 60011 0111 55 37 70011 1000 56 38 80011 1001 57 39 90011 1010 58 3A 0011 1011 59 3B 0011 1100 60 3C lt 0011 1101 61 3D 0011 1110 62 3E gt 0011 1111 63 3F 二进制 十进制 十六进制 图形0100 0000 64 40 0100 0001 65 41 A0100 0010 66 42 B0100 0011 67 43 C0100 0100 68 44 D0100 0101 69 45 E0100 0110 70 46 F0100 0111 71 47 G0100 1000 72 48 H0100 1001 73 49 I0100 1010 74 4A J0100 1011 75 4B K0100 1100 76 4C L0100 1101 77 4D M0100 1110 78 4E N0100 1111 79 4F O0101 0000 80 50 P0101 0001 81 51 Q0101 0010 82 52 R0101 0011 83 53 S0101 0100 84 54 T0101 0101 85 55 U0101 0110 86 56 V0101 0111 87 57 W0101 1000 88 58 X0101 1001 89 59 Y0101 1010 90 5A Z0101 1011 91 5B 0101 1100 92 5C 0101 1101 93 5D 0101 1110 94 5E 0101 1111 95 5F 二进制 十进制 十六进制 图形0110 0000 96 60 0110 0001 97 61 a0110 0010 98 62 b0110 0011 99 63 c0110 0100 100 64 d0110 0101 101 65 e0110 0110 102 66 f0110 0111 103 67 g0110 1000 104 68 h0110 1001 105 69 i0110 1010 106 6A j0110 1011 107 6B k0110 1100 108 6C l0110 1101 109 6D m0110 1110 110 6E n0110 1111 111 6F o0111 0000 112 70 p0111 0001 113 71 q0111 0010 114 72 r0111 0011 115 73 s0111 0100 116 74 t0111 0101 117 75 u0111 0110 118 76 v0111 0111 119 77 w0111 1000 120 78 x0111 1001 121 79 y0111 1010 122 7A z0111 1011 123 7B 0111 1100 124 7C 0111 1101 125 7D 0111 1110 126 7E 缺點 编辑ASCII的局限在於只能顯示26個基本拉丁字母 阿拉伯數字和英式標點符號 因此只能用於顯示現代美國英語 且處理naive cafe elite等外來語時 必須去除附加符號 雖然EASCII解決了部分西歐語言的顯示問題 但對更多其他語言依然無能為力 因此 現在的软件系统大多采用Unicode 特别是与ASCII向下兼容的UTF 8 参见 编辑EASCII Extended ASCII EBCDIC ISO IEC 646 ISO IEC 8859 控制字符 ASCII艺术 ASCII絲帶行動参考资料 编辑 ASCII的口語發音 页面存档备份 存于互联网档案馆 Merriam Webster Accessed 2008 04 14 Internet Assigned Numbers Authority IANA May 14 2007 Character Sets 页面存档备份 存于互联网档案馆 Accessed 2008 04 14 Brandel Mary 1963 The Debut of ASCII CNN July 6 1999 2008 04 14 原始内容存档于2013 06 17 American Standard Code for Information Interchange ASA X3 4 1963 American Standards Association ASA 1963 06 17 2018 09 28 原始内容存档于2018 09 28 USA Standard Code for Information Interchange USAS X3 4 1967 United States of America Standards Institute USASI July 7 1967 Jennings Thomas Daniel An annotated history of some character codes or ASCII American Standard Code for Information Infiltration World Power Systems WPS 2016 04 20 1999 2018 09 28 原始内容存档于2018 09 28 取自 https zh wikipedia org w index php title ASCII amp oldid 75206055, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。