fbpx
维基百科

基本拉丁字母 (Unicode區段)

基本拉丁字母Basic Latin),又稱C0控制字符及基本拉丁字母C0 Controls and Basic Latin),是Unicode標準下的首個Unicode區段,亦是唯一一個在UTF-8下,以單一字節編碼的區段。此區段包含ASCII編碼下所有字母英语ISO basic Latin alphabet控制字符。該區段的範圍為U+0000..U+007F(共128個字元),包含C0控制字符、ASCII标点符号規約符號ASCII數字英文字母中的大寫小寫字母,以及一個控制字元。

C0控制字符及基本拉丁字母
C0 Controls and Basic Latin
範圍U+0000..U+007F
(128個碼位)
平面基本多文種平面BMP
文字拉丁字母(52個)
通用(76個)
應用
符號系列
已分配128個碼位
33個控制或格式
未分配0個保留碼位
來源標準ISO/IEC 8859 · ISO 646
註釋[1][2]

基本拉丁字母區段內的字元Unicode標準的1.0版本起一直沿用至今,多年來未曾對此作出任何增減。[3]該區段在1.0版本的名稱為ASCII[4]

字符表 编辑

下表列出基本拉丁字母包含的所有字符[5]

子標題 编辑

「C0控制字符及基本拉丁字母」區段內包含六個子標題。[5]

C0控制字符 编辑

「C0控制字符」(C0 Controls,於1.0版本中稱為C0 ASCII控制符)乃繼承自ASCII及其他7位元及8位元編碼系統。C0控制字符的別名乃基於ISO/IEC 6429:1992標準而取。[5]

ASCII標點及符號 编辑

此子標題乃指標準標點字元、簡單數學運算子,以及比索符號($)、百分號、&符號、下劃線和管道符號等符號。[5]

ASCII數字 编辑

「ASCII數字」(ASCII Digits)子標題包含標準歐式數字字元1-9及0。[5]

大寫拉丁字母 编辑

「大寫拉丁字母」(Uppercase Latin alphabet)子標題包含26個標準、無附加符號的大寫拉丁字母。[5]

小寫拉丁字母 编辑

「小寫拉丁字母」(Lowercase Latin alphabet)子標題包含26個標準、無附加符號的小寫拉丁字母。[5]

控制字元 编辑

「控制字元」(Control Character)子標題僅包含「刪除」字元。[5]

符號、字母與控制符數量 编辑

下表列出C0控制字符及基本拉丁字母區段中,各子標題的字母、符號與控制符數量。

子標題名稱 符號數量 字元代碼範圍
C0控制字符 32個控制字符 U+0000..U+001F
ASCII標點及符號 33個標點符號與符號 U+0020..U+002FU+003A..U+0040U+005B..U+0060U+007B..U+007E
ASCII數字 10個數字 U+0030..U+0039
大寫拉丁字母 26個無附加符號的大寫拉丁字母 U+0041..U+005A
小寫拉丁字母 26個無附加符號的小寫拉丁字母 U+0061..U+007A
控制字元 1個包含「刪除」字元的控制字符 U+007F

區塊 编辑

C0控制字符和基本拉丁字母
C0 Controls and Basic Latin[1]
Unicode Consortium 官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+000x  NUL   SOH   STX   ETX   EOT   ENQ   ACK   BEL    BS     HT     LF     VT     FF     CR     SO     SI  
U+001x  DLE   DC1   DC2   DC3   DC4   NAK   SYN   ETB   CAN    EM    SUB   ESC    FS     GS     RS     US  
U+002x   SP   ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A B C D E F G H I J K L M N O
U+005x P Q R S T U V W X Y Z [ \ ] ^ _
U+006x ` a b c d e f g h i j k l m n o
U+007x p q r s t u v w x y z { | } ~  DEL 
註釋
1.^ 依據 Unicode 14.0

變體 编辑

部份字元若跟從變體指示器(variant indicators),則會以標準化變體的定義生成。

區段內亦有一個為字元「0」定義、帶有短對角斜線的變體0︀U+0030 DIGIT ZERO U+FE00 VS1)。[7][8]

12個字元可透過U+FE0E VS15U+FE0F VS16以生成繪文字變體。[9][10][11][12]它們均為鍵帽英语Keycap基底字符(base characters),如#️⃣(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)。VS15版本是「文字樣式」,而VS16版本則為「繪文字樣式」。[8]

繪文字可選變體
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
基本碼位 # * 0 1 2 3 4 5 6 7 8 9
基本+VS15+鍵帽 #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
基本+VS16+鍵帽 #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣

歷史 编辑

以下与Unicode相关的文档记录了在基本拉丁字母区块中定义特定字符的目的和过程:

參見 编辑

注釋 编辑

  1. ^ 縮寫為EXC
  2. ^ 縮寫為QUO
  3. ^ 縮寫為DEL

參考資料 编辑

  1. ^ . The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25) (英语). 
  2. ^ . The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29) (英语). 
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1. 
  4. ^ (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2022-05-17]. (原始内容 (PDF)存档于2021-02-11) (英语). 
  5. ^ 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 (PDF). The Unicode Standard. [2013-04-01]. (原始内容 (PDF)存档于2018-07-04) (英语). 
  6. ^ Michael S. Kaplan. . Sorting it all Out. Microsoft. 2005-09-17. (原始内容存档于2010-06-12) (美国英语).  亦可於 http://archives.miloush.net/michkap/archive/2005/09/17/469941.html (页面存档备份,存于互联网档案馆) 查閱。
  7. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray. (PDF). 2015-10-30 [2022-05-17]. (原始内容 (PDF)存档于2016-10-21) (英语). 
  8. ^ 8.0 8.1 . The Unicode Consortium. [2022-05-17]. (原始内容存档于2022-03-31) (英语). 
  9. ^ Edberg, Peter. (PDF). 2011-12-22 [2022-05-17]. (原始内容 (PDF)存档于2022-06-10) (英语). 
  10. ^ Pournader, Roozbeh. (PDF). 2015-11-01 [2022-05-17]. (原始内容 (PDF)存档于2022-03-31) (英语). 
  11. ^ . Unicode Consortium. 2020-02-11 [2022-05-17]. (原始内容存档于2019-05-01) (英语). 
  12. ^ . Unicode Consortium. 2021-08-26 [2022-05-17]. (原始内容存档于2022-03-28) (英语). 

基本拉丁字母, unicode區段, 关于所有收錄於unicode的字元列表, 请见, unicode中的拉丁字母, 参见, 拉丁字母補充, 基本拉丁字母, basic, latin, 又稱c0控制字符及基本拉丁字母, controls, basic, latin, 是unicode標準下的首個unicode區段, 亦是唯一一個在utf, 8下, 以單一字節編碼的區段, 此區段包含ascii編碼下所有字母, 英语, basic, latin, alphabet, 與控制字符, 該區段的範圍為u, 0000, 007. 关于所有收錄於Unicode的字元列表 请见 Unicode中的拉丁字母 参见 拉丁字母補充 1 基本拉丁字母 Basic Latin 又稱C0控制字符及基本拉丁字母 C0 Controls and Basic Latin 是Unicode標準下的首個Unicode區段 亦是唯一一個在UTF 8下 以單一字節編碼的區段 此區段包含ASCII編碼下所有字母 英语 ISO basic Latin alphabet 與控制字符 該區段的範圍為U 0000 U 007F 共128個字元 包含C0控制字符 ASCII标点符号與規約符號 ASCII數字 英文字母中的大寫與小寫字母 以及一個控制字元 C0控制字符及基本拉丁字母C0 Controls and Basic Latin範圍U 0000 U 007F 128個碼位 平面基本多文種平面 BMP 文字拉丁字母 52個 通用 76個 應用英語 法語 德語 西班牙語 越南語符號系列阿拉伯数字 標點符號已分配128個碼位 33個控制或格式未分配0個保留碼位來源標準ISO IEC 8859 ISO 646註釋 1 2 基本拉丁字母區段內的字元Unicode標準的1 0版本起一直沿用至今 多年來未曾對此作出任何增減 3 該區段在1 0版本的名稱為ASCII 4 目录 1 字符表 2 子標題 2 1 C0控制字符 2 2 ASCII標點及符號 2 3 ASCII數字 2 4 大寫拉丁字母 2 5 小寫拉丁字母 2 6 控制字元 3 符號 字母與控制符數量 4 區塊 5 變體 6 歷史 7 參見 8 注釋 9 參考資料字符表 编辑下表列出基本拉丁字母包含的所有字符 5 字符表碼位 顯示 描述 縮寫 C0控制字符 U 0000 空字符 NUL U 0001 报头开始字符 SOH U 0002 正文開始字符 STX U 0003 文本結束字符 英语 End of text character ETX U 0004 传输结束字符 EOT U 0005 詢問字符 英语 Enquriry character ENQ U 0006 確認訊息字符 ACK U 0007 響鈴字符 英语 Bell character BEL U 0008 退格鍵 BS U 0009 水平製表符 HT U 000A 換行 LF U 000B 垂直製表符 VT U 000C 換頁符 英语 Form feed FF U 000D 回车符 CR U 000E 移出字符 SO U 000F 移入字符 SI U 0010 數據傳送換碼 DLE U 0011 設備控制符1 DC1 U 0012 設備控制符2 DC2 U 0013 設備控制符3 DC3 U 0014 設備控制符4 DC4 U 0015 否定確認訊息字符 NAK U 0016 同步空閒 SYN U 0017 传输块结束字符 英语 End of Transmission Block character ETB U 0018 取消字符 英语 Cancel character CAN U 0019 媒體結束字符 EM U 001A 替代字符 SUB U 001B 转义字符 ESC U 001C 文件分隔符 FS U 001D 分組符 GS U 001E 記錄分隔符 RS U 001F 單元分隔符 US ASCII標點及符號 U 0020 空格 SP 碼位 顯示 描述 U 0021 叹号 註 1 U 0022 引号 註 2 U 0023 井號 U 0024 比索符號 U 0025 百分號 U 0026 amp amp 符號 U 0027 撇号 U 0028 左括號 U 0029 右括號 U 002A 星號 U 002B 加號 U 002C 逗號 U 002D 連字暨減號 U 002E 西文句號 U 002F 斜線號 ASCII數字 U 0030 0 數字0 U 0031 1 數字1 U 0032 2 數字2 U 0033 3 數字3 U 0034 4 數字4 U 0035 5 數字5 U 0036 6 數字6 U 0037 7 數字7 U 0038 8 數字8 U 0039 9 數字9 ASCII標點及符號 U 003A 冒号 U 003B 分號 U 003C lt 小於號 U 003D 等号 U 003E gt 大於號 U 003F 问号 U 0040 符號 碼位 顯示 描述 大寫拉丁字母 U 0041 A 大寫拉丁字母A U 0042 B 大寫拉丁字母B U 0043 C 大寫拉丁字母C U 0044 D 大寫拉丁字母D U 0045 E 大寫拉丁字母E U 0046 F 大寫拉丁字母F U 0047 G 大寫拉丁字母G U 0048 H 大寫拉丁字母H U 0049 I 大寫拉丁字母I U 004A J 大寫拉丁字母J U 004B K 大寫拉丁字母K U 004C L 大寫拉丁字母L U 004D M 大寫拉丁字母M U 004E N 大寫拉丁字母N U 004F O 大寫拉丁字母O U 0050 P 大寫拉丁字母P U 0051 Q 大寫拉丁字母Q U 0052 R 大寫拉丁字母R U 0053 S 大寫拉丁字母S U 0054 T 大寫拉丁字母T U 0055 U 大寫拉丁字母U U 0056 V 大寫拉丁字母V U 0057 W 大寫拉丁字母W U 0058 X 大寫拉丁字母X U 0059 Y 大寫拉丁字母Y U 005A Z 大寫拉丁字母Z ASCII標點及符號 U 005B 左中括號 U 005C 反斜线 A U 005D 右中括號 U 005E 揚抑符 U 005F 下橫線 U 0060 重音符 碼位 顯示 描述 小寫拉丁字母 U 0061 a 小寫拉丁字母A U 0062 b 小寫拉丁字母B U 0063 c 小寫拉丁字母C U 0064 d 小寫拉丁字母D U 0065 e 小寫拉丁字母E U 0066 f 小寫拉丁字母F U 0067 g 小寫拉丁字母G U 0068 h 小寫拉丁字母H U 0069 i 小寫拉丁字母I U 006A j 小寫拉丁字母J U 006B k 小寫拉丁字母K U 006C l 小寫拉丁字母L U 006D m 小寫拉丁字母M U 006E n 小寫拉丁字母N U 006F o 小寫拉丁字母O U 0070 p 小寫拉丁字母P U 0071 q 小寫拉丁字母Q U 0072 r 小寫拉丁字母R U 0073 s 小寫拉丁字母S U 0074 t 小寫拉丁字母T U 0075 u 小寫拉丁字母U U 0076 v 小寫拉丁字母V U 0077 w 小寫拉丁字母W U 0078 x 小寫拉丁字母X U 0079 y 小寫拉丁字母Y U 007A z 小寫拉丁字母Z ASCII標點及符號 U 007B 左大括號 U 007C 豎線 U 007D 右大括號 U 007E 波浪號 控制字元 U 007F 刪除符 註 3 A 字符U 005C 在日 韓語字體中或會顯示成日元 或韓圜符號 皆因這些字體錯誤地視Unicode 尤其是UTF 8 為一款傳統字符集 並將反斜線取代成這些符號 6 子標題 编辑 C0控制字符及基本拉丁字母 區段內包含六個子標題 5 C0控制字符 编辑 C0控制字符 C0 Controls 於1 0版本中稱為C0 ASCII控制符 乃繼承自ASCII及其他7位元及8位元編碼系統 C0控制字符的別名乃基於ISO IEC 6429 1992標準而取 5 ASCII標點及符號 编辑 此子標題乃指標準標點字元 簡單數學運算子 以及比索符號 百分號 amp 符號 下劃線和管道符號等符號 5 ASCII數字 编辑 ASCII數字 ASCII Digits 子標題包含標準歐式數字字元1 9及0 5 大寫拉丁字母 编辑 大寫拉丁字母 Uppercase Latin alphabet 子標題包含26個標準 無附加符號的大寫拉丁字母 5 小寫拉丁字母 编辑 小寫拉丁字母 Lowercase Latin alphabet 子標題包含26個標準 無附加符號的小寫拉丁字母 5 控制字元 编辑 控制字元 Control Character 子標題僅包含 刪除 字元 5 符號 字母與控制符數量 编辑下表列出C0控制字符及基本拉丁字母區段中 各子標題的字母 符號與控制符數量 子標題名稱 符號數量 字元代碼範圍 C0控制字符 32個控制字符 U 0000 U 001F ASCII標點及符號 33個標點符號與符號 U 0020 U 002F U 003A U 0040 U 005B U 0060 及U 007B U 007E ASCII數字 10個數字 U 0030 U 0039 大寫拉丁字母 26個無附加符號的大寫拉丁字母 U 0041 U 005A 小寫拉丁字母 26個無附加符號的小寫拉丁字母 U 0061 U 007A 控制字元 1個包含 刪除 字元的控制字符 U 007F區塊 编辑C0控制字符和基本拉丁字母C0 Controls and Basic Latin 1 Unicode Consortium 官方碼表 PDF 0 1 2 3 4 5 6 7 8 9 A B C D E F U 000x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI U 001x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US U 002x SP amp U 003x 0 1 2 3 4 5 6 7 8 9 lt gt U 004x A B C D E F G H I J K L M N O U 005x P Q R S T U V W X Y Z U 006x a b c d e f g h i j k l m n o U 007x p q r s t u v w x y z DEL 註釋 1 依據 Unicode 14 0變體 编辑部份字元若跟從變體指示器 variant indicators 則會以標準化變體的定義生成 區段內亦有一個為字元 0 定義 帶有短對角斜線的變體0 U 0030 DIGIT ZERO U FE00 VS1 7 8 12個字元可透過U FE0E VS15 或U FE0F VS16 以生成繪文字變體 9 10 11 12 它們均為鍵帽 英语 Keycap 基底字符 base characters 如 U 0023 NUMBER SIGN U FE0F VS16 U 20E3 COMBINING ENCLOSING KEYCAP VS15版本是 文字樣式 而VS16版本則為 繪文字樣式 8 繪文字可選變體 U 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039 基本碼位 0 1 2 3 4 5 6 7 8 9 基本 VS15 鍵帽 0 1 2 3 4 5 6 7 8 9 基本 VS16 鍵帽 0 1 2 3 4 5 6 7 8 9 歷史 编辑以下与Unicode相关的文档记录了在基本拉丁字母区块中定义特定字符的目的和过程 版本 最終碼位 a 碼位数 UTC ID L2 英语 International Committee for Information Technology Standards ID WG2 英语 ISO IEC JTC 1 SC 2 ID 文檔 1 0 0 U 0000 007F 128 待查 UTC 1999 013 Karlsson Kent Tildes and micro sign decompositions 1999 05 27 L2 99 176R Moore Lisa Minutes from the joint UTC L2 meeting in Seattle June 8 10 1999 1999 11 04 L2 04 145 Starner David C with stroke character examples from BAE report 1884 Dorsey 2004 04 30 L2 04 202 Anderson Deborah Slashed C Feedback 2004 06 07 N3046 页面存档备份 存于互联网档案馆 Suignard Michel Improving formal definition for control characters 2006 02 22 N3103 pdf doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S Unconfirmed minutes of WG 2 meeting 48 Mountain View CA USA 2006 04 24 27 2006 08 25 L2 11 043 Freytag Asmus Karlsson Kent Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters 2011 02 02 L2 11 160 PRI 181 Changing General Category of Twelve Characters 2011 05 02 L2 11 261R2 Moore Lisa UTC 128 L2 225 Minutes 2011 08 16 Accept Ken Whistler s recommendations in L2 11 281 on name aliases for control characters with the addition of the abbreviations BEL and NUL L2 11 438 b c N4182 页面存档备份 存于互联网档案馆 Edberg Peter Emoji Variation Sequences Revision of L2 11 429 2011 12 22 L2 15 107 Moore Lisa UTC 143 Minutes 2015 05 12 Add the 12 keycap sequences in emoji data txt as provisional named sequences in Unicode 8 0 L2 15 268 Beeton Barbara Freytag Asmus Iancu Laurențiu Sargent Murray Proposal to Represent the Slashed Zero Variant of Empty Set 2015 10 30 L2 15 301 d c Pournader Roozbeh A proposal for 278 standardized variation sequences for emoji 2015 11 01 L2 15 254 Moore Lisa UTC 145 Minutes 2015 11 16 L2 17 294 N4914 页面存档备份 存于互联网档案馆 Lunde Ken Proposal to add standardized variation sequence for U FF10 FULLWIDTH DIGIT ZERO 2017 08 14 建议的碼位和字符名称可能与最终的碼位和名称不同 參見L2 10 458 L2 11 414 L2 11 415及L2 11 429 3 0 3 1 參閱 雜項符號和象形文字 區段的歷史一節以查看與繪文字有關的額外文件 參見L2 15 198及L2 15 275參見 编辑字元集 ISO 8859 1注釋 编辑 縮寫為EXC 縮寫為QUO 縮寫為DEL參考資料 编辑 Unicode character database The Unicode Standard 2016 07 09 原始内容存档于2017 09 25 英语 Enumerated Versions of The Unicode Standard The Unicode Standard 2016 07 09 原始内容存档于2016 06 29 英语 The Unicode Standard Version 1 0 Volume 1 Addison Wesley Publishing Company Inc 1990 ISBN 0 201 56788 1 3 8 Block by Block Charts PDF The Unicode Standard version 1 0 Unicode Consortium 2022 05 17 原始内容 PDF 存档于2021 02 11 英语 5 0 5 1 5 2 5 3 5 4 5 5 5 6 5 7 Unicode 6 2 code charts PDF The Unicode Standard 2013 04 01 原始内容 PDF 存档于2018 07 04 英语 Michael S Kaplan When is a backslash not a backslash Sorting it all Out Microsoft 2005 09 17 原始内容存档于2010 06 12 美国英语 亦可於 http archives miloush net michkap archive 2005 09 17 469941 html 页面存档备份 存于互联网档案馆 查閱 Beeton Barbara Freytag Asmus Iancu Laurențiu Sargent Murray L2 15 268 Proposal to Represent the Slashed Zero Variant of Empty Set PDF 2015 10 30 2022 05 17 原始内容 PDF 存档于2016 10 21 英语 8 0 8 1 UTS 51 Emoji Variation Sequences The Unicode Consortium 2022 05 17 原始内容存档于2022 03 31 英语 Edberg Peter L2 11 438 Emoji Variation Sequences Revision of L2 11 429 PDF 2011 12 22 2022 05 17 原始内容 PDF 存档于2022 06 10 英语 Pournader Roozbeh L2 15 301 A proposal for 278 standardized variation sequences for emoji PDF 2015 11 01 2022 05 17 原始内容 PDF 存档于2022 03 31 英语 UTR 51 Unicode Emoji Unicode Consortium 2020 02 11 2022 05 17 原始内容存档于2019 05 01 英语 UCD Emoji Data for UTR 51 Unicode Consortium 2021 08 26 2022 05 17 原始内容存档于2022 03 28 英语 取自 https zh wikipedia org w index php title 基本拉丁字母 Unicode區段 amp oldid 79473816, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。