fbpx
维基百科

表意文字描述字符

表意文字描述字符(英語:Ideographic Description Character,IDC)是一块收录描述表意文字(如汉字)结构的符号Unicode區段,其中部分描述符号编码于其他区段。

表意文字描述字符
Ideographic Description Characters
範圍U+2FF0..U+2FFF
(16個碼位)
平面基本多文種平面BMP
文字通用英语Script (Unicode)#Special script property values
已分配16個碼位
未分配0個保留碼位
來源標準GBK
Unicode版本歷史
3.012 (+12)
15.116 (+4)
註釋[1][2]

目前大部份編碼包含Unicode,處理漢字編碼時大致是先搜集漢字,给予每个漢字一个數字編碼。然而,漢字數量龐大,字集往往不完全;再加上漢字本身是開放組合,漢字的使用者很可能自造新字,不可能有一个可以搜集到所有漢字的字集,所以用這些字符描述某「字」如何以較簡單的部件組合起來。

码表 编辑

表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FFx ⿿
注释
1. ^ 依据 Unicode 15.1

表意文字描述序列 编辑

表意文字描述序列(英語:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,描述序列由描述字符與兩个以上特定字元(主要為漢字)組合而成,表示漢字的抽象結構。

Unicode定義了16種組合字符:

編碼 字符 意義 例字 序列 例字 序列
U+2FF0 兩部件由左至右組成 ⿰木目 𠁢 ⿰丨㇍
U+2FF1 兩部件由上至下組成 ⿱木口 𠚤 ⿱𠂊丶
U+2FF2 三部件由左至右組成 ⿲彳氵亍 𠂗 ⿲丿夕乚
U+2FF3 三部件由上至下組成 ⿳亠口小 𠋑 ⿳亼目口
U+2FF4 兩部件由外而內組成 ⿴囗口 𠀬 ⿴㐁人
U+2FF5 三面包圍,下方開口 ⿵几皇 𧓉 ⿵齊虫
U+2FF6 三面包圍,上方開口 ⿶凵㐅 ⿶乂丶
U+2FF7 三面包圍,右方開口 ⿷匚斤 𧆬 ⿷虎九
U+2FF8 兩面包圍,兩部件由左上至右下組成 ⿸疒丙 𤆯 ⿸耂火
U+2FF9 兩面包圍,兩部件由右上至左下組成 ⿹戈廾 𢧌 ⿹或壬
U+2FFA 兩面包圍,兩部件由左下至右上組成 ⿺走召 𥘶 ⿺礼分
U+2FFB 兩部件重疊 ⿻工从 𣏃 ⿻木⿻コ一
U+2FFC 三面包圍,左方開口 ⿼叉丶 𬺹 ⿼コ二
U+2FFD 兩面包圍,兩部件由右下至左上組成 ⿽水丶 ⿽⺀十
U+2FFE 水平翻轉 ⿾卍 𣥄 ⿾正
U+2FFF ⿿ 旋轉 𠕄 ⿿凹 𠄔 ⿿予

另有两个描述符号并不在此区段内:

編碼 字符 区段 意義 例字 序列 例字 序列
U+303E 中日韩符号和标点 形似但不相等 㬵 (U+3B35) 〾胶 (U+80F6)[3] 𫜵 〾爫[4]
U+31EF 中日韓筆畫 減去筆畫 ㇯兵丶 𧰨 ㇯豕一

IDS的運算方式是前綴表示法,運算子在前,對應數量的運算元在後。這種方式不需使用括號等字元輔助即可无歧義地表示運算順序。

统一碼標準中,表意文字描述序列之定義如下:[5]

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB IDS三元運算子 := U+2FF2 | U+2FF3 

按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0-U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。

限制 编辑

  • Unicode無定義漢字的唯一表述方式,依現行提案一漢字可用多種IDS表達,如「巫」可表示為「⿻工从」或「⿻工⿰人人」。
  • IDS主要目的在於表達漢字的抽象結構,而非像組合字符一樣用於動態組字。現實繪製合體字字形時須考量許多複雜要素,光用IDS不足以繪出符合一般要求的合成字,例如合體字上下、左右比例往往並非1:1,而是按二部件的實際外形調整;左上-右下、三方包圍等組合字的比例計算則更複雜;上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀,例如「⿻工从」是將兩个「人」放到「工」的左右兩開口裡,而非簡單地將「工」和「从」上下疊合。

历史 编辑

以下檔案記錄了本區段中出現的字符的提議及定稿。

另見 编辑

參考文獻 编辑

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容于2016-06-29). 
  3. ^ 「㬵(U+3B35)」和「胶(U+80F6)」为什么在《康熙字典》收录了两次? - 知乎. www.zhihu.com. [2023-09-21]. 
  4. ^ 基本集扩充字考(五・完结)附扩充块新增字考. 知乎专栏. [2023-09-21] (中文). 
  5. ^ The Unicode StandardVersion 6.0 – Core Specification (PDF). [2020-02-10]. (原始内容 (PDF)于2019-11-22). 

外部連結 编辑

表意文字描述字符, 注意, 本页有unihan新版汉字, 𠀬, 𠁢, 𠂊, 𠂗, 𠋑, 𠚤, 𢧌, 𣏃, 𤆯, 𥘶, 𧆬, 𧓉, 這些字符可能會错误显示, 詳见unicode扩展汉字, 英語, ideographic, description, character, 是一块收录描述表意文字, 如汉字, 结构的符号的unicode區段, 其中部分描述符号编码于其他区段, ideographic, description, characters範圍u, 2ff0, 2fff, 16個碼位, 平面基本多文種平面, 文字通. 注意 本页有Unihan新版汉字 㐁 㐅 𠀬 𠁢 𠂊 𠂗 𠋑 𠚤 𢧌 𣏃 𤆯 𥘶 𧆬 𧓉 這些字符可能會错误显示 詳见Unicode扩展汉字 表意文字描述字符 英語 Ideographic Description Character IDC 是一块收录描述表意文字 如汉字 结构的符号的Unicode區段 其中部分描述符号编码于其他区段 表意文字描述字符Ideographic Description Characters範圍U 2FF0 U 2FFF 16個碼位 平面基本多文種平面 BMP 文字通用 英语 Script Unicode Special script property values 已分配16個碼位未分配0個保留碼位來源標準GBKUnicode版本歷史3 012 12 15 116 4 註釋 1 2 目前大部份編碼包含Unicode 處理漢字編碼時大致是先搜集漢字 给予每个漢字一个數字編碼 然而 漢字數量龐大 字集往往不完全 再加上漢字本身是開放組合 漢字的使用者很可能自造新字 不可能有一个可以搜集到所有漢字的字集 所以用這些字符描述某 字 如何以較簡單的部件組合起來 目录 1 码表 2 表意文字描述序列 3 限制 4 历史 5 另見 6 參考文獻 7 外部連結码表 编辑表意文字描述字符Ideographic Description Characters 1 2 Unicode 联盟官方码表 PDF 0 1 2 3 4 5 6 7 8 9 A B C D E FU 2FFx 注释 1 依据 Unicode 15 1表意文字描述序列 编辑表意文字描述序列 英語 Ideographic Description Sequence IDS 是Unicode標準定義的漢字結構描述語法 描述序列由描述字符與兩个以上特定字元 主要為漢字 組合而成 表示漢字的抽象結構 Unicode定義了16種組合字符 編碼 字符 意義 例字 序列 例字 序列U 2FF0 兩部件由左至右組成 相 木目 𠁢 丨 U 2FF1 兩部件由上至下組成 杏 木口 𠚤 𠂊丶U 2FF2 三部件由左至右組成 衍 彳氵亍 𠂗 丿夕乚U 2FF3 三部件由上至下組成 京 亠口小 𠋑 亼目口U 2FF4 兩部件由外而內組成 回 囗口 𠀬 㐁人U 2FF5 三面包圍 下方開口 凰 几皇 𧓉 齊虫U 2FF6 三面包圍 上方開口 凶 凵㐅 义 乂丶U 2FF7 三面包圍 右方開口 匠 匚斤 𧆬 虎九U 2FF8 兩面包圍 兩部件由左上至右下組成 病 疒丙 𤆯 耂火U 2FF9 兩面包圍 兩部件由右上至左下組成 戒 戈廾 𢧌 或壬U 2FFA 兩面包圍 兩部件由左下至右上組成 超 走召 𥘶 礼分U 2FFB 兩部件重疊 巫 工从 𣏃 木 コ一U 2FFC 三面包圍 左方開口 㕚 叉丶 𬺹 コ二U 2FFD 兩面包圍 兩部件由右下至左上組成 氷 水丶 斗 十U 2FFE 水平翻轉 卐 卍 𣥄 正U 2FFF 旋轉 𠕄 凹 𠄔 予另有两个描述符号并不在此区段内 編碼 字符 区段 意義 例字 序列 例字 序列U 303E 中日韩符号和标点 形似但不相等 㬵 U 3B35 胶 U 80F6 3 爫 4 U 31EF 中日韓筆畫 減去筆畫 乒 兵丶 𧰨 豕一IDS的運算方式是前綴表示法 運算子在前 對應數量的運算元在後 這種方式不需使用括號等字元輔助即可无歧義地表示運算順序 统一碼標準中 表意文字描述序列之定義如下 5 IDS 漢字 部首 中日韓筆畫 私人造字區 U FF1F IDS二元運算子 IDS IDS IDS三元運算子 IDS IDS IDS IDS二元運算子 U 2 FF0 U 2 FF1 U 2 FF4 U 2 FF5 U 2 FF6 U 2 FF7 U 2 FF8 U 2 FF9 U 2 FFA U 2 FFB IDS三元運算子 U 2 FF2 U 2 FF3 按此 合規範的IDS必須由漢字 中日韓部首字元 中日韓筆畫字元 U 31C0 U 31EF 私人造字 全形問號字元 U FF1F 以IDC連接而成 限制 编辑Unicode無定義漢字的唯一表述方式 依現行提案一漢字可用多種IDS表達 如 巫 可表示為 工从 或 工 人人 IDS主要目的在於表達漢字的抽象結構 而非像組合字符一樣用於動態組字 現實繪製合體字字形時須考量許多複雜要素 光用IDS不足以繪出符合一般要求的合成字 例如合體字上下 左右比例往往並非1 1 而是按二部件的實際外形調整 左上 右下 三方包圍等組合字的比例計算則更複雜 上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀 例如 工从 是將兩个 人 放到 工 的左右兩開口裡 而非簡單地將 工 和 从 上下疊合 历史 编辑以下檔案記錄了本區段中出現的字符的提議及定稿 Unicode版本 最終碼位 a 碼位數 UTC ID L2 ID WG2 ID 表意文字小组 ID 文档3 0 U 2FF0 2FFB 12 X3L2 95 111 N1284 Ideographic Structure Symbol additional request 1995 11 07 N1303 html doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 8 13 Ideographic structure symbols Minutes of Meeting 29 Tokyo 1996 01 26 N1348 Ideographic Components and Composition Scheme 1996 02 05 N1357 Revised Ideographic Structure Symbols 1996 04 12 N1353 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 9 Draft minutes of WG2 Copenhagen Meeting 30 1996 06 25 L2 97 026 N1494 IRG proposal Ideographic structure character 1996 06 27 N1430 N365 Proposal Summary Form Ideographic Structure Character 1996 08 01 N1453 页面存档备份 存于互联网档案馆 Ksar Mike Umamaheswaran V S 9 6 Ideographic Structure Characters WG 2 Minutes Quebec Meeting 31 1996 12 06 L2 97 023 N1486 N437 IRG 8 Resolutions 1997 01 16 N1489 Supplement to Ideographic Components and Composition Schemes 1997 01 16 N1490 N436 Response to WG2 question on Ideographic Structure Characters 1997 01 16 L2 97 030 N1503 pdf doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 9 6 Unconfirmed Minutes of WG 2 Meeting 32 Singapore 1997 01 20 24 1997 04 01 L2 97 114 N1544 html doc 页面存档备份 存于互联网档案馆 N453 Sato T K Questions on the Han structure method described in WG2 N1490 IRG N436 1997 04 08 L2 97 255R Aliprand Joan 4 B 2 Ideographic Structure Characters Approved Minutes UTC 73 amp L2 170 joint meeting Palo Alto CA August 4 5 1997 1997 12 03 N1680 页面存档备份 存于互联网档案馆 Project Sub Division Proposal on Scheme of Ideograph Description Sequence 1997 12 18 N1782 页面存档备份 存于互联网档案馆 Clause X Ideographic Description Sequence IDS IRG N575 1998 05 06 L2 98 158 Aliprand Joan Winkler Arnold SC2 SC2 Action re Ideographic Description Sequences Draft Minutes UTC 76 amp NCITS Subgroup L2 173 joint meeting Tredyffrin Pennsylvania April 20 22 1998 1998 05 26 N1842 页面存档备份 存于互联网档案馆 Proposed text for a Draft for amendment 28 Ideographic Description Sequences 1998 06 03 L2 98 286 N1703 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 9 5 Unconfirmed Meeting Minutes WG 2 Meeting 34 Redmond WA USA 1998 03 16 20 1998 07 02 The original proposal was to use character composition It has changed from being composition to description over its three year development L2 98 317 N1892 pdf doc 页面存档备份 存于互联网档案馆 Combined CD registration and consideration ballot on WD for 10646 1 Amd 28 AMENDMENT 28 Ideographic description characters 1998 10 22 L2 99 010 N1903 pdf html 页面存档备份 存于互联网档案馆 doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S 10 3 Minutes of WG 2 meeting 35 London U K 1998 09 21 25 1998 12 30 L2 99 072 1 N1971 页面存档备份 存于互联网档案馆 Irish Comments on SC 2 N 3186 1999 01 19 L2 99 072 N1970 html doc 页面存档备份 存于互联网档案馆 Summary of Voting on SC 2 N 3186 PDAM ballot on WD for 10646 1 Amd 28 Ideographic description characters 1999 02 05 N2023 页面存档备份 存于互联网档案馆 Paterson Bruce FPDAM 28 Text Ideographic Description Characters 1999 04 06 L2 99 120 Text for FPDAM ballot of ISO IEC 10646 Amd 28 Ideographic description characters 1999 04 07 UTC 1999 014 Jenkins John Recursion depth limit for IDC s 1999 06 01 UTC 1999 015 Whistler Ken Re Brief note on length of ideograph descriptions 1999 06 01 UTC 1999 020 Jenkins John Diagram and language for Ideograph Description Sequences 1999 06 04 L2 99 176R Moore Lisa Recursion Limit for Ideographic Description Characters Minutes from the joint UTC L2 meeting in Seattle June 8 10 1999 1999 11 04 L2 99 232 N2003 页面存档备份 存于互联网档案馆 Umamaheswaran V S 6 1 2 PDAM28 Ideographic Description Characters Minutes of WG 2 meeting 36 Fukuoka Japan 1999 03 09 15 1999 08 03 L2 99 253 N2067 页面存档备份 存于互联网档案馆 Summary of Voting on SC 2 N 3312 ISO 10646 1 FPDAM 28 Ideographic description characters 1999 08 19 L2 99 301 N2123 页面存档备份 存于互联网档案馆 Disposition of Comments Report on SC 2 N 3312 ISO IEC 10646 1 FPDAM 28 AMENDMENT 28 Ideographic description characters 1999 09 20 L2 99 302 N2124 页面存档备份 存于互联网档案馆 Paterson Bruce Revised Text for FDAM ballot of ISO IEC 10646 1 FDAM 28 AMENDMENT 28 Ideographic description characters 1999 09 24 L2 00 010 N2103 页面存档备份 存于互联网档案馆 Umamaheswaran V S 6 4 3 Minutes of WG 2 meeting 37 Copenhagen Denmark 1999 09 13 16 2000 01 05 L2 00 045 Summary of FDAM voting ISO 10646 Amd 28 Ideographic description characters 2000 01 31 L2 02 221 N2480 页面存档备份 存于互联网档案馆 Cook Richard Proposal to add Ideographic Description Characters IDC to the UCS 2002 05 18 L2 02 436 N2534 页面存档备份 存于互联网档案馆 N955 IRG Radical Classification 2002 11 21 L2 12 087 Proposed Changes to ISO IEC 10646 Annex I Ideographic Description Characters 2012 02 09 L2 12 007 Moore Lisa Consensus 130 C13 UTC 130 L2 227 Minutes 2012 02 14 Submit L2 12 087 on extensions to ideographic description sequences to WG2 L2 15 065 Jenkins John Proposal to Add IDS Links to Online Unihan Database 2015 02 02 L2 15 070 Davis Mark IDS in Unihan 2015 02 03 L2 15 313 Lunde Ken Request for IDS Data 2015 11 03 15 1 U 2FFC 2FFF 4 L2 17 386 N2273 Yang Tao Chan Eiso Wang Yifan Submission of 3 IDCes 2017 10 13 L2 17 379 Lunde Ken Proposed Ideographic Description Characters IDCs IRG 49 Liaison Report 2017 10 20 L2 18 012 Yang Tao Chan Eiso Wang Yifan Proposal of Four IDCs 2018 01 05 L2 18 168 Anderson Deborah Whistler Ken Pournader Roozbeh Moore Lisa Liang Hai Chapman Chris Cook Richard 22 IDCs Recommendations to UTC 155 April May 2018 on Script Proposals 2018 04 28 L2 21 118R N2492 Lunde Ken Jenkins John H Preliminary proposal to add a new provisional kIDS property Unihan 2021 08 11 L2 22 136 West Andrew Feedback on Proposals to Encode New Ideographic Description Characters 2022 07 08 L2 22 191 N2572 Lunde Ken Jenkins John West Andrew Proposal to encode five new Ideographic Description Characters 2022 08 24 L2 22 227 SAT Feedback to Preliminary proposal to add a new provisional kIDS property Unihan IRGN2492 and Proposal to encode five new Ideographic Description Characters IRGN2572 2022 08 29 L2 22 228 Fan Ming Feedback on IRGN2572 Proposal to encode 5 new ideograph description characters 2022 09 02 L2 22 247 Lunde Ken 29 CJK amp Unihan Group Recommendations for UTC 173 Meeting 2022 11 01 L2 22 241 Constable Peter E 1 29 Approved Minutes of UTC Meeting 173 2022 11 09 提案中建议的码位可能与最终码位不同 另見 编辑動態組字 組合字符參考文獻 编辑 Unicode character database The Unicode Standard 2016 07 09 原始内容存档于2017 09 25 Enumerated Versions of The Unicode Standard The Unicode Standard 2016 07 09 原始内容存档于2016 06 29 㬵 U 3B35 和 胶 U 80F6 为什么在 康熙字典 收录了两次 知乎 www zhihu com 2023 09 21 基本集扩充字考 五 完结 附扩充块新增字考 知乎专栏 2023 09 21 中文 The Unicode StandardVersion 6 0 Core Specification PDF 2020 02 10 原始内容存档 PDF 于2019 11 22 外部連結 编辑查看维基词典中的词条 附錄 Unicode 表意文字描述字符 Unicode的表意文字組合字符 页面存档备份 存于互联网档案馆 碼位一覽 Unicode的東亞文字處理 页面存档备份 存于互联网档案馆 http unicode org iuc iuc18 papers b16 ppt 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title 表意文字描述字符 amp oldid 79621549, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。