fbpx
维基百科

表意文字描述字符

表意文字描述字符(英語:Ideographic Description Character,IDC)是一个Unicode區段,其包含用于描述CJK字符集的形意符号,属于Unicode自 3.0 後對漢字所做的一種支援。

表意文字描述字符
Ideographic Description Characters
範圍U+2FF0..U+2FFF
(16個碼位)
平面基本多文種平面BMP
文字通用英语Script (Unicode)#Special script property values
已分配12個碼位
未分配4個保留碼位
來源標準GB 2312-80
Unicode版本歷史
3.012 (+12)
註釋[1][2]

目前大部的編碼包含Unicode,對於漢字編碼的處理大致為先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以搜集到所有漢字,所以用這樣的字符來描述某一個「字」是如何被更基本的部件組合起來。

码表

表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FFx
注释
1.^ 依据 Unicode 13.0
2.^ 灰色区域为未分配码位

另有收录 U+303E IDEOGRAPHIC VARIATION INDICATOR 表意文字指示符,以用來表示形似但不相等的字。

表意文字描述序列

表意文字描述序列(英語:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,一個描述序列是由一個描述字符與兩個以上特定字元(主要為漢字)組合而成,表示一個漢字的抽象結構。

Unicode定義了12種組合字符:

編碼 字符 意義 例字 序列 例字 序列
U+2FF0 兩個部件由左至右組成 ⿰木目 𠁢 ⿰丨㇍
U+2FF1 兩個部件由上至下組成 ⿱木口 𠚤 ⿱𠂊丶
U+2FF2 三個部件由左至右組成 ⿲彳氵亍 𠂗 ⿲丿夕乚
U+2FF3 三個部件由上至下組成 ⿳亠口小 𠋑 ⿳亼目口
U+2FF4 兩個部件由外而內組成 ⿴囗口 𠀬 ⿴㐁人
U+2FF5 三面包圍,下方開口 ⿵几皇 𧓉 ⿵齊虫
U+2FF6 三面包圍,上方開口 ⿶凵㐅 ⿶乂丶
U+2FF7 三面包圍,右方開口 ⿷匚斤 𧆬 ⿷虎九
U+2FF8 兩面包圍,兩個部件由左上至右下組成 ⿸疒丙 𤆯 ⿸耂火
U+2FF9 兩面包圍,兩個部件由右上至左下組成 ⿹戈廾 𢧌 ⿹或壬
U+2FFA 兩面包圍,兩個部件由左下至右上組成 ⿺走召 𥘶 ⿺礼分
U+2FFB 兩個部件重疊 ⿻工从 𣏃 ⿻木⿻コ一

IDS的運算方式是前綴表示法,即運算子在前,對應數量的運算元在後。這種方式不須使用括號等字元輔助即可無歧義地表示運算順序。

Unicode標準中,表意文字描述序列之定義如下:[3]

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB IDS三元運算子 := U+2FF2 | U+2FF3 

按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0..U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。

限制

  • Unicode尚未定義漢字的唯一表述方式,依現行提案一個漢字可用多種IDS表達,例如「巫」可以表示為「⿻工从」或「⿻工⿰人人」。
  • IDS主要目的在於表達漢字的抽象結構,而不是像組合字符一樣用於動態組字。實務上組合漢字的字形繪製有許多複雜要素須考量,光用IDS尚不足以繪出符合一般要求的合成字。例如,組合漢字上下、左右比例往往並非1:1,而是按二部件的實際外形調整;左上-右下、三方包圍等組合字的比例計算則更複雜;上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀,例如「⿻工从」是將兩個「人」放到「工」的左右兩個開口裡,而非簡單地將「工」和「从」上下疊合。

历史

以下的Unicode相關檔案記錄了本區段中出現之字符的提議及定稿。

另見

參考文獻

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容于2016-06-29). 
  3. ^ The Unicode StandardVersion 6.0 – Core Specification (PDF). [2020-02-10]. (原始内容 (PDF)于2019-11-22). 

外部連結

表意文字描述字符, 注意, 本页面含有unihan新版汉字, 𠀬, 𠁢, 𠂊, 𠂗, 𠋑, 𠚤, 𢧌, 𣏃, 𤆯, 𥘶, 𧆬, 𧓉, 有关字符可能會错误显示, 詳见unicode扩展汉字, 英語, ideographic, description, character, 是一个unicode區段, 其包含用于描述cjk字符集的形意符号, 属于unicode自, 後對漢字所做的一種支援, ideographic, description, characters範圍u, 2ff0, 2fff, 16個碼位, 平面基本多. 注意 本页面含有Unihan新版汉字 㐁 㐅 𠀬 𠁢 𠂊 𠂗 𠋑 𠚤 𢧌 𣏃 𤆯 𥘶 𧆬 𧓉 有关字符可能會错误显示 詳见Unicode扩展汉字 表意文字描述字符 英語 Ideographic Description Character IDC 是一个Unicode區段 其包含用于描述CJK字符集的形意符号 属于Unicode自 3 0 後對漢字所做的一種支援 表意文字描述字符Ideographic Description Characters範圍U 2FF0 U 2FFF 16個碼位 平面基本多文種平面 BMP 文字通用 英语 Script Unicode Special script property values 已分配12個碼位未分配4個保留碼位來源標準GB 2312 80Unicode版本歷史3 012 12 註釋 1 2 目前大部的編碼包含Unicode 對於漢字編碼的處理大致為先搜集漢字 給予每個漢字一個數字編碼 然而 漢字數量龐大 往往字集不完全 再加上漢字本身具有組合以及開放的特性 漢字使用者很有可能自造新字 因此不可能有一個字集可以搜集到所有漢字 所以用這樣的字符來描述某一個 字 是如何被更基本的部件組合起來 目录 1 码表 2 表意文字描述序列 3 限制 4 历史 5 另見 6 參考文獻 7 外部連結码表 编辑表意文字描述字符Ideographic Description Characters 1 2 Unicode 联盟官方码表 PDF 0 1 2 3 4 5 6 7 8 9 A B C D E FU 2FFx 注释 1 依据 Unicode 13 0 2 灰色区域为未分配码位另有收录 U 303E IDEOGRAPHIC VARIATION INDICATOR 表意文字指示符 以用來表示形似但不相等的字 表意文字描述序列 编辑表意文字描述序列 英語 Ideographic Description Sequence IDS 是Unicode標準定義的漢字結構描述語法 一個描述序列是由一個描述字符與兩個以上特定字元 主要為漢字 組合而成 表示一個漢字的抽象結構 Unicode定義了12種組合字符 編碼 字符 意義 例字 序列 例字 序列U 2FF0 兩個部件由左至右組成 相 木目 𠁢 丨 U 2FF1 兩個部件由上至下組成 杏 木口 𠚤 𠂊丶U 2FF2 三個部件由左至右組成 衍 彳氵亍 𠂗 丿夕乚U 2FF3 三個部件由上至下組成 京 亠口小 𠋑 亼目口U 2FF4 兩個部件由外而內組成 回 囗口 𠀬 㐁人U 2FF5 三面包圍 下方開口 凰 几皇 𧓉 齊虫U 2FF6 三面包圍 上方開口 凶 凵㐅 义 乂丶U 2FF7 三面包圍 右方開口 匠 匚斤 𧆬 虎九U 2FF8 兩面包圍 兩個部件由左上至右下組成 病 疒丙 𤆯 耂火U 2FF9 兩面包圍 兩個部件由右上至左下組成 戒 戈廾 𢧌 或壬U 2FFA 兩面包圍 兩個部件由左下至右上組成 超 走召 𥘶 礼分U 2FFB 兩個部件重疊 巫 工从 𣏃 木 コ一IDS的運算方式是前綴表示法 即運算子在前 對應數量的運算元在後 這種方式不須使用括號等字元輔助即可無歧義地表示運算順序 Unicode標準中 表意文字描述序列之定義如下 3 IDS 漢字 部首 中日韓筆畫 私人造字區 U FF1F IDS二元運算子 IDS IDS IDS三元運算子 IDS IDS IDS IDS二元運算子 U 2 FF0 U 2 FF1 U 2 FF4 U 2 FF5 U 2 FF6 U 2 FF7 U 2 FF8 U 2 FF9 U 2 FFA U 2 FFB IDS三元運算子 U 2 FF2 U 2 FF3 按此 合規範的IDS必須由漢字 中日韓部首字元 中日韓筆畫字元 U 31C0 U 31EF 私人造字 全形問號字元 U FF1F 以IDC連接而成 限制 编辑Unicode尚未定義漢字的唯一表述方式 依現行提案一個漢字可用多種IDS表達 例如 巫 可以表示為 工从 或 工 人人 IDS主要目的在於表達漢字的抽象結構 而不是像組合字符一樣用於動態組字 實務上組合漢字的字形繪製有許多複雜要素須考量 光用IDS尚不足以繪出符合一般要求的合成字 例如 組合漢字上下 左右比例往往並非1 1 而是按二部件的實際外形調整 左上 右下 三方包圍等組合字的比例計算則更複雜 上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀 例如 工从 是將兩個 人 放到 工 的左右兩個開口裡 而非簡單地將 工 和 从 上下疊合 历史 编辑以下的Unicode相關檔案記錄了本區段中出現之字符的提議及定稿 Unicode版本 最終碼位 a 碼位數 UTC ID L2 ID WG2 ID 表意文字小组 ID 文档3 0 U 2FF0 2FFB 12 X3L2 95 111 N1284 Ideographic Structure Symbol additional request 1995 11 07 N1303 html doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 8 13 Ideographic structure symbols Minutes of Meeting 29 Tokyo 1996 01 26 N1348 Ideographic Components and Composition Scheme 1996 02 05 N1357 Revised Ideographic Structure Symbols 1996 04 12 N1353 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 9 Draft minutes of WG2 Copenhagen Meeting 30 1996 06 25 L2 97 026 N1494 IRG proposal Ideographic structure character 1996 06 27 N1430 N365 Proposal Summary Form Ideographic Structure Character 1996 08 01 N1453 页面存档备份 存于互联网档案馆 Ksar Mike Umamaheswaran V S 9 6 Ideographic Structure Characters WG 2 Minutes Quebec Meeting 31 1996 12 06 L2 97 023 N1486 N437 IRG 8 Resolutions 1997 01 16 N1489 Supplement to Ideographic Components and Composition Schemes 1997 01 16 N1490 N436 Response to WG2 question on Ideographic Structure Characters 1997 01 16 L2 97 030 N1503 pdf doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 9 6 Unconfirmed Minutes of WG 2 Meeting 32 Singapore 1997 01 20 24 1997 04 01 L2 97 114 N1544 html doc 页面存档备份 存于互联网档案馆 N453 Sato T K Questions on the Han structure method described in WG2 N1490 IRG N436 1997 04 08 L2 97 255R Aliprand Joan 4 B 2 Ideographic Structure Characters Approved Minutes UTC 73 amp L2 170 joint meeting Palo Alto CA August 4 5 1997 1997 12 03 N1680 页面存档备份 存于互联网档案馆 Project Sub Division Proposal on Scheme of Ideograph Description Sequence 1997 12 18 N1782 页面存档备份 存于互联网档案馆 Clause X Ideographic Description Sequence IDS IRG N575 1998 05 06 L2 98 158 Aliprand Joan Winkler Arnold SC2 SC2 Action re Ideographic Description Sequences Draft Minutes UTC 76 amp NCITS Subgroup L2 173 joint meeting Tredyffrin Pennsylvania April 20 22 1998 1998 05 26 N1842 页面存档备份 存于互联网档案馆 Proposed text for a Draft for amendment 28 Ideographic Description Sequences 1998 06 03 L2 98 286 N1703 页面存档备份 存于互联网档案馆 Umamaheswaran V S Ksar Mike 9 5 Unconfirmed Meeting Minutes WG 2 Meeting 34 Redmond WA USA 1998 03 16 20 1998 07 02 The original proposal was to use character composition It has changed from being composition to description over its three year development L2 98 317 N1892 pdf doc 页面存档备份 存于互联网档案馆 Combined CD registration and consideration ballot on WD for 10646 1 Amd 28 AMENDMENT 28 Ideographic description characters 1998 10 22 L2 99 010 N1903 pdf html 页面存档备份 存于互联网档案馆 doc 页面存档备份 存于互联网档案馆 Umamaheswaran V S 10 3 Minutes of WG 2 meeting 35 London U K 1998 09 21 25 1998 12 30 L2 99 072 1 N1971 页面存档备份 存于互联网档案馆 Irish Comments on SC 2 N 3186 1999 01 19 L2 99 072 N1970 html doc 页面存档备份 存于互联网档案馆 Summary of Voting on SC 2 N 3186 PDAM ballot on WD for 10646 1 Amd 28 Ideographic description characters 1999 02 05 N2023 页面存档备份 存于互联网档案馆 Paterson Bruce FPDAM 28 Text Ideographic Description Characters 1999 04 06 L2 99 120 Text for FPDAM ballot of ISO IEC 10646 Amd 28 Ideographic description characters 1999 04 07 UTC 1999 014 Jenkins John Recursion depth limit for IDC s 1999 06 01 UTC 1999 015 Whistler Ken Re Brief note on length of ideograph descriptions 1999 06 01 UTC 1999 020 Jenkins John Diagram and language for Ideograph Description Sequences 1999 06 04 L2 99 176R Moore Lisa Recursion Limit for Ideographic Description Characters Minutes from the joint UTC L2 meeting in Seattle June 8 10 1999 1999 11 04 L2 99 232 N2003 页面存档备份 存于互联网档案馆 Umamaheswaran V S 6 1 2 PDAM28 Ideographic Description Characters Minutes of WG 2 meeting 36 Fukuoka Japan 1999 03 09 15 1999 08 03 L2 99 253 N2067 页面存档备份 存于互联网档案馆 Summary of Voting on SC 2 N 3312 ISO 10646 1 FPDAM 28 Ideographic description characters 1999 08 19 L2 99 301 N2123 页面存档备份 存于互联网档案馆 Disposition of Comments Report on SC 2 N 3312 ISO IEC 10646 1 FPDAM 28 AMENDMENT 28 Ideographic description characters 1999 09 20 L2 99 302 N2124 页面存档备份 存于互联网档案馆 Paterson Bruce Revised Text for FDAM ballot of ISO IEC 10646 1 FDAM 28 AMENDMENT 28 Ideographic description characters 1999 09 24 L2 00 010 N2103 页面存档备份 存于互联网档案馆 Umamaheswaran V S 6 4 3 Minutes of WG 2 meeting 37 Copenhagen Denmark 1999 09 13 16 2000 01 05 L2 00 045 Summary of FDAM voting ISO 10646 Amd 28 Ideographic description characters 2000 01 31 L2 02 221 N2480 页面存档备份 存于互联网档案馆 Cook Richard Proposal to add Ideographic Description Characters IDC to the UCS 2002 05 18 L2 02 436 N2534 页面存档备份 存于互联网档案馆 N955 IRG Radical Classification 2002 11 21 L2 12 087 Proposed Changes to ISO IEC 10646 Annex I Ideographic Description Characters 2012 02 09 L2 12 007 Moore Lisa Consensus 130 C13 UTC 130 L2 227 Minutes 2012 02 14 Submit L2 12 087 on extensions to ideographic description sequences to WG2 L2 15 065 Jenkins John Proposal to Add IDS Links to Online Unihan Database 2015 02 02 L2 15 070 Davis Mark IDS in Unihan 2015 02 03 L2 15 313 Lunde Ken Request for IDS Data 2015 11 03 提案中建议的码位可能与最终码位不同 另見 编辑動態組字 組合字符參考文獻 编辑 Unicode character database The Unicode Standard 2016 07 09 原始内容存档于2017 09 25 Enumerated Versions of The Unicode Standard The Unicode Standard 2016 07 09 原始内容存档于2016 06 29 The Unicode StandardVersion 6 0 Core Specification PDF 2020 02 10 原始内容存档 PDF 于2019 11 22 外部連結 编辑查看维基词典中的词条 附錄 Unicode 表意文字描述字符 Unicode的表意文字組合字符 页面存档备份 存于互联网档案馆 碼位一覽 Unicode的東亞文字處理 页面存档备份 存于互联网档案馆 http unicode org iuc iuc18 papers b16 ppt 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title 表意文字描述字符 amp oldid 74372697, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。