一二三排檢法
一二三排檢法,全稱一二三漢字筆順排檢法,根據筆順和筆畫表來給漢字做排序和檢索,其工作原理與英文和汉语拼音等拉丁文字的字母順序 (alphabetical order) 完全一致。與傳統的筆畫排檢法相比,一二三免除了數算筆畫和歸并筆形(為五類)的負擔,但保持了排檢的精確度。[1]
該排檢法已應用於Unicode的CJK漢字基本集全部20,902個字的排序。還編排出版了一個涵蓋新華字典和 現代漢語詞典的聯合索引手冊。[2][3]
排檢法 编辑
單字排檢 编辑
單字條按漢字筆順和《一二三漢字筆順排檢法筆形表》順序排檢,類似於英文和漢語拼音的字母序。
如果把漢字筆順的筆劃序列看做英語單詞的字母序列,那麼用一二三排檢法給漢字排序類似於按字母表給英文單詞排序。兩個漢字按各自的第一筆在筆形表中的位置前後來排序。如果第一筆相同,檢查第二筆,依此類推。例如, “一二三排檢法,一二三排检法”中的不同漢字的排序為:[4]
一 (一) 二 (一一) 三 (一一一) 檢 (㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔) 检 (一丨丿丶丿㇏一丶丶丿一) 排 (一亅㇀丨一一一丨一一一) 法 (㇔㇔㇀㇐㇑㇐㇜㇔)
多字詞排檢 编辑
多字詞按第一個字排序,如果第一個字相同,則比較第二個字,以此類推。非漢字字符排在漢字後面,按照字母表/Unicode的順序排序,例如:[4]
覺 (繁体) 覺醒 (繁体) 觉 (简体) 觉醒 (简体) 觉悟 (简体) B超 (简体) T恤
筆順和字形表 编辑
在字形和筆順方面,应该遵循官方的标准。目前较有影响的标准是 中国内地國家語言文字工作委員會頒布的《通用规范汉字笔顺规范》[5] 和台湾的《常用國字標準字體筆順手册》[6]。
一二三排檢法的筆形表依據《GB13000.1字符集漢字折筆規範》[7] 和Unicode 《CJK 筆形表》[8]編寫,略作調整。共計30種筆形,按照標準平筆筆形的順序“橫(一)、提(㇀)、豎(丨)、撇(丿)、點(丶)、捺(㇏)”和折點順序“折、彎、鉤”排列。全表如下:
"㇐ ㇕ ㇅ ㇎ ㇡ ㇋ ㇊ ㇍ ㇈ ㇆ ㇇ ㇌ 飞[a] ㇀ ㇑ ㇗ ㇞ ㇉ ㄣ ㇙ ㇄ ㇟ ㇚ ㇓ ㇜ ㇛ ㇢ ㇔ ㇏ ㇂". [9]
應用 编辑
一二三排檢法已經成功應用於一些工具書編排,包括:
名稱 编辑
排檢法的中文名“一二三”取字序表的前三個漢字,[b] 顯示其簡單便捷, 不需按筆畫數排檢的特點。
英文名稱 "YES" 是“一二三”漢語拼音“Yi Er San”的縮寫。[14]
評論 编辑
與傳統的筆畫排檢法相比,免除了數算筆畫數目和歸並筆畫(為五類)的負擔,同時保持了排檢的精確度。基本排檢原則與英文和漢語拼音的排檢法完全一致,而且筆畫表的排列有理據,便於使用。 但與英文等拉丁文字的字母表排檢法相比,總的來説仍有一定距離:一是需要從漢字到筆順的轉換,二是有極少數漢字筆順完全一樣但字形有別,三是還沒有全球統一的筆畫表和筆順標準。因此,還達不到英文排檢那麽簡便。[15]
注释 编辑
参见 编辑
參考資料 编辑
引用 编辑
引用文獻 编辑
- 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字字序(笔画序)规范 (PDF). 上海: 上海教育出版社. 1999 (中文).
- 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字折笔规范. 北京: 语文出版社. 2002. ISBN 978-7-80-126882-2.
- 国家语委, 国家语言文字工作委员会. 通用规范汉字笔顺规范. Beijing: 商务印书馆. 2021. ISBN 978-7-100-19347-4 (中文).
- NLPC, 國語推行委員會. 常用國字標準字體筆順手册. 台北: 教育部. 1996. ISBN 978-9-57-090664-6 (中文).
- Unicode Consortium. Unicode Standard, Version 15.1.0.. Mountain View, CA: Unicode Consortium. 2023 (英语).
- 张, 小衡 (张小衡,李笑通); et al. 一二三笔顺检字手册. 北京: 语文出版社. 2013. ISBN 978-7-80241-670-3 (中文).
- Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三漢英大詞典, Trial Edition, Sorted by Traditional Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015a, 4 (1): link to the book –通过link to the book.
- Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三汉英大词典, Trial Edition, Sorted by Simplified Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015c, 4 (1): link to the book –通过link to the book.
- Zhang, Xiaoheng. Building a collation element table for a large Chinese character set in YES. Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data - Lecture Notes in Computer Science. Switzerland: Springer Verlag. 2015b: 3–14. ISBN 9783319258157 (英语).
外部連結 编辑
- YES stroke alphabetical order.
- Stroke-based sorting.