fbpx
维基百科

詞語定序

詞語定序,或稱定序(英語:Collation,目前没有公认的译名,但不少資訊領域者,如微軟[1],根據其內涵而譯作「定序」,或有译作“文字排序”[註 1]),是指在计算机科学图书馆学、词典编撰中书写信息的标准排序。如数值序英语numerical order或者字母序英语alphabetical order 。形式上说,定序方法对所有可能的标识符(即排序键英语sort key)集合定义了一个全序,因此在信息项的集合上产生了一个全预序英语total preorder(因为具有相同的排序键英语sort key的信息项没有预定次序)。

定序算法,如統一碼定序演算法,則定义如何比较两个字符串确定何者在先。

数值序或者编年序 编辑

表示数值(或时间)的字符串按照其表示的数值,例如: "-4", "2.5", "10", "89", "30,000". 注意可能会存在偏序情况,如"2"与"2.0","2e3"与"2000"。

字母序 编辑

字母序,也称词典序。常见问题有:

  • 空白符英语Whitespace character(如空格符)如何处理;
  • 附加符号。法语中把带附加符号的字符都当作基本字符来排序。德语的“电话簿序”中,Ä, Ö, Ü应当作为 "ae", "oe", "ue" 来排序。因此,姓Müller/Mueller具有相同的排序位置。西班牙语的Ñ作为一个单独字母排在N之后.
  • 姓名排序时,不论书写或印刷时的姓与名谁在先,可能需要先按照姓,再按照名排序。
  • 以常见词(如"the" 或 "a")开头的信息项,排序时可能会忽略或者把这些前缀词移动到最后来排序。
  • 爱尔兰与苏格兰姓的常见前缀M'或Mc,可视作是MaC的缩写,排序时按照非缩写形式。如McKinley被视作Mackintosh
  • 连字(ligature),在英语中不被视作不同的字符,如Æ或Œ,排序时当作ae或ce。但在1994年之前的西班牙语, "CH"与"LL"作为单个字母,分别排在字母C与L之后,因此会如此排序“cinco, credo, chispa”或者“lomo, luz, llama”. 威尔士语中,CH, DD, FF, NG, LL, PH, RH, TH都作为单独的字母,排在其字符对的第一个字母之后(NG例外,排在G之后),因此有如下排序:A, B, C, CH, D, DD, E, F, FF, G, NG, H.
  • 字母与数字混排,有时可按照先数字后字母,或者把数字用字母拼写后排序,如:1776按照"seventeen seventy-six"排序。

参见 编辑

外部連結 编辑

  • 統一碼定序演算法 (页面存档备份,存于互联网档案馆):統一碼技术标准 #10
  • Collation in Spanish(页面存档备份,存于互联网档案馆
  • Typographical collation for many languages(页面存档备份,存于互联网档案馆), as proposed in the List module of Cascading Style Sheets.
  • : Charts demonstrating language-specific sorting orders in various operating systems and DBMS
  • ICU Locale Explorer (页面存档备份,存于互联网档案馆) 使用國際統一碼部件在線展示統一碼定序演算

注释 编辑

  1. ^ collation不限于字母排序,而是字符串的排序规则。

参考文献 编辑

  1. ^ 檢視定序資訊 - SQL Server. docs.microsoft.com. 微軟. [2021-11-17] (中文(臺灣)). 

詞語定序, 或稱定序, 英語, collation, 目前没有公认的译名, 但不少資訊領域者, 如微軟, 根據其內涵而譯作, 定序, 或有译作, 文字排序, 是指在计算机科学与图书馆学, 词典编撰中书写信息的标准排序, 如数值序, 英语, numerical, order, 或者字母序, 英语, alphabetical, order, 形式上说, 定序方法对所有可能的标识符, 即排序键, 英语, sort, 集合定义了一个全序, 因此在信息项的集合上产生了一个全预序, 英语, total, preorder, 因. 詞語定序 或稱定序 英語 Collation 目前没有公认的译名 但不少資訊領域者 如微軟 1 根據其內涵而譯作 定序 或有译作 文字排序 註 1 是指在计算机科学与图书馆学 词典编撰中书写信息的标准排序 如数值序 英语 numerical order 或者字母序 英语 alphabetical order 形式上说 定序方法对所有可能的标识符 即排序键 英语 sort key 集合定义了一个全序 因此在信息项的集合上产生了一个全预序 英语 total preorder 因为具有相同的排序键 英语 sort key 的信息项没有预定次序 定序算法 如統一碼定序演算法 則定义如何比较两个字符串确定何者在先 目录 1 数值序或者编年序 2 字母序 3 参见 4 外部連結 5 注释 6 参考文献数值序或者编年序 编辑表示数值 或时间 的字符串按照其表示的数值 例如 4 2 5 10 89 30 000 注意可能会存在偏序情况 如 2 与 2 0 2e3 与 2000 字母序 编辑主条目 字母序 字母序 也称词典序 常见问题有 空白符 英语 Whitespace character 如空格符 如何处理 附加符号 法语中把带附加符号的字符都当作基本字符来排序 德语的 电话簿序 中 A O U应当作为 ae oe ue 来排序 因此 姓Muller Mueller具有相同的排序位置 西班牙语的N作为一个单独字母排在N之后 姓名排序时 不论书写或印刷时的姓与名谁在先 可能需要先按照姓 再按照名排序 以常见词 如 the 或 a 开头的信息项 排序时可能会忽略或者把这些前缀词移动到最后来排序 爱尔兰与苏格兰姓的常见前缀M 或Mc 可视作是MaC的缩写 排序时按照非缩写形式 如McKinley被视作Mackintosh 连字 ligature 在英语中不被视作不同的字符 如AE或Œ 排序时当作ae或ce 但在1994年之前的西班牙语 CH 与 LL 作为单个字母 分别排在字母C与L之后 因此会如此排序 cinco credo chispa 或者 lomo luz llama 威尔士语中 CH DD FF NG LL PH RH TH都作为单独的字母 排在其字符对的第一个字母之后 NG例外 排在G之后 因此有如下排序 A B C CH D DD E F FF G NG H 字母与数字混排 有时可按照先数字后字母 或者把数字用字母拼写后排序 如 1776按照 seventeen seventy six 排序 参见 编辑統一碼等價性外部連結 编辑統一碼定序演算法 页面存档备份 存于互联网档案馆 統一碼技术标准 10 Collation in Spanish 页面存档备份 存于互联网档案馆 Collation of the names of the member states of the United Nations Typographical collation for many languages 页面存档备份 存于互联网档案馆 as proposed in the List module of Cascading Style Sheets Collation Charts Charts demonstrating language specific sorting orders in various operating systems and DBMS ICU Locale Explorer 页面存档备份 存于互联网档案馆 使用國際統一碼部件在線展示統一碼定序演算注释 编辑 collation不限于字母排序 而是字符串的排序规则 参考文献 编辑 檢視定序資訊 SQL Server docs microsoft com 微軟 2021 11 17 中文 臺灣 查看维基词典中的词条 collation 或 alphabetization 取自 https zh wikipedia org w index php title 詞語定序 amp oldid 72826005, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。