Lempel–Ziv–Storer–Szymanski(LZSS)是一个无损数据压缩算法,属于LZ77的派生,1982年由James Storer和Thomas Szymanski(英语:Thomas_Szymanski)创建。LZSS发布于《Journal of the ACM》[1]的“Data compression via textual substitution”。[2]
此例是Dr. Seuss所著《Green Eggs and Ham(英语:Green_Eggs_and_Ham)》的开头,每行开头的已有字符总数是为方便所设。
0: I am Sam 9: 10: Sam I am 19: 20: That Sam-I-am! 35: That Sam-I-am! 50: I do not like 64: that Sam-I-am! 79: 80: Do you like green eggs and ham? 112: 113: I do not like them, Sam-I-am. 143: I do not like green eggs and ham.
0: I am Sam 9: 10: (5,3) (0,4) 16: 17: That(4,4)-I-am!(19,16)I do not like 45: t(21,14) 49: Do you(58,5) green eggs and ham? 78: (49,14) them,(24,9).(112,15)(93,18).
许多流行的存档格式如PKZip(英语:PKZip)、ARJ、RAR、ZOO(英语:Zoo_(file_format))、LHarc都使用LZSS而不是LZ77作为主要的压缩算法;原文字符和长度距离对的编码方式各有不同,最常见的选项是霍夫曼编码。大多数实现源于1989年日本學者奧村晴彥所開發的代码。[3][4]Allegro程序库第四版可以编码和解码LZSS格式[5],但该特性在第五版中被去除。Game Boy Advance BIOS可以解码一个稍作修改的LZSS格式。[6]
lzss, lempel, storer, szymanski, 是一个无损数据压缩算法, 属于lz77的派生, 1982年由james, storer和thomas, szymanski, 英语, thomas, szymanski, 创建, 发布于, journal, data, compression, textual, substitution, 是一种字典编码技术, 它会尝试以符号字符串替换相同字符串为一个字典位置的引用, lz77与的主要区别是, lz77的字典引用可能比受替换的字符串更长, 在中, 如. Lempel Ziv Storer Szymanski LZSS 是一个无损数据压缩算法 属于LZ77的派生 1982年由James Storer和Thomas Szymanski 英语 Thomas Szymanski 创建 LZSS发布于 Journal of the ACM 1 的 Data compression via textual substitution 2 LZSS是一种字典编码技术 它会尝试以符号字符串替换相同字符串为一个字典位置的引用 LZ77与LZSS的主要区别是 LZ77的字典引用可能比受替换的字符串更长 在LZSS中 如果长度小于 盈亏平衡 点 引用会被省略 此外 LZSS使用单比特标志标记下一个数据块是原文 字节 还是引用的偏移与长度 目录 1 例子 2 实现 3 参见 4 参考资料例子 编辑此例是Dr Seuss所著 Green Eggs and Ham 英语 Green Eggs and Ham 的开头 每行开头的已有字符总数是为方便所设 0 I am Sam 9 10 Sam I am 19 20 That Sam I am 35 That Sam I am 50 I do not like 64 that Sam I am 79 80 Do you like green eggs and ham 112 113 I do not like them Sam I am 143 I do not like green eggs and ham 这是该段文本在未压缩形式的177字节 假设盈亏平衡点是2字节 并因此是2字节的指针 偏移对 那么加上一字节的新行字符 此文本使用LZSS压缩后将变为94字节 0 I am Sam 9 10 5 3 0 4 16 17 That 4 4 I am 19 16 I do not like 45 t 21 14 49 Do you 58 5 green eggs and ham 78 49 14 them 24 9 112 15 93 18 注意 这不包括标记下一个文本块是指针或原文的12字节 如果加上它 该段文本变为106字节 仍会少于原文的177字节 实现 编辑许多流行的存档格式如PKZip 英语 PKZip ARJ RAR ZOO 英语 Zoo file format LHarc都使用LZSS而不是LZ77作为主要的压缩算法 原文字符和长度距离对的编码方式各有不同 最常见的选项是霍夫曼编码 大多数实现源于1989年日本學者奧村晴彥所開發的代码 3 4 Allegro程序库第四版可以编码和解码LZSS格式 5 但该特性在第五版中被去除 Game Boy Advance BIOS可以解码一个稍作修改的LZSS格式 6 参见 编辑LZ77 LZW参考资料 编辑 1982年 928页至951页 Storer James A Szymanski Thomas G October 1982 Simtel net mirror Haruhiko Okumura Hargreaves Shawn et al Korth Martin 取自 https zh wikipedia org w index php title LZSS amp oldid 78904914, 维基百科,wiki,书籍,书籍,图书馆,