fbpx
维基百科

字串搜尋演算法

字串搜尋演算法String searching algorithms)又稱字串比對演算法string matching algorithms)是一种搜索算法,是字串演算法中的一類,用以試圖在一長字符串或文章中,找出其是否包含某一個或多個字符串,以及其位置。

最直觀的解法是比對,如下例中,在字符串haystack中找出字符串needle

char* haystack; char* needle; int hlen, nlen, found; int i,j,k; found = 0; hlen = strlen(haystack); nlen = strlen(needle); for (i = 0; i < hlen; ++i) {  for (j = 0; j < nlen; ++j) {  if (haystack[i+j] != needle[j]) break;  if (j == nlen - 1) found = 1;  }; }; return found; 

上例中,若字符串needle存在於字符串haystack中,則傳回1,否則傳回0。

但是此直觀算法的複雜度為 O(mn),其中haystack的長度為n、needle的長度為m,所以另有更快速的算法。

部分算法比较

m 为模式的长度, n 为要搜索的字符串长度, k为字母表长度。

算法 预处理时间 匹配时间
朴素算法 0 (无需预处理) Θ(nm)
Rabin-Karp算法 Θ(m) 平均 Θ(n + m),
最差 Θ((n−m)m)
基于有限状态机的搜索 Θ(mk) Θ(n)
克努斯-莫里斯-普拉特算法 Θ(m) Θ(n)
Boyer-Moore字符串搜索算法 Θ(m + k) 最好Ω(n/m),
最坏 O(n)
Bitap算法 Θ(m + k) O(mn)

外部連結

  • Huge (maintained) list of pattern matching links(页面存档备份,存于互联网档案馆
  • StringSearch — high-performance pattern matching algorithms in Java[失效連結] – Implementations of many String-Matching-Algorithms in Java (BNDM, Boyer-Moore-Horspool, Boyer-Moore-Horspool-Raita, Shift-Or)
  • Exact String Matching Algorithms—Animation in Java(页面存档备份,存于互联网档案馆
  • Project Dedupe http://dedupe.sourceforge.net[永久失效連結]

字串搜尋演算法, string, searching, algorithms, 又稱字串比對演算法, string, matching, algorithms, 是一种搜索算法, 是字串演算法中的一類, 用以試圖在一長字符串或文章中, 找出其是否包含某一個或多個字符串, 以及其位置, 最直觀的解法是比對, 如下例中, 在字符串haystack中找出字符串needle, char, haystack, char, needle, hlen, nlen, found, found, hlen, strlen, hays. 字串搜尋演算法 String searching algorithms 又稱字串比對演算法 string matching algorithms 是一种搜索算法 是字串演算法中的一類 用以試圖在一長字符串或文章中 找出其是否包含某一個或多個字符串 以及其位置 最直觀的解法是比對 如下例中 在字符串haystack中找出字符串needle char haystack char needle int hlen nlen found int i j k found 0 hlen strlen haystack nlen strlen needle for i 0 i lt hlen i for j 0 j lt nlen j if haystack i j needle j break if j nlen 1 found 1 return found 上例中 若字符串needle存在於字符串haystack中 則傳回1 否則傳回0 但是此直觀算法的複雜度為 O mn 其中haystack的長度為n needle的長度為m 所以另有更快速的算法 部分算法比较 编辑令 m 为模式的长度 n 为要搜索的字符串长度 k为字母表长度 算法 预处理时间 匹配时间朴素算法 0 无需预处理 8 nm Rabin Karp算法 8 m 平均 8 n m 最差 8 n m m 基于有限状态机的搜索 8 mk 8 n 克努斯 莫里斯 普拉特算法 8 m 8 n Boyer Moore字符串搜索算法 8 m k 最好W n m 最坏 O n Bitap算法 8 m k O mn 外部連結 编辑Huge maintained list of pattern matching links 页面存档备份 存于互联网档案馆 StringSearch high performance pattern matching algorithms in Java 失效連結 Implementations of many String Matching Algorithms in Java BNDM Boyer Moore Horspool Boyer Moore Horspool Raita Shift Or Exact String Matching Algorithms Animation in Java 页面存档备份 存于互联网档案馆 String similarity metrics Project Dedupe http dedupe sourceforge net 永久失效連結 Boyer Moore Raita Thomas 取自 https zh wikipedia org w index php title 字串搜尋演算法 amp oldid 67551080, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。