KMP算法是一种改进的算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为————操作(简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。O(m+n)。
设主串(下文中我们称作T)为:a b a c a a b a c a b a c a b a a b b
模式串(下文中我们称作W)为:a b a c a b
在native朴素匹配算法中,遍历T的每个位置,对每个位置逐个比较T[i]与W[j],这样的算法效率比较低。kmp算法通过寻找W中的重复信息,不是遍历每个T的位置,在一次位置匹配中跳出,下次匹配位置可以根据这次匹配信息跳过几步,而不是简单的i++,这里跳过多少步就是用next[]数组表示,数组长度等于W的长度。
用法:求next[]数组,next数组中k位置的值next[k]等于W[0:k]中包含的最长的相同的前缀和后缀(如aba为1,abcab为2),公式可以有不同的表示,这里其他情况1也可以是0,在跳步中对应跳1步
原理: