应用Q-gram命中特征优化的近似串匹配算法
大小:1.38 MB 人气: 2017-11-14 需要积分:0
近似串匹配( Approximate String Matching)是允许有“错误”发生的字符串匹配,它在文本串中查找所有与模式串之间错误数不大于一定阈值的所有匹配串。字符串间的错误数可采用编辑距离、汉明距离、最长公共子串等表示。编辑距离是指把一个字符串经过插入、修改或删除3种编辑操作转变成字符串所要进行的最小操作次数,常用表示。近似串匹配技术在众多研究领域都有广泛的应用,如文本检索、生物信息学、信号处理和模式识别等。
基于Off-Iine模式的过滤算法是一种采用先过滤冉验证的二阶段近似串匹配方法。过滤算法因采用过滤技术能在前期快速去除大量文本区域,适合Off-line模式下的大文本库匹配。目前,过滤算法可归为二类:精确匹配子串法和近似匹配子串法。精确匹配子串法通过定位无错误的模式串子串进行过滤。
本研究主要解决的是在大文本库中快速查找与模式串间错误率不大于的所有匹配串的问题。文中将结合KS算法和q-gram命中特征,设计一个新的无损过滤算法,拟通过牺牲一定过滤时间来换取较大过滤效率的提升,最终达到提高算法整体匹配速度的目的。
非常好我支持^.^
(0) 0%
不好我反对
(1) 100%
下载地址
应用Q-gram命中特征优化的近似串匹配算法下载
相关电子资料下载
- 了解锁相环(PLL)瞬态响应 如何优化锁相环(PLL)的瞬态响应? 44
- 优化DC-DC转换器的控制和调制方法 121
- 如何优化PCB走线来减小回路电感和环路面积? 100
- 如何利用陶瓷基板优化MEMS传感器的性能? 720
- 官方优化调整石墨物项临时出口管制 12月1日正式施行 490
- 工程师如何使用ADS仿真?如何优化ADS仿真? 45
- 西门子布宣布与台积电携手优化芯片设计过程 39
- Imagination在OnCloud平台上使用AI驱动的Cadence Cerebrus优化PPA结果 75
- nBn结构InAs/GaSb超晶格中/长双波段探测器优化设计描述 96
- 钢铁企业搭建工厂物联平台提升生产效率与优化运营 29