The invention discloses a variablestep LMS adaptive filter gene recognition system, including variable step size LMS adaptive filter algorithm to improve the element and the gene structure of multi feature weighted fusion algorithm processing unit; improved variable step size LMS adaptive filter algorithm of the unit for improvement by variable step size LMS adaptive algorithm to filter gene sequence, random noise, less cycle 3 strong gene behavior characteristics; gene structure of the multi feature weighted fusion algorithm for processing unit, through the multi feature weighted fusion strategy for gene sequence feature extraction, feature vector to obtain more expressive power. The invention proposes a variable step size LMS adaptive filter improvement algorithm and a multiple feature weighting fusion algorithm, and integrates the two into the same gene identification system, and further improves the recognition performance.
【技术实现步骤摘要】
基于变步长最小均方误差自适应滤波器的基因识别系统
本专利技术涉及生物信息学中对测序获得的DNA序列进行可编码基因区域的识别和定位领域,具体涉及一种基于变步长最小均方误差(LMS)自适应滤波器的基因识别系统。
技术介绍
现阶段基因识别的研究取得了很多优秀的成果,形成了许多成熟的预测系统,但这些系统主要都依托于一些经典的机器学习标记方法,如HMM和CRF等,一般模型结构复杂,调节参数繁多,训练耗时且不易存储,同时系统特异性过强,不利于物种间的迁移通用。另外,针对短基因序列随机噪声大、特征信息稀少而识别率低等问题,也不能进行有效的抑制和解决。为了克服上述种种问题,国内外研究者们在数字信号处理技术、基因序列长程相关性以及统计特征等方面都做了大量的研究和分析,取得了不错的研究成果。
技术实现思路
本专利技术的目的在于提供一种基于变步长最小均方误差(LMS)自适应滤波器的基因识别系统,提出了变步长LMS自适应滤波器改进算法和多特征加权融合算法,并将二者集成到同一个基因识别系统中,进一步改善其识别性能。为实现上述目的,本专利技术采取的技术方案为:一种基于变步长最小均方误差自适应滤波器的基因识别系统,包括变步长LMS自适应滤波器算法改进单元和基因结构多特征加权融合算法处理单元;所述的变步长LMS自适应滤波器算法改进单元,用于通过变步长LMS自适应改进算法对基因序列进行滤波处理,得到随机噪声较少、周期3行为较强的基因特征;所述的基因结构多特征加权融合算法处理单元,用于通过多特征加权融合策略,对基因序列进行特征提取,从而得到表达能力更强的特征向量。研究表明,外显子编码区域对应的功 ...
【技术保护点】
一种基于变步长最小均方误差自适应滤波器的基因识别系统,其特征在于,包括变步长LMS自适应滤波器算法改进单元和基因结构多特征加权融合算法处理单元;所述的变步长LMS自适应滤波器算法改进单元,用于通过变步长LMS自适应改进算法对基因序列进行滤波处理,得到随机噪声较少、周期3行为较强的基因特征;所述的基因结构多特征加权融合算法处理单元,用于通过多特征加权融合策略,对基因序列进行特征提取,从而得到表达能力更强的特征向量。
【技术特征摘要】
1.一种基于变步长最小均方误差自适应滤波器的基因识别系统,其特征在于,包括变步长LMS自适应滤波器算法改进单元和基因结构多特征加权融合算法处理单元;所述的变步长LMS自适应滤波器算法改进单元,用于通过变步长LMS自适应改进算法对基因序列进行滤波处理,得到随机噪声较少、周期3行为较强的基因特征;所述的基因结构多特征加权融合算法处理单元,用于通过多特征加权融合策略,对基因序列进行特征提取,从而得到表达能力更强的特征向量。2.如权利要求1所述的基于变步长最小均方误差自适应滤波器的基因识别系统,其特征在于,所述变步长LMS自适应滤波器算法改进单元通过以下步骤实现:S1、设计出新的系统输出反馈与步长因子相关联的函数;S2、利用基因序列GC含量的特征信息对系统输出进行加权。3.如权利要求2所述的基于变步长最小均方误差自适应滤波器的基因识别系统,其特征在于,所述新的系统输出反馈与步长因子相关联的函数公式定义如下其中,u0为初始步长,k为常数,且有1≤k<1/u0λmax,λmax为输入信号自相关矩阵最大的特征值。4.如权利要求2所述的基于变步长最小均方误差自适应滤波器的基因识别系统,其特征在于,所述步骤S2中根据基因序列GC含量与AT含量的比值作为权重重新定义系统的输出,即
【专利技术属性】
技术研发人员:郭睿,徐勇,张健,
申请(专利权)人:哈尔滨工业大学深圳研究生院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。