当前位置: 首页 > 专利查询>中南大学专利>正文

一种小波变换支持向量机的数据处理方法技术

技术编号:26260091 阅读:42 留言:0更新日期:2020-11-06 17:55
本发明专利技术公开了一种小波变换支持向量机的数据处理方法,该方法包括:建立蛋白质序列数据集的训练样本集;利用氨基酸的物理化学性质将蛋白质氨基酸序列转化为数值序列;利用小波变换进行特征提取;支持向量机训练生成的蛋白质特征数据集;需要预报的蛋白质序列的读入、数据转换及蛋白质结构与功能的在线预测。该方法能实现对未知蛋白质的家族及功能的预测,验证结果表明对G蛋白偶联受体、酶蛋白、蛋白质亚细胞结构、蛋白质二级结构均有好的预测准确率。在线预测时,用户只需在预报网页界面提供要预报的蛋白质序列,对其数据进行转换后利用小波变换对其进行特征提取,完成支持向量机的训练和目标的预报,输出预报结果。

【技术实现步骤摘要】
一种小波变换支持向量机的数据处理方法
本专利技术涉及一种小波变换支持向量机的数据处理方法。属于生物信息学领域。
技术介绍
小波变换作为一种有效的生物信号处理工具已经广泛用于生物信息学和化学计量学中,显示了其在处理信号和生物数据上的优势。在化学领域中,小波变换已用于数据处理和光谱、色谱、核磁共振谱中。1996年Aldroubi和Unser将小波分析技术用于处理大量不同的生物医学信号,此后越来越多的生物工作者将其用于蛋白质的序列分析、蛋白质结构和蛋白质功能预测。离散小波变换常常用来提取时域、频域、时-频两域中的特征信号,提取出来的特征系数可直接用于各种分类器中。然而这些特征系数仍存在大量的噪声部分、不相关的冗余信息,通过特征统计的方法可有效解决这些问题,不仅能减少数据计算量还能有效去除亢余信息提高预测准确率。
技术实现思路
本专利技术的目的是克服现有技术中的不足,提供一种基于小波支持向量机的蛋白质结构与功能分类预测在线预报方法。该方法利用支持向量机分类技术在特征映射方法的突出优点,实现蛋白质家族与功能的分类预测在线预报,提高了预本文档来自技高网...

【技术保护点】
1.一种小波变换支持向量机的数据处理方法,其特征在于该方法包括如下步骤:/n(1)建立蛋白质序列数据集的训练样本:从互联网上蛋白质数据库SWISS-PROT采集构建蛋白质序列数据集的训练样本,该蛋白质序列数据集的训练集的训练样本包括G蛋白偶联受体、酶蛋白、蛋白质亚细胞结构、蛋白质二级结构,并且根据需要可以添加或更新数据集,上述数据集分别包含两类:一类分为正样本,另一类分为负样本;/n(2)蛋白质序列数据集转换:将上述步骤(1)得到的蛋白质序列数据集转换成可用于信号处理的数值序列,即对蛋白质序列数据集中的每个蛋白质序列利用其氨基酸物理化学性质转换成数值序列;/n(3)利用小波变换技术进行特征提取...

【技术特征摘要】
1.一种小波变换支持向量机的数据处理方法,其特征在于该方法包括如下步骤:
(1)建立蛋白质序列数据集的训练样本:从互联网上蛋白质数据库SWISS-PROT采集构建蛋白质序列数据集的训练样本,该蛋白质序列数据集的训练集的训练样本包括G蛋白偶联受体、酶蛋白、蛋白质亚细胞结构、蛋白质二级结构,并且根据需要可以添加或更新数据集,上述数据集分别包含两类:一类分为正样本,另一类分为负样本;
(2)蛋白质序列数据集转换:将上述步骤(1)得到的蛋白质序列数据集转换成可用于信号处理的数值序列,即对蛋白质序列数据集中的每个蛋白质序列利用其氨基酸物理化学性质转换成数值序列;
(3)利用小波变换技术进行特征提取:对上述步骤(2)得到的数值序列进行小波分解得到特征小波系数,并从这些系数中提取特征向量;
(4)用支持向量机学习训练蛋白质序列数据集:用支持向量机(SVM)学习训练的实质是利用支持向量机队上述步骤(3)生成的蛋白质特征数据集进行训练,得到支持向量机的蛋白质家族分类预测模型;
(5)需要预报蛋白质序列的读入、数据转换及其蛋白质家族及功能的预测:利用通过J2EE规范编写的Servlet组件读入Web客户端提交蛋白质序列数据后,Servlet组件先调用验证组件对用户提交数据进行检验,确定是否有效数据,...

【专利技术属性】
技术研发人员:杨雯懿黄建华
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1