一种基于量子卷积神经网络的蛋白质结构分类系统技术方案

技术编号：36575227 阅读：9 留言：0更新日期：2023-02-04 17:33

本发明专利技术公开了一种基于量子卷积神经网络的蛋白质结构分类系统，其中所述系统包括：蛋白质序列氨基酸特征数据的编码模块，其用于从蛋白质结构分类数据集中提读取蛋白质序列信息以及对应的结构信息；量子卷积和池化模块，其用于通过参数化的量子门实现对所述蛋白质结果的分类；构建损失函数模块，其用于获得用于表征所述系统性能的损失函数；更新量子线路参数模块，其用于更新量子线路参数。与现有技术相比，本发明专利技术实现了一种高效的量子计算机卷积神经网络系统，能够高效的分类蛋白质结构，系统所使用的模型可以大大加速蛋白质结构的预测，加快药物的开发。加快药物的开发。加快药物的开发。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于量子卷积神经网络的蛋白质结构分类系统

[0001]本专利技术属于量子计算机
，尤其涉及一种基于量子卷积神经网络的蛋白质结构分类系统。

技术介绍

[0002]蛋白质是生命活动的主要承担者，其功能与结构密切相关。对蛋白质结构进行有效地分类可以极大提高蛋白质结构预测的准确性。目前，已有的经典机器学习算法（神经网络、支持向量机、随机森林等）在蛋白质结构分类方向已经做了很多工作。这些工作首先会基于一个蛋白质数据集进行数据的前处理，涉及的蛋白质数据一般有序列信息、二级结构信息、突变信息等。传统计算机可以通过独热编码等方式，将蛋白质数据信息编码储存到经典比特上。随后将数据集分成训练数据集和测试数据集。在训练数据集上，通过机器学习算法提取特征，训练得到预测模型，之后再测试数据集上测试模型的准确性。
[0003]现有的技术使用经典计算机上的机器学习模型对蛋白质结构进行分类。经典计算机使用经典比特进行计算，与量子计算机使用的量子比特有比较大的区别。经典计算机中蛋白质的编码方式并不能很好的反应蛋白质的内在信息。蛋白质中的氨基酸序列具有时序性质，如果使用量子计算机编码到量子比特上，可以很好的通过量子比特的纠缠性质体现氨基酸序列的时序性质。此外，蛋白质数据库数量大、种类繁多，经典计算机储存数据、计算数据等能力有限，无法处理过于庞大的数据集。

技术实现思路

[0004]针对上述现有技术中存在的缺陷，本专利技术提供一种基于量子卷积神经网络的蛋白质结构分类系统，其包括：蛋白质序列氨基酸特征数据的编码模块，量子卷...

【技术保护点】

【技术特征摘要】
1.一种基于量子卷积神经网络的蛋白质结构分类系统，其包括：蛋白质序列氨基酸特征数据的编码模块，量子卷积和池化模块，构建损失函数模块和更新量子线路参数模块，其特征在于，所述蛋白质序列氨基酸特征数据的编码模块，其用于从蛋白质结构分类数据集中提读取蛋白质序列信息以及对应的结构信息；量子卷积和池化模块，其用于通过参数化的量子门实现对所述蛋白质结果的分类；构建损失函数模块，其用于获得用于表征所述系统性能的损失函数；更新量子线路参数模块，其用于更新量子线路参数。2.如权利要求1所述基于量子卷积神经网络的蛋白质结构分类系统，其特征是，其中将所述蛋白质结构分类数据集按照99：1的比例分成训练数据集和测试数据集。3.如权利要求1所述基于量子卷积神经网络的蛋白质结构分类系统，其特征是，其中所述量子卷积和池化模块包括：量子卷积层基本单元，其用于对加载了蛋白质序列特征信息的量子态进行演化；量子池化层基本单元，其用于将两个量子比特的信息映射到一个量子比特上。4.如权利要求3所述基于量子卷积神经网络的蛋白质结构分类系统，其特征是，其中所述量子卷积和池化模块还用于通过交替作用量子卷积层和量子池化层，直到只剩一个量子比特为止，随后测量最后一个量子比特的泡利Z期望值，将其作为蛋白质结构分类的最终预测值。5.如权利要求1所述基于量子卷积神经网络的蛋白质结构分类系统，其特征是，其中所...

【专利技术属性】
技术研发人员：胡咏梅，刘海建，耿咏忠，李宁，杨昱升，赵立祥，崔国龙，
申请(专利权)人：国药控股上海生物医药有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人