一种基于量子近邻算法的图像分类方法技术

技术编号:15330514 阅读:208 留言:0更新日期:2017-05-16 13:57
本发明专利技术公开一种基于量子近邻算法的图像分类方法,包括:将一定比例的图像标记分类,图像进行预处理,提取图像用于分类的特征向量;将由测试图像、训练图像得到的特征向量分别制备成量子态;对两个量子态应用swap test算法,计算从测试图像与训练图像提取的特征向量间距离;将得到的距离的量子态应用AE和多数投票算法,输出用于搜索的距离的量子态;对距离的量子态应用最小值搜索算法。在距离的量子态序列中,搜索最小距离,确定测试图像的类别。采用本发明专利技术的技术方案,减少图像分类过程中距离计算和搜索算法所需的操作。

A method of image classification based on quantum nearest neighbor algorithm

The invention discloses a method of image classification algorithm based on nearest neighbor quantum, including: image classification, a certain percentage of the image pre-processing, extraction of image feature vector for classification; by the test images and training images obtained feature vectors were prepared by quantum state; on the two quantum state using swap test the algorithm, calculating the distance from the test image and the training images to extract the feature vector; will be the distance of the quantum state by AE and majority voting algorithm, output for quantum state distance search; application of quantum state distance minimum search algorithm. In the quantum sequence of distances, the minimum distance is searched to determine the category of the test image. By adopting the technical scheme of the invention, the operation needed for the distance calculation and search algorithm in the image classification process is reduced.

【技术实现步骤摘要】
一种基于量子近邻算法的图像分类方法
本专利技术涉及量子图像处理领域,尤其涉及一种基于量子近邻算法的图像分类方法。
技术介绍
量子计算机靠量子比特来存储信息。与经典比特不同,量子比特有两个显著特点:一是叠加,二是纠缠。叠加指得是一个量子比特可以同时存储0和1。量子计算机中的0和1与经典计算机中的0和1也有不同,量子计算机中叫做状态|0>和状态|1>。叠加态中既有|0>,又有|1>,表示为α|0>+β|1>,其中α2+β2=1,且|0>和|1>所占的比重分别为α2和β2。多个量子比特也可以叠加,比如两个量子比特,可以同时存储|00>,|01>,|10>,|11>四个状态,表示为α|00>+β|01>+γ|10>+λ11>,其中α2+β2+γ2+λ2=1,且|00>,|01>,|10>,|11>所占比重分别为α2,β2,γ2,λ2。纠缠指得是两个量子比特存储的状态之间互相影响的现象。比如两个量子比特所处的状态为那么如果第一个量子比特处在|0>状态,则第二个量子比特也一定处在|0>状态;如果第一个量子比特处在|1>状态,则第二个量子比特也一定处在|1>状态。此时,两个量子比特纠缠在一起,要么都处在|0>状态,要么都处在|1>状态。多个量子比特也可以纠缠。叠加和纠缠带来的好处是量子计算机的高度并行性。在经典计算机上需要一个一个来处理的问题,在量子计算机上由于叠加存储在一起,只处理一次就可以解决。即使再优秀的算法也无法实现量子计算带来的效率提高。近年来,已经有诸多成熟的利用量子特性来解决具体问题的算法,如解决大数因子分解的Shor量子算法以及解决无序列表中搜索问题的Grover搜索算法。这些算法不仅证明了量子计算的高效,而且为解决更复杂的问题奠定了基础。将这些量子方法积极应用到实际任务中,提高实际任务的效率是量子计算研究的重要工作内容之一。机器学习就是要使计算机能模拟人的学习行为,自动地通过学习获取知识和技能,不断地完善性能,实现自我完善,机器学习研究的就是如何使机器通过识别和利用现有知识来获取新知识和新技能。作为人工智能的一个重要研究领域,机器学习的研究工作主要围绕学习机理、学习方法和面向任务这三个基本方面开展。经过半个世纪的发展,机器学习的算法层出不穷,从基础的近邻算法到更加复杂的K近邻算法,从上世纪的神经网络到这几年发展迅速的深度学习,还有支持向量机、朴素贝叶斯分类器等算法。研究学者在改进与发展并进的道路上不断耕耘,取得了丰硕的成果,在图像分类识别、机器翻译、语音识别等诸多领域有着广泛的需求和应用。尽管算法的精度已经相当高,但效率的提升却是困难的,就基于训练的算法而言,动辄上TB的数据,完成这样的训练所需要的计算时间可想而知。即便那些不需要训练的算法的计算量也是惊人的。借用量子计算这样高效的计算模型必然是机器学习提高效率、进一步发展的必经之路。特别是近几年机器学习算法与量子计算集合的成果不断出现和完善,先后出现了主流的机器学习算法的量子版本,如基于量子的支持向量机、基于量子的决策树、量子近邻算法、基于量子的神经网络等等。以过程简洁的量子近邻算法为例,总结近邻算法的步骤如下:1)分别提取测试数据的特征向量u和M个训练数据的特征向量v。2)计算特征向量u和M个v的距离d。特征向量间的距离是有效描述两个数据相似的指标,常用的有内积距离、欧式距离等。3)搜索所有距离d的最小值,划分类别,完成分类。可知所有的距离d组成的序列{d1,d2,…,dM}是无序的。其中步骤2和步骤3使用经典的计算是复杂的低效的,可以使用量子算法进行改进。步骤2中距离的计算,以内积距离的计算为例,在经典计算中是无法优化的,其复杂度直接依赖于特征向量中元素的个数。而Buhrman等人在使用量子计算解决指纹匹配问题时提出的swaptest算法被证明可以有效的提高计算内积距离的效率。同样地,步骤3中的序列是无序的,即使使用优秀的经典计算方法,复杂度也只能达到O(M)。而Dürr和提出了一种基于Grover改进的量子搜索最小值算法,将搜索最小距离的复杂度降至显然经过这两个主要步骤的优化,算法整体的性能明显提升。微软研究院对这些工作做了总结和完善,提出了一种较完整的算法,即量子近邻算法(QNN),并结合判别手写字奇偶问题描述了算法的全貌。总体思路总结如下:将测试图像和训练图像表示成一维向量,向量中的值是图像的元素。将经典信息的向量使用H门、T门以及CNOT门制备成量子初态,使用swaptest方法计算内积距离,进而将振幅估计(AmplitudeEstimation,AE)的结果代入多数投票(MajortyVoting)算法,以更高的效率和更小的误差获取距离的量子表达式,最后应用Dürr的MinimumFindingAlgorithm搜索最小距离,将测试图像划分到搜索结果下标对应的分类中,到此任务完成。实验数据表明,当误差精度∈=10-5,训练样本占比高于0.2时,精度普遍能达到95%。可见量子近邻算法具有性能好,精度高的优点。图像分类伴随机器学习发展的一个经典而重要的任务。图像分类是指根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一个,以代替人的视觉判断。应用经典计算的机器学习方法的图像分类方案已经比较完善,百度图片搜索就是一个极具代表性的应用。这些方案同他们使用的机器学习算法一样受限于经典计算,相比量子计算而言,性能还有待提升。从另一方面看,量子版本的机器学习算法虽然已经提出,但面向具体任务的应用方案还有所欠缺。因此我们提出一种完善的基于量子近邻算法的图像分类算法使用量子计算版本的近邻算法应用于图像分类任务,进一步提高图像分类的性能。
技术实现思路
本专利技术的目的在于提供一种高效的图像分类方法,借助量子的近邻算法,减少图像分类过程中距离计算和搜索算法所需的操作。本专利技术的创新点在于应用量子的方法到图像处理领域,具体的应用量子近邻算法解决图像分类问题。为了实现上述目的,本专利技术采用如下的技术方案,在算法开始前,将图像集合中的部分图像人工标记分类,作为训练图像,与一个待测试图像组成一次图像分类任务的图像集合。一种基于量子近邻算法的图像分类方法,包括:步骤S1、将一定比例的图像标记分类,图像进行预处理,提取图像用于分类的特征向量。步骤S2、将由测试图像、训练图像得到的特征向量分别制备成量子态。步骤S3、对两个量子态应用swaptest算法,计算从测试图像与训练图像提取的特征向量间距离。步骤S4、将得到的距离的量子态应用AE和多数投票算法,输出用于搜索的距离的量子态。步骤S5、对距离的量子态应用最小值搜索算法。在距离的量子态序列中,搜索最小距离,确定测试图像的类别。作为优选,步骤S1具体包括以下步骤:步骤S1.1、提取图像集合中图像的颜色特征向量。将图像由RGB空间转为HSV空间,进行非均匀量化后构造一维特征矢量,得到图像的颜色特征向量。步骤S1.2、将集合中图像由RGB彩色图像转化为灰度图本文档来自技高网
...
一种基于量子近邻算法的图像分类方法

【技术保护点】
一种基于量子近邻算法的图像分类方法,其特征在于,包括:步骤S1、将一定比例的图像标记分类,图像进行预处理,提取图像用于分类的特征向量;步骤S2、将由测试图像、训练图像得到的特征向量分别制备成量子态;步骤S3、对两个量子态应用swap test算法,计算从测试图像与训练图像提取的特征向量间距离;步骤S4、将得到的距离的量子态应用AE和多数投票算法,输出用于搜索的距离的量子态;步骤S5、对距离的量子态应用最小值搜索算法。在距离的量子态序列中,搜索最小距离,确定测试图像的类别。

【技术特征摘要】
1.一种基于量子近邻算法的图像分类方法,其特征在于,包括:步骤S1、将一定比例的图像标记分类,图像进行预处理,提取图像用于分类的特征向量;步骤S2、将由测试图像、训练图像得到的特征向量分别制备成量子态;步骤S3、对两个量子态应用swaptest算法,计算从测试图像与训练图像提取的特征向量间距离;步骤S4、将得到的距离的量子态应用AE和多数投票算法,输出用于搜索的距离的量子态;步骤S5、对距离的量子态应用最小值搜索算法。在距离的量子态序列中,搜索最小距离,确定测试图像的类别。2.如权利要求1所述的基于量子近邻算法的图像分类方法,其特征在于,步骤S1具体包括以下步骤:步骤S1.1、提取图像集合中图像的颜色特征向量。将图像由RGB空间转为HSV空间,进行非均匀量化后构造一维特征矢量,得到图像的颜色特征向量;步骤S1.2、将集合中图像由RGB彩色图像转化为灰度图像,计算四个方向的灰度共生矩阵,计算每个方向的参数值,并求出平均值和标准差,得到图像的纹理特征向量;步骤S1.3、对两类特征向量进行归一化后,将同一图像的两类特征向量按一定比例相加,比例和为1,相加后仍满足归一化。3.如权利要求1所述的基于量子近邻算法的图像分类方法,其特征在于,步骤S2具体包括以下步骤:步骤S2.1、采用H门、T门、CNOT门和R门制备初始叠加状态。步骤S2.2、依次对初始状态应用OracleF、...

【专利技术属性】
技术研发人员:姜楠党义杰赵娜虎皓
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1