本申请公开了一种文本分类方法、装置、介质及电子装置,方法包括:对获取的待分类文本数据集和对比数据集进行特征编码,得到文本编码矩阵和对比编码矩阵;将所述文本编码矩阵和所述对比编码矩阵输入至量子相似度计算电路,并运行所述量子相似度计算电路,得到辅助比特的测量结果;根据所述测量结果确定待分类文本数据集的文本类别。可提高文本分类的速度。可提高文本分类的速度。可提高文本分类的速度。
【技术实现步骤摘要】
一种文本分类方法、装置、介质及电子装置
[0001]本申请属于量子计算
,特别是一种文本分类方法、装置、介质及电子装置。
技术介绍
[0002]量子计算机是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。当某个装置处理和计算的是量子信息,运行的是量子算法时,它就是量子计算机。量子计算机因其具有相对普通计算机更高效的处理数学问题的能力,例如,能将破解RSA密钥的时间从数百年加速到数小时,故成为一种正在研究中的关键技术。
[0003]现有的文本分类网络多采用经典欧氏距离求解等算法计算文本数据的相似度,在处理大批量文本数据时,计算复杂度极高,导致文本分类的速度较慢。
[0004]申请内容
[0005]本申请的目的是提供一种文本分类方法、装置、介质及电子装置,旨在提高文本分类的速度。
[0006]本申请的一个实施例提供了一种文本分类方法,所述方法包括:
[0007]对获取的待分类文本数据集和对比数据集进行特征编码,得到文本编码矩阵和对比编码矩阵;
[0008]将所述文本编码矩阵和所述对比编码矩阵输入至量子相似度计算电路,并运行所述量子相似度计算电路,得到辅助比特的测量结果;
[0009]根据所述测量结果确定待分类文本数据集的文本类别。
[0010]可选的,所述量子相似度计算电路包括按照顺序连接的第一子量子电路、第二子量子电路,所述第一子量子电路用于计算所述文本编码矩阵和对比编码矩阵对应的量子态之间的量子距离;所述第二子量子电路用于将所述量子距离编码到所述辅助比特上。
[0011]可选的,所述第一子量子电路包括作用于第一量子比特和与所述第一量子比特对应的第二量子比特的CNOT门,所述CNOT门的控制比特为所述第一量子比特,受控比特为所述第二量子比特;所述第二子量子电路依次包括:作用于所述辅助比特的H门,作用于所述辅助比特、所述第一量子比特和所述第二量子比特的Toffoli门,作用于所述辅助比特的H门;所述Toffoli门的控制比特为所述第一量子比特和所述第二量子比特,受控比特为所述辅助比特。
[0012]可选的,所述量子相似度计算电路还包括与所述第二子量子电路连接的第三子量子电路,所述第三子量子电路的结构与所述第一子量子电路的结构相同,用于将所述文本编码矩阵和对比编码矩阵对应的量子比特还原至初始量子态。
[0013]可选的,所述根据所述测量结果确定待分类文本数据集的文本类别,包括:
[0014]根据所述测量结果确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签是否相同;
[0015]若相同,则将所述对比数据集的文本类别标签对应的文本类别确定为所述待分类
文本数据集的文本类别。
[0016]可选的,所述根据所述测量结果确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签是否相同,包括:
[0017]若所述测量结果为第一量子态,则确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签相同;
[0018]若所述测量结果为第二量子态,则确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签不相同。
[0019]可选的,所述文本编码矩阵包括n个第一向量,所述对比编码矩阵包括n个第二向量,所述将所述文本编码矩阵和所述对比编码矩阵输入至量子相似度计算电路,包括:
[0020]将所述文本编码矩阵的第i个第一向量和所述对比编码矩阵的第i个第二向量输入至量子相似度计算电路,所述i的初始值为1;
[0021]令i=i+1,并返回执行步骤所述将文本编码矩阵的第i个第一向量和对比编码矩阵的第i个第二向量输入至量子相似度计算电路;
[0022]其中,i≤n。
[0023]可选的,所述将所述文本编码矩阵的第i个第一向量和所述对比编码矩阵的第i个第二向量输入至量子相似度计算电路,包括:
[0024]将所述文本编码矩阵中的第i个第一向量编码为第一量子比特的量子态|ψ
i
>,并将所述对比编码矩阵中的第i个第二向量编码为第二量子比特的量子态其中:
[0025][0026][0027][0028][0029]j=1,2...m,x
ij
表示第i个第一向量中的第j个元素,y
ij
表示第i个第二向量中的第j个元素,|j>表示第j个计算基础状态。
[0030]可选的,所述将所述对比数据集的文本类别标签对应的文本类别确定为所述待分类文本数据集的文本类别之后,所述方法还包括:
[0031]若不同,获取新的对比数据集,以及返回执行步骤所述对获取的待分类文本数据集和对比数据集进行特征编码。
[0032]本申请的又一实施例提供了一种文本分类装置,所述装置包括:
[0033]特征编码模块,用于对获取的待分类文本数据集和对比数据集进行特征编码,得到文本编码矩阵和对比编码矩阵;
[0034]数据处理模块,用于将所述文本编码矩阵和所述对比编码矩阵输入至量子相似度计算电路,并运行所述量子相似度计算电路,得到辅助比特的测量结果;
[0035]分类模块,用于根据所述测量结果确定待分类文本数据集的文本类别。
[0036]本申请的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
[0037]本申请的又一实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项中所述的方法。
[0038]量子态具有量子叠加和量子纠缠的特性,同一个量子态可以同时处于多个状态,本申请使用量子相似度计算电路处理经过特征编码后的数据,能够在指数级别上降低计算的复杂性、加速文本分类的计算速度;并且只需运行一次电路,就能够实现一次相似度计算过程。与现有技术相比,本申请实施例提供的文本分类方法极大地提高了文本分类的速度
附图说明
[0039]图1为本申请实施例提供的一种文本分类方法的计算机终端的硬件结构框图;
[0040]图2为本申请实施例提供的一种文本分类方法的流程示意图;
[0041]图3为本申请实施例提供的一种量子相似度计算电路的示例性示意图;
[0042]图4为本申请实施例提供的另一种量子相似度计算电路的示例性示意图;
[0043]图5为本申请实施例提供的另一种文本分类方法的流程示意图;
[0044]图6为本申请实施例提供的一种文本分类装置的结构示意图。
具体实施方式
[0045]下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
[0046]图1是本申请实施例提供的一种文本分类系统的网络框图。文本分类系统可以包括网络110、服务器120、无线设备130、客户机本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文本分类方法,其特征在于,所述方法包括:对获取的待分类文本数据集和对比数据集进行特征编码,得到文本编码矩阵和对比编码矩阵;将所述文本编码矩阵和所述对比编码矩阵输入至量子相似度计算电路,并运行所述量子相似度计算电路,得到辅助比特的测量结果;根据所述测量结果确定待分类文本数据集的文本类别。2.如权利要求1所述的方法,其特征在于,所述量子相似度计算电路包括按照顺序连接的第一子量子电路、第二子量子电路,所述第一子量子电路用于计算所述文本编码矩阵和对比编码矩阵对应的量子态之间的量子距离;所述第二子量子电路用于将所述量子距离编码到所述辅助比特上。3.如权利要求2所述的方法,其特征在于,所述第一子量子电路包括作用于第一量子比特和与所述第一量子比特对应的第二量子比特的CNOT门,所述CNOT门的控制比特为所述第一量子比特,受控比特为所述第二量子比特;所述第二子量子电路依次包括:作用于所述辅助比特的H门,作用于所述辅助比特、所述第一量子比特和所述第二量子比特的Toffoli门,作用于所述辅助比特的H门;所述Toffoli门的控制比特为所述第一量子比特和所述第二量子比特,受控比特为所述辅助比特。4.如权利要求3所述的方法,其特征在于,所述量子相似度计算电路还包括与所述第二子量子电路连接的第三子量子电路,所述第三子量子电路的结构与所述第一子量子电路的结构相同,用于将所述文本编码矩阵和对比编码矩阵对应的量子比特还原至初始量子态。5.如权利要求1所述的方法,其特征在于,所述根据所述测量结果确定待分类文本数据集的文本类别,包括:根据所述测量结果确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签是否相同;若相同,则将所述对比数据集的文本类别标签对应的文本类别确定为所述待分类文本数据集的文本类别。6.如权利要求5所述的方法,其特征在于,所述根据所述测量结果确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签是否相同,包括:若所述测量结果为第一量子态,则确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签相同;若所述测量结果为第二量子态,则确定所述待分类文本数据集的文本类别标签与所述对比数据集的文本类别标签不相同。7.如权利...
【专利技术属性】
技术研发人员:窦猛汉,请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:本源量子计算科技合肥股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。