文本的量子线路确定方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37264141 阅读:10 留言:0更新日期:2023-04-20 23:36
本申请提出一种文本的量子线路确定方法,获取文本语料中各个词汇的词性;根据文本语料的语义获得各个词汇之间的关联性;根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门。从而量子网络技术与文本分类紧密的结合在一起,利用量子线路准确快速地对文本进行分类。文本进行分类。文本进行分类。

【技术实现步骤摘要】
文本的量子线路确定方法、装置、存储介质及电子设备


[0001]本申请涉及自然语音处理领域,具体而言,涉及一种文本的量子线路确定方法、装置、存储介质及电子设备。

技术介绍

[0002]随着网络的发展,网络中的数据文本的数量越大。在大数据快速发展的今天,对于网络中的数据文本进行处理的自然语言处理(NLP,Natural Language Processing)被人们所关注。而在自然语言处理中一个很重的分支是文本分类。
[0003]量子网络作为当下的前沿技术,在各个领域都在崭露头角。如何将文本分类与量子网络进行结合,成为了当下亟待解决的问题。

技术实现思路

[0004]本申请的目的在于提供一种文本的量子线路确定方法、装置、存储介质及电子设备,以至少部分改善上述问题。
[0005]为了实现上述目的,本申请实施例采用的技术方案如下:
[0006]第一方面,本申请实施例提供一种文本的量子线路确定方法,所述方法包括:
[0007]获取文本语料中各个词汇的词性;
[0008]根据文本语料的语义获得各个词汇之间的关联性;
[0009]根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门。
[0010]可选的,根据文本语料的语义获得各个词汇之间的关联性,包括:
[0011]根据文本语料的语义获取表征所述文本语料的显性特征的第一关联性;
[0012]根据文本语料的语义获取表征所述文本语料的隐性特征的第二关联性。
[0013]可选的,所述根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门,包括:
[0014]确定表示每种词性的词汇的子量子比特、以及含参量子逻辑门;
[0015]根据所述第一关联性对所述子量子比特进行处理获得表征文本语料结构的总量子比特作为量子线路的量子比特;
[0016]根据所述第二关联性确定表征所述文本语料的隐性特征的量子逻辑门。
[0017]可选的,所述确定表示每种词性的词汇的子量子比特、以及含参量子逻辑门;包括:
[0018]确定名词词性的词汇表征为一个量子比特和依次作用在该量子比特上的Rx(θ)、Rz(θ)和Rx(θ)门;或,
[0019]确定形容词词性的词汇表征为两个量子比特和作用在所述两个量子比特上的一个IQP层,其中:所述IQP层包括分别作用在每个量子比特上的Hadamard门、以及同时作用在两个量子比特上的CRz(θ)门;或,
[0020]确定及物动词词性的词汇表征为三个依次相邻的量子比特和作用在两组相邻两
个量子比特上的IQP层,其中:所述IQP层包括分别作用在每个量子比特上的Hadamard门、以及同时作用在两个量子比特上的CRz(θ)门。
[0021]可选的,根据所述第一关联性对所述子量子比特进行处理获得表征文本语料结构的总量子比特作为量子线路的量子比特;
[0022]对表征具有所述第一关联性的词汇的所述子量子比特进行部分合并处理获得表征文本语料结构的总量子比特作为量子线路的量子比特。
[0023]可选的,根据所述第二关联性确定表征所述文本语料的隐性特征的量子逻辑门,包括:
[0024]根据所述第二关联性确定表征所述隐性特征的量子逻辑门为H门和CNOT门。
[0025]可选的,根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门之前,所述方法还包括:
[0026]根据所述文本语料中各个词汇的词性和各个词汇之间的关联性用图表示所述文本语料。
[0027]可选的,根据所述文本语料中各个词汇的词性和各个词汇之间的关联性用图表示所述文本语料,包括:
[0028]根据所述文本语料中各个词汇的词性和各个词汇之间的关联性确定所述文本语料的结构初始图,所述结构初始图中不同词性的各个词汇水平放置,各个词汇之间的关联性以U型折线表示;
[0029]对所述结构初始图进行简化处理得到结构简图,所述结构简图中不同词性的各个词汇错落放置,各个词汇之间的关联性以U型折线或直线表示。
[0030]第二方面,本申请实施例提供一种基于量子线路的文本分类方法,所述方法包括:
[0031]根据上述的方法构建待分类文本的量子线路;
[0032]依据文本语料中各个词汇的含义确定所述量子线路内的含参量子线路的运行化参数值,并运行和获取所述量子线路的运行结果;
[0033]依据所述运行结果获取所述文本语料的预测分类结果。
[0034]可选的,所述依据文本语料中各个词汇的含义确定所述含参量子线路的初始化参数值之前,所述方法还包括:
[0035]训练所述量子线路获得所述各个含义词汇对应的用于确定所述运行化参数值的参数值。
[0036]可选的,所述训练所述量子线路获得所述各个含义词汇对应的用于确定所述初始化参数值的参数具体值,包括:依据文本语料中各个词汇的含义确定待训练含参量子线路的初始化参数值,并运行和获取所述待训练量子线路的运行结果;
[0037]依据所述运行结果获取所述文本语料的预测分类结果;
[0038]根据所述预测分类结果修正所述初始化参数值得到更新参数值,然后重新执行运行和获取所述量子线路的运行结果,依据所述运行结果获取所述文本语料的预测分类结果的步骤,直至预测分类结果接近真实结果;
[0039]获得预测分类结果接近真实结果时的更新参数值用于确定所述运行化参数值的参数值。可选的,依据所述运行结果获取所述文本语料的预测分类结果;包括:
[0040]根据所述运行结果获得对应真实标签的代价函数,根据代价函数获取所述文本语
料的预测分类结果,其中:所述代价函数的定义如下:
[0041]C(Θ);=∑L(P)
T
·
log(L
Θ
(P));
[0042]其中,LΘ(P)表征所述运行结果,L(P)表征所述真实标签,C(Θ)表征代价函数。
[0043]可选的,根据所述预测分类结果修正所述初始化参数值得到更新参数值,包括:根据所述预测分类结果基于同步扰动随机逼近算法修正所述初始化参数值得到更新参数值。
[0044]第三方面,本申请实施例提供一种文本的量子线路确定装置,包括:
[0045]第一获取装置,被配置为获取文本语料中各个词汇的词性;
[0046]第二获取装置,被配置为根据文本语料的语义获得各个词汇之间的关联性;
[0047]确定装置,被配置为根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门。
[0048]第四方面,本申请实施例提供一种基于量子线路的文本分类装置,包括:
[0049]量子线路确定装置,被配置为上述的方法构建待分类文本的量子线路;
[0050]预测单元,被配置为依据文本语料中各个词汇的含义确定所述量子线路内的含参量子线路的运行化参数值,并运行和获取所述量子线路的运行结果,依据所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本的量子线路确定方法,其特征在于,所述方法包括:获取文本语料中各个词汇的词性;根据文本语料的语义获得各个词汇之间的关联性;根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门。2.如权利要求1所述的方法,其特征在于,根据文本语料的语义获得各个词汇之间的关联性,包括:根据文本语料的语义获取表征所述文本语料的显性特征的第一关联性;根据文本语料的语义获取表征所述文本语料的隐性特征的第二关联性。3.如权利要求2所述的方法,其特征在于,所述根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门,包括:确定表示每种词性的词汇的子量子比特、以及含参量子逻辑门;根据所述第一关联性对所述子量子比特进行处理获得表征文本语料结构的总量子比特作为量子线路的量子比特;根据所述第二关联性确定表征所述文本语料的隐性特征的量子逻辑门。4.如权利要求3所述的方法,其特征在于,所述确定表示每种词性的词汇的子量子比特、以及含参量子逻辑门;包括:确定名词词性的词汇表征为一个量子比特和依次作用在该量子比特上的Rx(θ)、Rz(θ)和Rx(θ)门;或,确定形容词词性的词汇表征为两个量子比特和作用在所述两个量子比特上的一个IQP层,其中:所述IQP层包括分别作用在每个量子比特上的Hadamard门、以及同时作用在两个量子比特上的CRz(θ)门;或,确定及物动词词性的词汇表征为三个依次相邻的量子比特和作用在两组相邻两个量子比特上的IQP层,其中:所述IQP层包括分别作用在每个量子比特上的Hadamard门、以及同时作用在两个量子比特上的CRz(θ)门。5.如权利要求3所述的方法,其特征在于,根据所述第一关联性对所述子量子比特进行处理获得表征文本语料结构的总量子比特作为量子线路的量子比特;对表征具有所述第一关联性的词汇的所述子量子比特进行部分合并处理获得表征文本语料结构的总量子比特作为量子线路的量子比特。6.如权利要求3所述的方法,其特征在于,根据所述第二关联性确定表征所述文本语料的隐性特征的量子逻辑门,包括:根据所述第二关联性确定表征所述隐性特征的量子逻辑门为H门和CNOT门。7.如权利要求1

6任一项所述的方法,其特征在于,根据所述词性和所述关联性确定量子线路的量子比特以及含参量子逻辑门之前,所述方法还包括:根据所述文本语料中各个词汇的词性和各个词汇之间的关联性用图表示所述文本语料。8.如权利要求7所述的方法,其特征在于,根据所述文本语料中各个词汇的词性和各个词汇之间的关联性用图表示所述文本语料,包括:根据所述文本语料中各个词汇的词性和各个词汇之间的关联性确定所述文本语料的结构初始图,所述结构初始图中不同词性的各个词汇水平放置,各个词汇之间的关联性以U
型折线表示;对所述结构初始图进行简化处理得到结构简图,所述结构简图中不同词性的各个词汇错落放置,各个词汇之间的关联性以U型折线或直线表示。9.一种基于量子线路的文本分类方法,其特征在于,所述方法包括:根据权利要求1

8任一项所述的方法构建待分类文本的量子线路;依...

【专利技术属性】
技术研发人员:窦猛汉孔小飞李蕾方圆
申请(专利权)人:合肥本源量子计算科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1