【技术实现步骤摘要】
一种基于密度矩阵的语义匹配方法
[0001]本专利技术涉及一种基于密度矩阵的语义匹配方法,属于自然语言处理中的文本匹配
技术介绍
[0002]语义匹配是指在语义上衡量文本相似度,主要分为基于表示的语义匹配和基于交互的语义匹配,是相关性匹配的基础。
[0003]与此同时,量子理论在人类认知和决策中的优越性促进了对量子启发的自然语言处理模型的研究。其中,密度矩阵作为量子态的描述符,在建模阶段被广泛用于表示不同的语义成分。目前,密度矩阵的概率观点,主要用于学习密度矩阵的事后解释性。而密度矩阵的概率特征(如语义的分布)没有在任何先前工作的建模阶段被明确考虑。
[0004]目前,现有的基于量子启发的语义匹配模型具有以表示为中心的结构,对所有句子中的句子对一视同仁,使用统一的随机测量算子进行测量,并不能显式地与文本对内的低级语义元素交互。
技术实现思路
[0005]本专利技术的目的是针对现有的基于量子启发的语义匹配模型方法中,因模型对所有句子对一视同仁,导致句子对之间缺乏交互的技术问题,创新性地 ...
【技术保护点】
【技术特征摘要】
1.一种基于密度矩阵的语义匹配方法,其特征在于,包括以下步骤:步骤1:对数据集包含的句子对中的每个词进行复数词嵌入;其中,数据集包括训练集、验证集和测试集;句子中的每个单词都被视为一个粒子,对应于希尔伯特空间中的一个纯态,引入复数词嵌入,每个单词表示为:其中,|w>表示每个单词归一化后的叠加态,表示每个单词w被嵌入为一个复值向量,表示为的长度;步骤2:进行量子叠加态到混合态的句子建模;步骤3:对全局混合态的语句进行语义抽取,为后续的量子测量过程提供必要的测量算子;步骤4:使用经过步骤3得到的测量算子,进行量子测量过程;基于步骤3提取的主要语义成分,对句子对中局部混合态所在句子所对应的语义进行量子投影测量;步骤5:进行句子对的双向匹配。2.如权利要求1所述的一种基于密度矩阵的语义匹配方法,其特征在于,步骤1包括以下步骤:步骤1.1:复数词嵌入包括实数部分和虚数部分,这两部分由幅值和相位共同决定,提供一种线性形式的非线性语义组合方式;步骤1.2:根据幅值和相位的关系,得到词嵌入的实部和虚部,并构成复数形式,实现单词的复数词嵌入。3.如权利要求2所述的一种基于密度矩阵的语义匹配方法,其特征在于,幅值采用词嵌入模型进行初始化。4.如权利要求2所述的一种基于密度矩阵的语义匹配方法,其特征在于,幅值采用预训练语言模型进行初始化。5.如权利要求2所述的一种基于密度矩阵的语义匹配方法,其特征在于,相位采用随机初始化。6.如权利要求1所述的一种基于密度矩阵的语义匹配方法,其特征在于,步骤2包括以下步骤:步骤2.1:对步骤1得到的复数词嵌入进行归一化处理,得到归一化后的复数词向量和相对应的权重;步骤2.2:将复数词向量与对应的权重相乘,得到每个词对应的混合态。7.如权利要求6所述的一种基于密度矩阵的语义匹配方法,其特征在于,步骤2.2中,一个句子包含有多个词,将其看作是一个希尔伯特空间中的多个粒子;使用混合态表示句子的混合状态,包括全局混合态和局部混合态,如下式所示:其中,ρ表示混合状态的密度矩阵;N表示句子包含的单词数量;a
j
表示句子中单词的相
关权重,关权重,表示为单词w
j
被嵌入为一个复值向量的长度;表示为单词w
i
被嵌入为一个复值向量的长度;的和为1,|Ф
j
>表示叠加态;e表示常数;如果一个句子包含N个单词,这N个单词构成了句子的混合态,称为全局混合态,使用密度矩阵来表示句子的全局混合态;对于长...
【专利技术属性】
技术研发人员:宋大为,张辰辰,李秋池,马放,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。