一种基于量子干涉模型的词义消歧方法、设备及存储介质技术

技术编号:41399550 阅读:19 留言:0更新日期:2024-05-20 19:24
本发明专利技术公开了一种基于量子干涉模型的词义消歧方法,其特征在于,包括:从待消歧文本中获得目标词表征,进而将其构造为量子测量算子;从同一词义的多个词义注释文本中获得对应的词义定义表征,进而将其构造为量子叠加态;基于量子测量算子和量子叠加态,通过量子测量运算计算目标词属于对应词义的概率,并通过量子测量运算导出的干涉项作为平衡因子来对抗词义注释间存在的语义偏差。本发明专利技术受量子双缝干涉实验启发,将多个词义定义表征构造为量子叠加态,将目标词表征构造为量子测量算子,通过量子测量运算计算目标词属于对应词义的概率,并通过测量运算导出的干涉项作为平衡因子来对抗词义注释间存在的语义偏差。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其是涉及一种基于量子干涉模型的词义消歧方法、设备及存储介质


技术介绍

1、词义消歧(word sense disambiguation,wsd)属于自然语言处理领域中的基础性研究课题,是一个标准的分类任务。词义消歧旨在依据给定的上下文信息为目标词确定一个词义清单中最有可能的词义,其中目标词指需要消歧或识别的词汇,词义清单一般指电子词典中列出的目标词的所有词义注释。词义消歧任务的挑战在于(1)难以基于有限的上下文信息获得准确的目标词表征,(2)难以基于有限且固定的词义注释文本学习到准确且易于区分的词义定义表征,以及(3)基于语义不一致的词义注释文本改善词义定义表征的准确性问题。第一个挑战属于基于文本信息的词表征学习问题,第二个挑战属于低资源下的文本表征学习问题,第三个挑战属于表征向量的选择与优化问题。

2、针对改善词义定义表征的准确性问题,前人工作分别采用了引入外部知识的方法、挖掘内在语义的方法和施加语义强约束的方法来改善词义消歧任务中词义定义表征的准确性。(1)引入外部知识的方法常见的有整合多语言词义定义知识、融本文档来自技高网...

【技术保护点】

1.一种基于量子干涉模型的词义消歧方法,其特征在于,包括:

2.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子测量算子的过程包括:

3.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子叠加态的过程包括:

4.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,对于待消歧文本Wtext:

5.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,将获得的目标词表征vtarget构造为测量算子的过程包括:

6.根据权利要求3所述的一种基于量子干涉...

【技术特征摘要】

1.一种基于量子干涉模型的词义消歧方法,其特征在于,包括:

2.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子测量算子的过程包括:

3.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子叠加态的过程包括:

4.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,对于待消歧文本wtext:

5.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,将获得的目标词表征vtarget构造为测量算子的过程包括:

6.根据权利要求3所述的一种基于量子干涉模型的词义消歧方法,其特征在于,对于同一词义的多个词义注释文本

<...

【专利技术属性】
技术研发人员:张俊伟李晓林
申请(专利权)人:中国科学院基础医学与肿瘤研究所筹
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1