【技术实现步骤摘要】
本专利技术涉及自然语言处理,尤其是涉及一种基于量子干涉模型的词义消歧方法、设备及存储介质。
技术介绍
1、词义消歧(word sense disambiguation,wsd)属于自然语言处理领域中的基础性研究课题,是一个标准的分类任务。词义消歧旨在依据给定的上下文信息为目标词确定一个词义清单中最有可能的词义,其中目标词指需要消歧或识别的词汇,词义清单一般指电子词典中列出的目标词的所有词义注释。词义消歧任务的挑战在于(1)难以基于有限的上下文信息获得准确的目标词表征,(2)难以基于有限且固定的词义注释文本学习到准确且易于区分的词义定义表征,以及(3)基于语义不一致的词义注释文本改善词义定义表征的准确性问题。第一个挑战属于基于文本信息的词表征学习问题,第二个挑战属于低资源下的文本表征学习问题,第三个挑战属于表征向量的选择与优化问题。
2、针对改善词义定义表征的准确性问题,前人工作分别采用了引入外部知识的方法、挖掘内在语义的方法和施加语义强约束的方法来改善词义消歧任务中词义定义表征的准确性。(1)引入外部知识的方法常见的有整合多
...【技术保护点】
1.一种基于量子干涉模型的词义消歧方法,其特征在于,包括:
2.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子测量算子的过程包括:
3.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子叠加态的过程包括:
4.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,对于待消歧文本Wtext:
5.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,将获得的目标词表征vtarget构造为测量算子的过程包括:
6.根据权利要求3所
...【技术特征摘要】
1.一种基于量子干涉模型的词义消歧方法,其特征在于,包括:
2.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子测量算子的过程包括:
3.根据权利要求1所述的一种基于量子干涉模型的词义消歧方法,其特征在于,得到量子叠加态的过程包括:
4.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,对于待消歧文本wtext:
5.根据权利要求2所述的一种基于量子干涉模型的词义消歧方法,其特征在于,将获得的目标词表征vtarget构造为测量算子的过程包括:
6.根据权利要求3所述的一种基于量子干涉模型的词义消歧方法,其特征在于,对于同一词义的多个词义注释文本
<...【专利技术属性】
技术研发人员:张俊伟,李晓林,
申请(专利权)人:中国科学院基础医学与肿瘤研究所筹,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。