双通道循环胶囊神经网络的生物医学词义消歧制造技术

技术编号:43472176 阅读:19 留言:0更新日期:2024-11-27 13:11
本发明专利技术涉及一种双通道循环胶囊神经网络的生物医学词义消歧方法。首先对生物医学语料进行处理,对包含歧义词汇的生物医学句子进行词性标注和语义类标注处理,得到处理好的训练数据和测试数据。然后,利用训练数据对网络进行优化,得到优化后的双通道循环胶囊神经网络。利用优化后的双通道循环胶囊神经网络对测试数据进行消歧,得到歧义词汇在每个语义类别下的概率分布序列,将具有最大概率的语义类别作为歧义词汇的语义类别。本发明专利技术对歧义词汇实现了很好的消歧,能够更准确地判断歧义词汇的真实含义。

【技术实现步骤摘要】

:本专利技术涉及一种双通道循环胶囊神经网络的生物医学词义消歧方法,该方法在生物医学领域中有着很好的应用。


技术介绍

0、
技术介绍

1、在生物医学文本中,词汇普遍具有一词多义现象。词义消歧的目的是确定歧义词汇在特定上下文环境中的语义类别。词义消歧在信息检索、机器翻译和自动文摘中有着重要的应用。目前,在词义消歧中经常使用的一些方法包括:svm、最大熵和朴素贝叶斯分类器等。但是,传统的方法存在着一些缺点和不足。所提取的消歧特征只局限于局部区域,分类器的训练效果不是很好。近年来,深度学习算法已被广泛地应用到自然语言处理领域。胶囊循环神经网络的优势在于:它可以处理序列数据并捕捉文本数据中的序列相关性,并且它利用胶囊单元来编码模式和特征,提高了网络的可解释性,并能够更好地对输入文本进行消歧,能够有效地建模文本数据,提高词义消歧的准确率。对于生物医学歧义词汇而言,可以很好地应用胶囊循环神经网络进行消歧,实现语义的正确分类。


技术实现思路

0、
技术实现思路

1、为了解决生物医学领域中的词汇歧义问题本文档来自技高网...

【技术保护点】

1.双通道循环胶囊神经网络的生物医学词义消歧,该方法包含以下步骤:

2.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤1中,对生物医学语料中的所有句子进行词性标注和语义类标注,具体为:

3.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤2中,设置词窗大小和歧义词,把词窗从左向右移动,计算词窗移动过程中将出现歧义词的词窗内的其它词汇的词频总值,选取词频总值最高的词汇,并将它们的词性和语义类作为消歧特征,具体为:

4.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征...

【技术特征摘要】

1.双通道循环胶囊神经网络的生物医学词义消歧,该方法包含以下步骤:

2.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤1中,对生物医学语料中的所有句子进行词性标注和语义类标注,具体为:

3.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤2中,设置词窗大小和歧义词,把词窗从左向右移动,计算词窗移动过程中将出现歧义词的词窗内的其它词汇的词频总值,选取词频总值最高的词汇,并将它们的词性和语义类作为消歧特征,具体为:

4.根据权利要求1...

【专利技术属性】
技术研发人员:张春祥向炳齐高雪瑶
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1