【技术实现步骤摘要】
:本专利技术涉及一种双通道循环胶囊神经网络的生物医学词义消歧方法,该方法在生物医学领域中有着很好的应用。
技术介绍
0、
技术介绍
:
1、在生物医学文本中,词汇普遍具有一词多义现象。词义消歧的目的是确定歧义词汇在特定上下文环境中的语义类别。词义消歧在信息检索、机器翻译和自动文摘中有着重要的应用。目前,在词义消歧中经常使用的一些方法包括:svm、最大熵和朴素贝叶斯分类器等。但是,传统的方法存在着一些缺点和不足。所提取的消歧特征只局限于局部区域,分类器的训练效果不是很好。近年来,深度学习算法已被广泛地应用到自然语言处理领域。胶囊循环神经网络的优势在于:它可以处理序列数据并捕捉文本数据中的序列相关性,并且它利用胶囊单元来编码模式和特征,提高了网络的可解释性,并能够更好地对输入文本进行消歧,能够有效地建模文本数据,提高词义消歧的准确率。对于生物医学歧义词汇而言,可以很好地应用胶囊循环神经网络进行消歧,实现语义的正确分类。
技术实现思路
0、
技术实现思路
:
1、为了解决生物医学
...【技术保护点】
1.双通道循环胶囊神经网络的生物医学词义消歧,该方法包含以下步骤:
2.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤1中,对生物医学语料中的所有句子进行词性标注和语义类标注,具体为:
3.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤2中,设置词窗大小和歧义词,把词窗从左向右移动,计算词窗移动过程中将出现歧义词的词窗内的其它词汇的词频总值,选取词频总值最高的词汇,并将它们的词性和语义类作为消歧特征,具体为:
4.根据权利要求1所述的双通道循环胶囊神经网络的生物
...【技术特征摘要】
1.双通道循环胶囊神经网络的生物医学词义消歧,该方法包含以下步骤:
2.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤1中,对生物医学语料中的所有句子进行词性标注和语义类标注,具体为:
3.根据权利要求1所述的双通道循环胶囊神经网络的生物医学词义消歧,其特征在于,所述步骤2中,设置词窗大小和歧义词,把词窗从左向右移动,计算词窗移动过程中将出现歧义词的词窗内的其它词汇的词频总值,选取词频总值最高的词汇,并将它们的词性和语义类作为消歧特征,具体为:
4.根据权利要求1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。