当前位置: 首页 > 专利查询>苏州大学专利>正文

一种否定焦点的识别方法及系统技术方案

技术编号:34976809 阅读:39 留言:0更新日期:2022-09-21 14:18
本发明专利技术公开了一种否定焦点的识别方法及系统,将待识别文本转换成词序列输入已经训练好的模型中,将词序列生成编码向量和特征向量,再基于给定的否定条件利用编码向量、特征向量及之前生成的所有否定焦点的起始标记和结束标记,计算生成下一个否定焦点的起始标记或结束标记;相比于现有的序列标注模型,对待识别文本中每个词进行标注,本发明专利技术生成标记为每个否定焦点的起始和结束,最终得到的是否定焦点范围,在计算下一个否定焦点时不需要根据词序列中每个词再计算,一定程度上减少了计算量,提高了计算效率,同时也能满足在单一否定条件下的否定焦点识别,计算量减少了,计算效率也提高了。率也提高了。率也提高了。

【技术实现步骤摘要】
一种否定焦点的识别方法及系统


[0001]本专利技术涉及自然语言处理
,特别是涉及一种否定焦点的识别方法及系统。

技术介绍

[0002]否定表达在自然语言文本中很常见,否定信息识别应用在很多任务中也占据了重要地位,比如信息检索、情感分析、机器翻译、信息提取以及自然语言推理等。否定表达通常与句子中某些特殊的部分相互作用,语言学称之为否定焦点。否定识别一般可以分为3个子任务:否定线索词识别、否定焦点识别和否定范围识别。否定焦点为句子中最突出或最显著被否定的部分。
[0003]最先的否定焦点的识别中采用一种监督学习方法来识别否定焦点,后又有考虑副词、被动语态下的名词性主语、否定动词本身作为动词性否定焦点的情况,对动词否定性焦点进行识别获得了正确率为66%和F值为58.4%的结果。后又有人提出“词

主题”模型,该模型为双层结构图模型,获取了4种与上下文信息有关的特征作为句子间的特征,结合句子内语义、句法等特征,利用SVM分类器在*SEM2012语料上进行否定焦点识别获得了67.14%的正确率。/>[0004]之后本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种否定焦点的识别方法,其特征在于,包括:将待识别文本转换成词序列;将所述词序列输入到已训练好的否定焦点识别模型的编码器中,生成编码向量和所述待识别文本的特征向量;将所述编码向量、所述待识别文本的特征向量、所述待识别文本的否定条件、已经识别出的否定焦点的起始标记和结束标记输入到已训练好的否定焦点识别模型的解码器中,生成待识别否定焦点的起始标记;将已经识别出的否定焦点的起始标记和结束标记和待识别否定焦点的起始标记输入到已训练好的否定焦点识别模型的解码器中,生成待识别否定焦点的结束标记,直至待识别否定焦点的结束标记为所述词序列中最后一个词或结束符号,输出所有否定焦点的起始标记和结束标记,得到待识别文本的否定焦点预测标记序列;将所述待识别文本的否定焦点预测标记序列转换成否定焦点范围,根据否定焦点范围生成对应的否定焦点序列,完成对所述待识别文本的否定焦点识别。2.根据权利要求1所述的否定焦点的识别方法,其特征在于,所述待识别文本的特征向量包括:对所述词序列进行词嵌入处理生成第一特征向量;对所述编码向量进行分类处理生成第二特征向量;利用所述第一特征向量和所述第二特征向量加权计算生成所述待识别文本的特征向量:式中,为特征向量,为第一特征向量,为第二特征向量,和为分别控制第一特征向量和第二特征向量在所述待识别文本的特征向量中的占比系数。3.根据权利要求2所述的否定焦点的识别方法,其特征在于,所述对所述编码向量进行分类处理采用MLP多层感知器组成的分类器进行处理。4.根据权利要求1所述的否定焦点的识别方法,其特征在于,所述待识别文本的特征向量包括:对所述词序列进行词嵌入处理生成待识别文本的特征向量。5.根据权利要求1所述的否定焦点的识别方法,其特征在于,所述生成待识别否定焦点的起始标记包括:基于所述待识别文本的否定条件,利用所述编码向量和已经识别出的否定焦点的起始标记和结束标记确定待识别否定焦点识别时解码器的第一隐层状态;将所述第一隐层状态与所述待识别文本的特征向量相乘,得到所述词序列中每个词为待识别否定焦点的起始标记的概率,选择概率最大的词作为待识别否定焦点的起始标记;所述生成待识别否定焦点的结束标记包括:基于所述待识别文本的否定条件,利用所述编码向量、已经识别出的否定焦点的起始标记和结束标记和所述待识别否定焦点的...

【专利技术属性】
技术研发人员:李寿山李雅梦周国栋
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1