一种针对特定目标的立场检测方法技术

技术编号:33084583 阅读:67 留言:0更新日期:2022-04-15 10:45
本发明专利技术提出一种针对特定目标的立场检测方法,使用深度网络抽取句子的语义特征,并在立场检测时充分考虑目标特征,实现目标特征与句子特征的交互,模型使用稠密连接的BiLSTM网络和嵌套的LSTM网络抽取句子的语义特征,在捕捉句子深层的语义信息的同时,能够解决梯度消失问题和长期依赖问题;使用注意力机制获取特定目标对于句子各部分的重要度,从而得到融入特定目标信息的句子向量表示,帮助模型在进行立场检测时充分考虑给定的特定目标;通过实验验证本发明专利技术已达到较优的特定目标立场检测性能。能。能。

【技术实现步骤摘要】
一种针对特定目标的立场检测方法


[0001]本专利技术属自然语言处理
,具体地,涉及一种针对特定目标的立场检测方法。

技术介绍

[0002]在互联网和终端设备高速发展的大环境下,微博、论坛等社交媒体平台给人们的生活带来很多的便利,人们越来越倾向于使用社交平台来表达自己的观点。在这些线上平台上,人们可以在线实时地表达自己的观点,发表自己对于某个话题的看法。人们通过这种方式主动表达出的观点通常比被动的调查问卷产生的数据更优质、更及时、更有价值。使用立场检测技术可以实现人们对特定话题的立场倾向检测。一方面,这能够帮助人们了解更多的信息,实时获取社会热点资讯,还能起到一定的指导作用;另一方面,立场检测技术能够帮助政府从多个方面了解群众的想法,获得来自人民的真实想法、真实反馈,从而能够更好的指导工作、体察民生。
[0003]针对某个特定目标的立场检测,即输入一段文本和一个特定的目标,目的是检测文本对于该目标的立场倾向。这个特定的目标可以是一个事件、一个人、一件事物、一个话题等。立场倾向包括支持、反对以及中立。针对特定目标的立场检测任务的难点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种针对特定目标的立场检测方法,其特征在于:所述方法具体包括以下步骤:步骤一、获取用于立场检测的训练样本;对训练样本进行预处理,得到用于立场检测的文本;所述用于立场检测的文本包括训练样本对应的特定目标和训练样本针对特定目标所表达的立场倾向标签;所述立场倾向标为别为支持favor、反对against和中性neither;步骤二、将步骤一预处理后的用于立场检测的文本S中的每个词分别映射为一个词向量,则每个文本由若干个词组成,对应一个词向量矩阵S

;步骤三、将训练样本对应的特定目标target中的每个词映射为一个词向量,得到一个词向量矩阵target

,将各个词向量进行加和取平均后,得到特定目标对应的向量表示tar;步骤四、将步骤二中获得的文本词向量矩阵S

输入到一个L层稠密连接的双向LSTM网络DC

BI

LSTM中,得到DC

BI

LSTM对文本的编码结果矩阵h
L
;步骤五、将步骤二中获得的文本词向量矩阵输入到一个K层嵌套的LSTM网络Nested LSTMs中,得到Nested LSTMs对文本的编码结果矩阵h
K
;步骤六、将步骤三中得到的特定目标向量表示tar与步骤四中得到的DC

BI

LSTM对文本的编码结果矩阵h
L
进行注意力运算,得到经过注意力运算加权平均后的tar与DC

BI

LSTM的立场特征表示向量h
D
;步骤七、将步骤三中得到的特定目标向量表示tar与步骤五中得到的Nested LSTMs对文本的编码结果矩阵h
K
进行注意力运算,得到经过注意力运算加权平均后的tar与Nested LSTMs立场特征表示向量h
N
;步骤八、将步骤六得到立场特征表示向量h
D
和步骤七得到立场特征表示向量h
N
进行拼接,得到最终的立场特征表示向量h
*
;步骤九、将步骤八得到的立场特征表示向量矩阵h
*
输入到全连接层和softmax层后得到分类结果;步骤十、将立场分类的交叉熵损失作为损失函数,计算立场分类的损失,进行学习优化,在达到训练轮次或者为结束最后一个批量的训练时,优化完成。2.根据权利要求1所述方法,其特征在于:在步骤二中,将用于立场检测的文本S={w1,w2,...,w
n
}中的每个词分别映射到词向量空间中,得到对应的词向量矩阵S

={e(w1),e(w2),...,e(w
n
)}w
n
为文本中的第n个词,e(w
n
)为w
n
对应的词向量。3.根据权利要求2所述方法,其特征在于:在步骤三中,将训练样本对应的特定目标target={w1,w2,...,w
m
}映射到词向量空间后,得到一个词向量矩阵target

={e1,e2,...,e
m
},取这组词向量的平均值作为特定目标的向量表示tar:w
m
为特定目标中的第m个词,e
m
为w
m
对应的词向量。
4.根据权利要求3所述方法,其特征在于:在步骤四中,将词向量矩阵{e(w1),e(w2),...,e(w
n
)}输入到一个L层稠密连接的双向LSTM网络DC

BI

LSTM中,DC

BI

LSTM由若干个双向LSTM层组成,把当前层之前所有层的输出拼接在一起作为当前层的输入,计算公式如下:作为当前层的输入,计算公式如下:作为当前层的输入,计算公式如下:作为当前层的输入,计算公式如下:作为当前层的输入,计算公式如下:为第l层双向LSTM的隐藏层状态,为第l层正向隐藏层状态,为第l层反向隐藏层状态,为t时刻正向隐藏层状态,为t时刻前l

1层的隐藏层状态拼接结果,为t时刻反向隐藏层状态;对于一个L层的稠密连接的双向LSTM,最后一层的输出是5.根据权利要求4所述方法,其特征在于:在步骤五中,具体计算过程为:将词向量矩阵{e(w1),e(w2),...,e(w
n
)}输入到一个K层嵌套的LSTM网络Nested LSTMs中,用一个可学习的状态函数来代替LSTM中计算记忆细胞C
t
的加法运算:其中m
c
为可学习状态函数,f
t
为遗忘门函数,i
t
为输入门函数,嵌套的LSTM的记忆函数的输入状态e

(w
t
)和隐藏状态h

t
‑1为:e

(w
t
)=i
t
*σ(W

【专利技术属性】
技术研发人员:徐冰朱聪慧曹海龙杨沐昀赵铁军江婷
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1