【技术实现步骤摘要】
一种用于微博评论的事件相关观点句分类方法
本专利技术涉及一种用于微博评论的事件相关观点句分类方法,属于计算机及信息
技术介绍
传统上,意见句的识别被认为是对主客观句的分类。主观句可以表达多种类型的信息,如意见、评价、情绪等。研究者主要通过机器学习模型构建主客观分类器。如朴素贝叶斯(NB)、支持向量机(SVM)、Logistic回归(LR)、随机森林(RF)等。近年来,深度学习已经成为一种强大的机器学习技术,它可以学习数据的多层表示或特征,也被广泛用于句子分类。本专利技术的任务类似于句子分类,针对特定的目标,如方面级的情感分类。然而,传统的意见句识别方法是基于主客观特征的构造训练分类器。微博评论不规范、自由、短,基于规则的方法或基于人工构建特征的方法都有其局限性。基于神经网络的方法可以避免传统机器学习方法中人工特征构建的复杂性和局限性,但是现有的对评论句子分类方法没有考虑评论句子是否指向相关对象。针对这些问题,本专利技术提出了一种结合内容相关性增强模块和意见表达增强模块的神经网络模型。在本研究中,多数 ...
【技术保护点】
1.一种用于微博评论的事件相关观点句分类方法,其特征在于:所述方法包括如下:/nStep1、获取微博评论嵌入E
【技术特征摘要】
1.一种用于微博评论的事件相关观点句分类方法,其特征在于:所述方法包括如下:
Step1、获取微博评论嵌入Er、微博标题嵌入Et、情感词嵌入Es;
Step2、把微博评论嵌入Er、情感词嵌入Es进行拼接,拼接后得到的结果E通过自注意机制转换到一个新的嵌入E′,然后这个新的嵌入E′通过自注意机制被送入三个不同大小的卷积层,每个卷积结果都经过最大池化,然后把最大池化后的结果进行拼接,得到Rs,它表示句子是否有观点;
Step3、分别对微博评论嵌入Er、微博标题嵌入Et进行卷积运算,分别得到微博评论的特征映射R和微博标题的特征映射T;T经过最大池化得到向量t,用来计算与R的相互注意力,得到相互注意力权重γ;然后通过相互注意力权重γ将R更新为更关注与标题相关的特征向量R′;再对特征向量R′进行最大池化操作,得到Rt,它表示句子是否与微博标题相关;
Step4、将Step2最终得到的结果Rs和Step3最终得到的结果Rt进行拼接作为句子向量Ro,基于这个句子向量Ro进行预测。
2.根据权利要求1所述的用于微博评论的事件相关观点句分类方法,其特征在于:所述Step1中,如果微博评论的单词出现在情感字典中,将随机值赋给微博评论的单词作为它的情感词嵌入Es;否则,它的情感嵌入和评论嵌入是一样的;
所述微博评论嵌入Er和微博标题嵌入Et则这样求出:设表示评论x中第i个单词的d维词向量,则评论嵌入为其中为拼接运算符,n为评论长度;设表示标题z中第i个单词的d维词向量,则微博标题嵌入
3.根据权利要求1所述的用于微博评论的事件相关观点句分类方法,其特征在于:所述Step2中,拼接后得到的结果E通过自注意机制转换到一个新的嵌入E′的具体方式如下:
对嵌入层中的E进行自我注意操作,对于E的第i...
【专利技术属性】
技术研发人员:相艳,施敬磊,余正涛,线岩团,郭军军,黄于欣,
申请(专利权)人:昆明理工大学,
类型:发明
国别省市:云南;53
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。