【技术实现步骤摘要】
文章的情感极性分析方法、装置、电子设备及存储介质
本专利技术属于数据处理
,尤其涉及文章的情感极性分析方法、装置、电子设备及存储介质。
技术介绍
目前各类信息平台越来越多,人们可以从信息平台获取大量的信息。例如,信息平台会向用户设备推送各类文章。但是,信息平台保存的文章的质量可能是良莠不齐的,例如,某些文章会导致用户出现恶心反感的感受,这会严重影响用户的阅读体验。因此,预先对文章进行分析,确定该文章是否为恶心反感类的文章,就显得至关重要。目前,针对文章的分析主要采用以下方案:预先指定与恶心反感相关的关键词(如:血腥、蟒蛇、尸体),根据预先指定的关键词对文章内容进行匹配处理,如果文章包括预定数量的关键词,就确定该文章是恶心反感类的文章。但是,目前针对文章的处理方式存在较大的弊端:需要人为指定关键词,这导致人力成本较大,而且误判率较高。尤其是针对包含图片的文章,误判率会进一步提高。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种文章的情感极性分析方法、装置、电子设备及存储介质,以便 ...
【技术保护点】
1.一种文章的情感极性分析方法,其特征在于,包括:/n获得目标文章,所述目标文章包含文本和图片;/n对所述目标文章进行处理,得到所述目标文章包含的多个分词;/n分别确定所述目标文章中各个分词的特征向量,分别确定所述目标文章中各个图片的特征向量;/n按照分词和图片在所述目标文章的先后顺序,对所述分词和图片的特征向量进行拼接,得到所述目标文章的多模态特征;/n利用预先完成训练的强化学习特征筛选器对所述多模态特征进行特征筛选,输出所述目标文章的综合特征向量;其中,所述强化学习特征筛选器依次对所述多模态特征中的每一条特征向量进行动作决策,所述动作决策至少包括删除和保留;/n利用预先 ...
【技术特征摘要】
1.一种文章的情感极性分析方法,其特征在于,包括:
获得目标文章,所述目标文章包含文本和图片;
对所述目标文章进行处理,得到所述目标文章包含的多个分词;
分别确定所述目标文章中各个分词的特征向量,分别确定所述目标文章中各个图片的特征向量;
按照分词和图片在所述目标文章的先后顺序,对所述分词和图片的特征向量进行拼接,得到所述目标文章的多模态特征;
利用预先完成训练的强化学习特征筛选器对所述多模态特征进行特征筛选,输出所述目标文章的综合特征向量;其中,所述强化学习特征筛选器依次对所述多模态特征中的每一条特征向量进行动作决策,所述动作决策至少包括删除和保留;
利用预先完成训练的分类器对所述目标文章的综合特征向量进行情感极性预测,得到所述目标文章的情感极性分类结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文章进行处理,得到所述目标文章包含的多个分词,包括:
对所述目标文章进行预处理;
对经过预处理的目标文章进行分词处理,得到多个分词。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标文章进行处理,得到所述目标文章包含的多个分词,包括:
对所述目标文章进行预处理;
对经过预处理的目标文章进行分词处理,得到多个初始分词;
分别确定所述多个初始分词是否属于预先建立的分词词典;
将所述多个初始分词中属于所述分词词典的初始分词作为所述目标文章的分词。
4.根据权利要求2或3所述的方法,其特征在于,所述预处理包括去除特殊符号、英文大小写转换和繁简字体转换中的一项或多项。
5.根据权利要求1所述的方法,其特征在于,所述强化学习特征筛选器和所述分类器的训练过程,包括:
获得训练样本,所述训练样本包括训练文本和训练图片,并且所述训练样本的标注信息为恶心反感;
对所述训练样本进行处理,得到所述训练样本包含的多个训练分词;
分别确定所述训练样本中各个训练分词的特征向量;
分别确定所述训练样本中各个训练图片的特征向量;
按照训练分词和训练图片在所述训练样本的先后顺序,对所述训练分词和训练图片的特征向量进行拼接,得到所述训练样本的多模态特征;
利用待训练的强化学习特征筛选器对所述训练样本的多模态特征进行基于强化学习的特征筛选,输出所述训练样本的综合特征向量;其中,所述强化学习特征筛选器对所述训练样本的多模态特征中的每一条特征向量进行动作决策,所述动作决策至少包括删除和保留;
利用待训练的分类器对所述训练样本的综合特征向量进行极性预测,得到所述训练样本的情感极性分类结果;
根据所述训练样本的情感极性分类结果计算损失函数值;
以最小化损失函数值为训...
【专利技术属性】
技术研发人员:申珺怡,杨伟风,钟滨,徐进,王志平,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。