情感类别的预测方法和装置、存储介质及电子设备制造方法及图纸

技术编号:30834106 阅读:41 留言:0更新日期:2021-11-18 12:55
本申请公开了一种情感类别的预测方法和装置、存储介质及电子设备,可应用于车载场景。该方法包括:获取一组第一特征向量和一组第二特征向量,一组第一特征向量包括对一组第一元素单元中的每个第一元素单元进行编码所得到的特征向量,一组第一元素单元包括目标文本中的每个第一元素单元,一组第二特征向量包括对一组第二元素单元中的每个第二元素单元进行编码所得到的特征向量,一组第二元素单元包括对目标文本进行分词得到的第二元素单元;根据一组第二元素单元与一组第一元素单元之间的包含关系,对一组第一特征向量与一组第二特征向量进行特征向量融合,得到一组融合特征向量;将一组融合特征向量输入到目标预测模型中,得到预测的情感类别。得到预测的情感类别。得到预测的情感类别。

【技术实现步骤摘要】
情感类别的预测方法和装置、存储介质及电子设备


[0001]本申请涉及计算机领域,具体而言,涉及一种情感类别的预测方法和装置、存储介质及电子设备。

技术介绍

[0002]自媒体平台可以以信息流的方式展示用户所生产的媒体信息(例如,文章、视频等),是个体提供信息生产、积累、共享、传播、内容兼具私密性和公开性的信息传播方式。用户在消费媒体信息的同时,可以通过评论、点赞、转发、收藏等行为与这些媒体信息进行互动。
[0003]由于用户发表内容的门槛较低,在满足要求的情况下,任何用户在任何时间都可以发表媒体信息,这样会导致用户所生产的媒体信息的质量参差不齐,存在生产低质内容(即,低质量的媒体信息)和严重影响平台生态的行为。可以通过能够预测情感类型的预测模型对于媒体信息对应的文本进行情感类别预测,基于预测的情感类别确定其是否为低质内容。
[0004]目前,采用的情感类别预测模型通常是基于细粒度的,例如,基于字粒度的。然而,采用基于细粒度的情感类别的预测方法,由于忽略了字与字之间的关联性,词义的不确定性高,建模复杂度高,无法抽取语义特性,因此,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种情感类别的预测方法,其特征在于,包括:获取一组第一特征向量和一组第二特征向量,其中,所述一组第一特征向量包括对一组第一元素单元中的每个第一元素单元进行编码所得到的特征向量,所述一组第一元素单元包括目标文本中的每个第一元素单元,所述一组第二特征向量包括对一组第二元素单元中的每个第二元素单元进行编码所得到的特征向量,所述一组第二元素单元包括对所述目标文本进行分词所得到的第二元素单元;根据所述一组第一元素单元与所述一组第二元素单元之间的包含关系,对所述一组第一特征向量与所述一组第二特征向量进行特征向量融合,得到一组融合特征向量;将所述一组融合特征向量输入到目标预测模型中,得到目标预测结果,其中,所述目标预测模型用于根据输入的特征向量预测与所述输入的特征向量关联的情感类别,所述目标预测结果用于表示所述目标文本的预测情感类别。2.根据权利要求1所述的方法,其特征在于,所述根据所述一组第二元素单元与所述一组第一元素单元之间的包含关系,对所述一组第一特征向量与所述一组第二特征向量进行特征向量融合,得到一组融合特征向量,包括:在所述一组第一元素单元中确定所述一组第二元素单元中的每个第二元素单元所包括的第一元素单元;将所述每个第二元素单元对应的第二特征向量分别与所述每个第二元素单元所包括的第一元素单元对应的第一特征向量进行特征向量融合,得到对应的融合特征向量。3.根据权利要求2所述的方法,其特征在于,所述在所述一组第一元素单元中确定所述一组第二元素单元中的每个第二元素单元所包括的第一元素单元,包括:在所述一组第一元素单元中确定所述一组第二元素单元中的第i个第二元素单元所包括的N个第一元素单元,其中,N为自然数,i为自然数;所述将所述每个第二元素单元对应的第二特征向量分别与所述每个第二元素单元所包括的第一元素单元对应的第一特征向量进行特征向量融合,得到对应的融合特征向量,包括:将所述第i个第二元素单元对应的第i个第二特征向量分别与所述N个第一元素单元中的每个第一元素单元对应的第一特征向量进行特征向量融合,得到N个融合特征向量。4.根据权利要求3所述的方法,其特征在于,所述将所述第i个第二元素单元对应的第i个第二特征向量分别与所述N个第一元素单元中的每个第一元素单元对应的第一特征向量进行特征向量融合,得到N个融合特征向量,包括:将所述第i个第二元素单元对应的第i个第二特征向量分别与所述N个第一元素单元中的每个第一元素单元对应的第一特征向量进行相加,得到所述N个融合特征向量;或者,将所述第i个第二元素单元对应的第i个第二特征向量分别与所述N个第一元素单元中的每个第一元素单元对应的第一特征向量进行拼接,得到所述N个融合特征向量。5.根据权利要求2所述的方法,其特征在于,所述在所述一组第一元素单元中确定所述一组第二元素单元中的每个第二元素单元所包括的第一元素单元,包括:在所述一组第一元素单元中确定所述一组第二元素单元中的第i个第二元素单元所包括的N个第一元素单元,其中,N为自然数,i为自然数;所述将所述每个第二元素单元对应的第二特征向量分别与所述每个第二元素单元所包括的第一元素单元对应的第一特征向量进行特征向量融合,得到对应的融合特征向量,
包括:将所述第i个第二元素单元对应的第i个第二特征向量分别与所述N个第一元素单元中的M个第一元素单元对应的第一特征向量进行特征向量融合,得到M个融合特征向量,其中,M小于N。6.根据权利要求1至5中任一项所述的方法,其特征在于,在将所述一组融合特征向量输入到目标预测模型中,得到目标预测结果之后,所述方法还包括:在所述预测情感类别为负向情感类别的情况下,删除已发布的目标媒体信息,其中,所述目标文本是从所述目标媒体信息中获取到的文本;或者,在所述预测情感类别为负向情感类别的情况下,调整已发布的目标媒体信息的展示位置,以使得所述目标媒体信息的曝光量减少,其中,所述目标文本是从所述目标媒体信息中获取到的文本。7.根据权利要求1至5中任一项所述的方法,其特征在于,在所述获取一组第一特征向量和一组第二特征向量之前,所述方法还包括:获取第一训练样本集,其中,所述第一训练样本集包括从第一媒体信息中获取到的第一媒体文本,所述第一媒体信息是目标媒体信息所属的目标媒体平台中已发布的媒体信息,所述目标文本是从所述目标媒体信息中获取到的媒体文本;使用所述第一训练样本集和所述第一训练样本集的标注信息对初始预测模型进行训练,得到所述目标预测模型,其中,所述第一训练样本集的标注信息用于表示所述第一训练样本集中的训练样本的情感类别。8.根据权利要求7所述的方法,其特征在于,在...

【专利技术属性】
技术研发人员:刘刚
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1