评论区域和情感极性的联合识别方法、装置、电子设备制造方法及图纸

技术编号:23672217 阅读:51 留言:0更新日期:2020-04-04 17:43
本申请实施例公开一种评论区域和情感极性的联合识别方法、装置、电子设备,该联合识别方法包括:确定目标文本针对的评论对象的名称和所述目标文本匹配的评论维度信息,评论维度信息包括:评论维度的名称和与评论维度关联的关键词;根据目标文本、评论对象的名称、评论维度的名称和关键词构造输入数据,并将输入数据输入至评论区域及情感极性联合识别模型;通过联合识别模型,根据目标文本携带的字符之间的上下文信息和评论对象的名称、评论维度的名称和关键词携带的区域信息,预估目标文本中的评论区域和情感极性。利用本申请实施例公开的评论区域和情感极性的联合识别方法,能实现同时识别出目标文本中的评论区域和目标文本的情感极性。

Joint recognition method, device and electronic equipment of comment area and emotional polarity

【技术实现步骤摘要】
评论区域和情感极性的联合识别方法、装置、电子设备
本申请实施例涉及计算机
,特别是涉及一种评论区域和情感极性的联合识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
用户原创数据(如用户评论)中通常包括用户对商家或商品的不同观点。例如,互联网购物应用场景中,用户对网络订单的评论通常包括用户对购买过的商家或商品的不同观点。充分利用用户原创数据,在用户原创数据中进行实体和观点信息挖掘,对于商家改进产品质量、提升服务质量,以及进行商家和商品的推荐等具有重要意义。现有技术中,进行实体和观点挖掘的方法通常是对整条评论数据进行识别,识别其中的实体和/或观点,而且需要预先标识训练样本中的观点关键词。现有技术中的实体和观点挖掘方法对于不带有情感色彩的用户原创数据挖掘准确率较低,并且,没有基于评论数据全文进行挖掘的方式也会导致挖掘准确率降低。
技术实现思路
本申请实施例公开一种评论区域和情感极性的联合识别方法,能够提升从用户原创数据中挖掘指定信息的效率。为了解决上述问题,第一方面,本申请实施例公开一种评论区域和情感极性的联本文档来自技高网...

【技术保护点】
1.一种评论区域和情感极性的联合识别方法,其特征在于,包括:/n确定目标文本针对的评论对象的名称和所述目标文本匹配的评论维度信息,所述评论维度信息包括:评论维度的名称和与所述评论维度关联的关键词;/n根据所述目标文本、所述评论对象的名称、所述评论维度的名称和所述关键词构造输入数据,并将所述输入数据输入至评论区域及情感极性联合识别模型;/n通过所述评论区域及情感极性联合识别模型来根据所述目标文本携带的字符之间的上下文信息和所述评论对象的名称、所述评论维度的名称和所述关键词携带的区域信息,预估所述目标文本中的评论区域和所述目标文本匹配的情感极性。/n

【技术特征摘要】
1.一种评论区域和情感极性的联合识别方法,其特征在于,包括:
确定目标文本针对的评论对象的名称和所述目标文本匹配的评论维度信息,所述评论维度信息包括:评论维度的名称和与所述评论维度关联的关键词;
根据所述目标文本、所述评论对象的名称、所述评论维度的名称和所述关键词构造输入数据,并将所述输入数据输入至评论区域及情感极性联合识别模型;
通过所述评论区域及情感极性联合识别模型来根据所述目标文本携带的字符之间的上下文信息和所述评论对象的名称、所述评论维度的名称和所述关键词携带的区域信息,预估所述目标文本中的评论区域和所述目标文本匹配的情感极性。


2.根据权利要求1所述的方法,其特征在于,所述评论区域及情感极性联合识别模型是基于BERT模型搭建的,所述评论区域及情感极性联合识别模型包括:评论区域识别任务和情感极性识别任务,所述通过所述评论区域及情感极性联合识别模型来根据所述目标文本携带的字符之间的上下文信息和所述评论对象的名称、所述评论维度的名称和所述关键词携带的区域信息,预估所述目标文本中的评论区域和所述目标文本匹配的情感极性的步骤,包括:
通过所述BERT模型,根据所述目标文本携带的字符之间的上下文信息和所述评论对象的名称、所述评论维度的名称和所述关键词携带的区域信息进行特征提取,得到与所述目标文本中各字符对应的隐向量;
通过所述评论区域识别任务对各字符对应的隐向量进行特征映射和变换处理,预估所述目标文本中各字符的位置属性标识;以及,通过所述情感极性识别任务对各字符对应的隐向量进行线性变换处理,预估所述目标文本的情感极性标识;
根据所述目标文本中各字符的位置属性标识,确定所述目标文本中的评论区域;以及,根据所述情感极性标识,确定所述目标文本匹配的情感极性。


3.根据权利要求2所述的方法,其特征在于,所述确定目标文本针对的评论对象的名称和所述目标文本匹配的评论维度信息的步骤之前,还包括训练评论区域及情感极性联合识别模型的步骤,所述训练评论区域及情感极性联合识别模型的步骤更包括:
根据用户原创数据,构造若干训练样本;其中,每条所述训练样本包括模型输入数据和输出目标数据,所述模型输入数据包括:评论文本、所述评论文本针对的评论对象的名称、所述评论文本匹配的评论维度的名称,以及与所述评论维度关联的关键词;所述输出目标数据包括:所述评论文本中各字符的位置属性标识真实值和所述评论文本匹配的情感极性标识真实值;
以所述训练样本的位置属性标识损失值和情感极性标识损失值的加权之和最小为目标,训练所述评论区域及情感极性联合识别模型;
其中,每条所述训练样本的位置属性标识损失值是根据所述评论文本中各字符的位置属性标识目标的预测值与所述真实值的差值计算得到的;每条所述训练样本的情感极性标识损失值是根据所述评论文本匹配的情感极性标识的预测值与所述真实值的差值计算得到的。


4.根据权利要求3所述的方法,其特征在于,所述评论区域及情感极性联合识别模型的损失函数被配置为:


其中,N表示训练样本总数;M+2表示位置属性标识的字符长度;w为情感极性损失值的权值;表示第i个训练样本中评论文本第j个字符的位置属性标识预测值;表示第i个训练样本中评论文本第j个字符对应的位置属性标识真实值,和的取值范围选自预设值;Si表示第i个训练样本的情感极性标识预测值;Pi表示第i个训练样本的情感极性标识真实值;φ(θ)为正则化项,M和N为正整数。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述确定目标文本针对的评论对象的名称和所述目标文本匹配的评论维度信息的步骤,包括:
确定目标文本针对的评论对象的名称;
根据预设语料库中存储的关键词和选择的评论维度的关联关系,确定选择的所述评论维度关联的关键词和所述评论维度的名称;
其中,所述关键词和评论维度的关联关系通过以下方式确定:
根据获取的若干条用户原创数据,确定若干关键词;
对所述若干关键词进行聚类,确定多个关键词类别;
分别确定由每个所述关键词类别中满足预设条件的所述关键词,组成的关键词集合;
通过对每个所述关键词集合中包括的所述关键词的评论内容进行抽象,确定每个所述关键词集合关联的评论维度和所述评论维度的名称,所述关键词关联的评论维度为所述关键词所在关键词集合关联的评论维度。


6.一种评论区域和情感极性的联合识别装置,其特征在于,包括...

【专利技术属性】
技术研发人员:徐飒方瑞玉
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1