一种方面挖掘模型的训练方法、装置及电子设备制造方法及图纸

技术编号:19647574 阅读:25 留言:0更新日期:2018-12-05 20:42
本发明专利技术实施例提供了一种方面挖掘模型的训练方法、装置及电子设备,该方法包括:获得多条针对商家对象的评论信息;确定各个评论文本中的评论词组与评价方面的目标对应关系;确定多条评论信息中的用户评论关系和商家评论关系;利用预设的函数优化公式,优化预设的损失函数;在损失函数优化完成后,对方面挖掘模型进行训练,直至通过损失函数所计算出的损失值低于预设阈值时,完成方面挖掘模型的训练。相比于现有技术,本发明专利技术实施例提供的方法,在模型训练时,考虑了用户、评论文本和商家对象之间的关系,使得方面挖掘模型能够学习到更有效的特征,进而,提高基于方面挖掘模型确定的商家对象的方面评分的准确性。

A Training Method, Device and Electronic Equipment for Aspect Mining Model

The embodiment of the present invention provides a training method, device and electronic device for mining model in one aspect. The method includes: obtaining multiple comment information for business objects; determining the corresponding relationship between comment phrases and evaluation objectives in each comment text; and determining the user comment relationship and business comment relationship in multiple comment information. Comment on the relationship; use the preset function optimization formula to optimize the preset loss function; after the loss function optimization is completed, the aspect mining model is trained, until the loss value calculated by the loss function is lower than the preset threshold, the aspect mining model is trained. Compared with the existing technology, the method provided by the embodiment of the present invention considers the relationship among users, comment text and business objects in model training, so that aspect mining model can learn more effective features, and then improve the accuracy of aspect scoring of business objects determined by aspect mining model.

【技术实现步骤摘要】
一种方面挖掘模型的训练方法、装置及电子设备
本专利技术涉及计算机软件
,特别是涉及一种方面挖掘模型的训练方法、装置及电子设备。
技术介绍
目前,一些评分网站常常设置有针对于各个商家对象的商家评价,其中,针对于任一商家对象的商家评价中包括:商家总评分、针对于多个评价方面的方面评分和针对于该商家对象的多条评论信息等,每条评论信息包括:用户的标识、用户对该商家对象的评论文本和用户总评分,商家总评分是根据多个用户总评分确定的。举例而言,对于饭店商家而言,多个评价方面可以包括但不局限于:服务、环境和口味。当消费者想要选择商家对象去消费时,可以将评分网站上的商家评价作为参考。不同的消费者在选择商家对象时注重的评价方面可能不同,因此,商家评价中的方面评分对消费者来说具有重要的参考意义。由于用户在对商家对象进行评价时,对各个评价方面的打分具有一定的随意性,因此,为了提高商家对象的方面评分的准确性,通常会根据多个用户针对商家对象的评论信息对该商家对象的方面评分进行确定。这里的用户是指曾经去过该商家消费过的用户。现有技术中,针对评价方面的方面评分的确定方法是根据商家评价中的用户总评分和评论文本建立方面挖掘模型,进而利用该模型确定方面评分。然而,在实际情况中,评分网站中存在复杂的用户、评论文本和商家对象之间的关系,并影响确定的方面评分的准确性。因此,亟需一种新的方面挖掘模型训练方法,可以考虑到上述复杂的关系,进而提高确定的方面评分的准确性。
技术实现思路
本专利技术实施例的目的在于提供一种方面挖掘模型的训练方法、装置及电子设备,以提高确定的方面评分的准确性。具体技术方案如下:第一方面,本专利技术实施例提供了一种方面挖掘模型的训练方法,所述方法包括:获得多条针对商家对象的评论信息,其中,每条评论信息包括:用户的标识、商家对象的标识、所述用户对所述商家对象的评论文本和用户总评分;确定各个评论文本中的评论词组与评价方面的目标对应关系,其中,所述评论词组包括一个先行词和一个修饰词,所述先行词为:表示评价方面的词,所述修饰词为:表示用户情绪的词;确定所述多条评论信息中的用户评论关系和商家评论关系,其中,所述用户评论关系为:关于用户总评分、用户的标识及评论文本的对应关系,所述商家评论关系为:关于用户总评分、商家对象及评论文本的对应关系;利用预设的函数优化公式,优化预设的损失函数;其中,所述损失函数为关于方面评分的取值范围、所述用户总评分、所述目标对应关系、所述用户评论关系和所述商家评论关系的函数;所述方面评分的取值范围为基于预设的评分取值范围和预设的评分偏差所确定的;在所述损失函数优化完成后,将所述用户总评分和所述目标对应关系作为输入内容,对方面挖掘模型进行训练,直至通过所述损失函数所计算出的损失值低于预设阈值时,完成所述方面挖掘模型的训练;其中,所述方面挖掘模型为用于确定商家对象的各个评价方面对应的评价分数的模型第二方面,本专利技术实施例提供了一种商家对象方面评分的确定方法,所述方法包括:获得多条针对待确定方面评分的商家对象的测试信息,其中,每条测试信息包括:一条评论文本和该评论文本所对应的用户总评分;确定各个评论文本中的评论词组与评价方面的目标对应关系;将所述测试信息与所述目标对应关系输入到预先训练完成的方面挖掘模型中进行检测,得到所述商家对象各评价方面的方面评分;其中,所述方面挖掘模型通过第一方面提供的一种方面挖掘模型的训练方法中任一项所述的方法训练得到。第三方面,本专利技术实施例提供了一种方面挖掘模型的训练装置,所述装置包括:样本获得模块,用于获得多条针对商家对象的评论信息,其中,每条评论信息包括:用户的标识、商家对象的标识、所述用户对所述商家对象的评论文本和用户总评分;第一关系确定模块,用于确定各个评论文本中的评论词组与评价方面的目标对应关系,其中,所述评论词组包括一个先行词和一个修饰词,所述先行词为:表示评价方面的词,所述修饰词为:表示用户情绪的词;第二关系确定模块,用于确定所述多条评论信息中的用户评论关系和商家评论关系,其中,所述用户评论关系为:关于用户总评分、用户的标识及评论文本的对应关系,所述商家评论关系为:关于用户总评分、商家对象及评论文本的对应关系;函数优化模块,用于利用预设的函数优化公式,优化预设的损失函数;其中,所述损失函数为关于方面评分的取值范围、所述用户总评分、所述目标对应关系、所述用户评论关系和所述商家评论关系的函数;所述方面评分的取值范围为基于预设的评分取值范围和预设的评分偏差所确定的;模型训练模块,用于在所述损失函数优化完成后,将所述用户总评分和所述目标对应关系作为输入内容,对方面挖掘模型进行训练,直至通过所述损失函数所计算出的损失值低于预设阈值时,完成所述方面挖掘模型的训练;其中,所述方面挖掘模型为用于确定商家对象的各个评价方面对应的评价分数的模型。第四方面,本专利技术实施例提供了一种商家对象方面评分的确定装置,所述装置包括:信息获得模块,用于获得多条针对待确定方面评分的商家对象的测试信息,其中,每条测试信息包括:一条评论文本和该评论文本所对应的用户总评分;对应关系确定模块,用于确定各个评论文本中的评论词组与评价方面的目标对应关系;评分获得模块,用于将所述测试信息与所述目标对应关系输入到预先训练完成的方面挖掘模型中进行检测,得到所述商家对象各评价方面的方面评分;其中,所述方面挖掘模型通过第一方面提供的一种方面挖掘模型的训练方法中任一项所述的方法训练得到。第五方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述第一方面提供的一种方面挖掘模型的训练方法的方法步骤。第六方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述第二方面提供的一种商家对象方面评分的确定方法的方法步骤。第七方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质为服务器中的存储介质,其中存储有计算机程序,所述计算机程序被处理器执行时,实现上述第一方面提供的一种方面挖掘模型的训练方法的方法步骤。第八方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质为服务器中的存储介质,其中存储有计算机程序,所述计算机程序被处理器执行时,实现上述第二方面提供的一种商家对象方面评分的确定方法的步骤。以上可见,本专利技术实施例提供的方案,在获得训练样本之后,根据训练样本中评论文本、用户总评分以及用户的标识和商家对象的标识,可以确定用户评论关系和商家评论关系。训练方面挖掘模型时,方面挖掘模型不仅可以学习商家评论中的用户总评分和评论文本间的关系,同时还可以学习评分网站中存在的复杂的用户、评论文本和商家对象之间的关系。因此,训练得到的方面挖掘模型可以学习到更多更有效的特征,进而,提高基于方面挖掘模型确定的商家对象的方面评分的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中本文档来自技高网...

【技术保护点】
1.一种方面挖掘模型的训练方法,其特征在于,所述方法包括:获得多条针对商家对象的评论信息,其中,每条评论信息包括:用户的标识、商家对象的标识、所述用户对所述商家对象的评论文本和用户总评分;确定各个评论文本中的评论词组与评价方面的目标对应关系,其中,所述评论词组包括一个先行词和一个修饰词,所述先行词为:表示评价方面的词,所述修饰词为:表示用户情绪的词;确定所述多条评论信息中的用户评论关系和商家评论关系,其中,所述用户评论关系为:关于用户总评分、用户的标识及评论文本的对应关系,所述商家评论关系为:关于用户总评分、商家对象及评论文本的对应关系;利用预设的函数优化公式,优化预设的损失函数;其中,所述损失函数为关于方面评分的取值范围、所述用户总评分、所述目标对应关系、所述用户评论关系和所述商家评论关系的函数;所述方面评分的取值范围为基于预设的评分取值范围和预设的评分偏差所确定的;在所述损失函数优化完成后,将所述用户总评分和所述目标对应关系作为输入内容,对方面挖掘模型进行训练,直至通过所述损失函数所计算出的损失值低于预设阈值时,完成所述方面挖掘模型的训练;其中,所述方面挖掘模型为用于确定商家对象的各个评价方面对应的评价分数的模型。...

【技术特征摘要】
1.一种方面挖掘模型的训练方法,其特征在于,所述方法包括:获得多条针对商家对象的评论信息,其中,每条评论信息包括:用户的标识、商家对象的标识、所述用户对所述商家对象的评论文本和用户总评分;确定各个评论文本中的评论词组与评价方面的目标对应关系,其中,所述评论词组包括一个先行词和一个修饰词,所述先行词为:表示评价方面的词,所述修饰词为:表示用户情绪的词;确定所述多条评论信息中的用户评论关系和商家评论关系,其中,所述用户评论关系为:关于用户总评分、用户的标识及评论文本的对应关系,所述商家评论关系为:关于用户总评分、商家对象及评论文本的对应关系;利用预设的函数优化公式,优化预设的损失函数;其中,所述损失函数为关于方面评分的取值范围、所述用户总评分、所述目标对应关系、所述用户评论关系和所述商家评论关系的函数;所述方面评分的取值范围为基于预设的评分取值范围和预设的评分偏差所确定的;在所述损失函数优化完成后,将所述用户总评分和所述目标对应关系作为输入内容,对方面挖掘模型进行训练,直至通过所述损失函数所计算出的损失值低于预设阈值时,完成所述方面挖掘模型的训练;其中,所述方面挖掘模型为用于确定商家对象的各个评价方面对应的评价分数的模型。2.根据权利要求1所述的方法,其特征在于,所述基于预设的评分取值范围和预设的评分偏差,确定方面评分的取值范围的方式,包括:按照如下公式,计算与预设的评分取值范围内每个评分对应的方面评分:rz=Ri-bz其中,rz为方面评分,Ri为所述预设的评分取值范围内第i个评分,1≤i≤n,n为所述预设评分取值范围内评分的个数,bz为所述预设的评分偏差;基于与所述预设的评分取值范围内每个评分对应的方面评分,确定方面评分的取值范围。3.根据权利要求1所述的方法,其特征在于,所述确定各个评论文本中评论词组与评价方面的目标对应关系的步骤,包括:利用预设的语言处理工具,从各个评论文本中提取评论词组;针对每一评论词组,将该评论词组输入至预先训练完成的主题模型中进行检测,得到该评论词组与评价方面的目标对应关系。4.根据权利要求1所述的方法,其特征在于,所述确定所述多条评论信息中的用户评论关系和商家评论关系的步骤,包括:针对每一用户的标识,从该标识对应的评论文本中,获取与各个用户总评分对应的第一评论文本;针对每一用户的标识,建立用户总评分与所对应的第一评论文本的对应关系,作为用户评论关系;针对每一商家对象,从该商家对象对应的评论文本中,获取与每个用户总评分对应的第二评论文本;针对每一商家对象,建立用户总评分与所对应的第二评论文本的对应关系,作为商家评论关系。5.根据权利要求1-4任一项所述的方法,其特征在于,所述预设的损失函数为:其中,f为损失函数,f1为第一子函数,f2为第二子函数,f3为第三子函数,λ为平衡参数,λ≥0;所述第一子函数为:其中,d为评论文本,l为评论词组,z为评价方面,rz为所述方面评分的取值范围内的方面评分,hl为评论词组l中的先行词,ml为评论词组l中的修饰词,θd,z为与评论文本d对应的评价方面z的分布,为与评论文本d对应的评价方面z的方面评分rz的分布,为与评价方面z对应的评论词组中的先行词分布,为方面评分为rz时,与评价方面z对应的评论词组中的修饰词分布;所述第二子函数为:其中,r为用户总评分,p(z|d,r)为在用户总评分为r时,与评论文本d对应的方面评分z的分布,p(z|du,r)为针对每个...

【专利技术属性】
技术研发人员:石川吉余岗
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1