情感模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:32436124 阅读:8 留言:0更新日期:2022-02-26 07:54
本申请公开了一种情感模型训练方法、装置、设备及存储介质,所述方法包括:获取样本的信息;基于所述样本的信息确定所述样本的用户主题关系;基于所述样本的信息确定用户社交关系;基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,以使所述情感模型具备确定文本的情感极性的能力。如此,训练后的情感模型能够准确地确定情感表达不明确的文本的情感极性,提高了文本的情感极性分类的准确率。准确率。准确率。

【技术实现步骤摘要】
情感模型训练方法、装置、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种情感模型训练方法、装置、设备及存储介质。

技术介绍

[0002]随着第二代互联网的发展,众多开放化的互联网社交服务平台兴起。由于互联网社交服务平台发帖方便和实时更新的特点,已经拥有海量用户。用户在互联网社交服务平台发布的文本来针对众多主题实时分享自己的感受、观点和见解。由于这些文本包含丰富的用户情感信息,因此,可以通过文本情感极性分类模型从海量的文本中挖掘出用户的情感倾向。但是,这些具有社交特性的文本相比传统文本具有内容短小、口语化严重、使用网络词和情感互动等特点,导致有些具有社交特性的文本内容表达出的情感极性不够明确。而传统的文本情感分类模型依赖于文本的内容来对文本的情感极性进行分类。因此,传统的文本情感分类模型不能准确地将情感表达不明确的文本的进行分类。

技术实现思路

[0003]本申请提供一种情感模型训练方法、装置、设备及存储介质,能够提高了情感模型对情感表达不明确的文本的分类的准确率。
[0004]为达到上述目的,本申请的技术方案是这样实现的:
[0005]第一方面,本申请提供一种情感模型训练方法,所述方法包括:
[0006]获取样本的信息;
[0007]基于所述样本的信息确定所述样本的用户主题关系;
[0008]基于所述样本的信息确定用户社交关系;
[0009]基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,以使所述情感模型具备确定文本的情感极性的能力。
[0010]在一些实施例中,所述基于所述样本的信息确定所述样本的用户主题关系,包括:
[0011]基于所述样本的信息中的用户信息,确定用户样本关系;
[0012]基于所述样本的信息中的主题信息,确定样本主题关系;
[0013]根据所述用户样本关系和所述样本主题关系,确定至少两个样本是否属于同一个用户,以及所属至少两个样本是否属于同一个主题。
[0014]在一些实施例中,所述基于所述样本的信息确定用户社交关系,包括:
[0015]基于所述样本的信息中的用户信息,确定用户样本关系;
[0016]基于所述样本的信息中的主题社交关系,确定用户的主题社交关系;
[0017]根据所述用户样本关系和所述用户的主题社交关系,确定至少两个用户对同一个主题的样本是否存在赞同社交关系。
[0018]在一些实施例中,所述基于所述样本的信息确定用户社交关系,包括:
[0019]根据所述样本的信息中的用户的社交关系,确定所述用户之间的影响关系;
[0020]基于所述用户之间的影响关系,确定所述用户的样本之间是否存在隐式社交关系,所述隐式社交关系表征每个用户的样本的情感极性受其它用户的样本的情感极性的影响。
[0021]在一些实施例中,所述基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,包括:
[0022]基于所述样本、所述用户主题关系和所述用户社交关系,构建目标函数;
[0023]基于所述目标函数,更新所述情感模型中的权重参数。
[0024]在一些实施例中,所述基于所述样本、所述用户主题关系和所述用户社交关系,构建目标函数,包括:
[0025]基于所述用户主题关系、所述用户社交关系中的赞同社交关系及所述赞同社交关系对应的权重系数、以及所述用户社交关系中的隐式社交关系及所述隐式社交关系对应的权重系数中的至少一项,确定第一用户情感关系。
[0026]在一些实施例中,所述基于所述样本、所述用户主题关系和所述用户社交关系,构建目标函数,包括:
[0027]基于所述样本,获取所述样本的预测情感极性值;
[0028]根据所述第一用户情感关系,确定所述样本的情感关系值;
[0029]基于所述样本的预测情感极性值与所述样本的情感极性值的误差,以及所述情感关系值,构建目标函数。
[0030]第二方面,本申请提供一种情感模型训练装置,所述装置包括:所述装置包括:获取模块、第一确定模块、第二确定模块和训练模块,
[0031]所述获取模块,用于获取样本的信息;
[0032]所述第一确定模块,用于基于所述样本的信息确定所述样本的用户主题关系;
[0033]所述第二确定模块,用于基于所述样本的信息确定用户社交关系;
[0034]所述训练模块,用于基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,以使所述情感模型具备确定文本的情感极性的能力。
[0035]第三方面,本申请提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时以实现以如本申请任一实施例所提供的情感模型训练方法的步骤。
[0036]第四方面,本申请提供一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任一实施例所提供的情感模型训练方法的步骤。
[0037]上述实施例所提供的情感模型训练方法,所述方法包括获取样本的信息;基于所述样本的信息确定所述样本的用户主题关系;基于所述样本的信息确定用户社交关系;基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,以使所述情感模型具备确定文本的情感极性的能力。如此,利用样本之间的社交特性建立样本之间的情感极性的关系,在样本内容的基础上,利用样本之间的情感极性的关系,对情感模型进行训练,从而构建半监督学习的情感模型。由于建立了情感表达明确的文本与情感表达不明确的文本之间的情感极性关系,因此,情感模型能够准确地确定情感表达不明确的文本的情感极性,提高了文本的情感极性分类的准确率。此外,根据样本之间的情感极性关系,能够确定已知
情感极性的样本与未知情感极性的样本之间的情感极性关系,从而解决了训练传统的文本情感分类模型需要庞大已知情感极性的样本的问题。有效地减少情感模型对训练语料的依赖。
附图说明
[0038]图1为本申请一实施例中情感模型训练方法的处理流程示意图;
[0039]图2为本申请一实施例中样本的用户主题关系确定方法的处理流程示意图;
[0040]图3为本申请一实施例中用户社交关系确定方法的处理流程示意图;
[0041]图4为本申请另一实施例中用户社交关系确定方法的处理流程示意图;
[0042]图5为本申请一实施例中情感模型参数更新方法的处理流程示意图;
[0043]图6为本申请另一实施例中目标函数构建方法的处理流程示意图;
[0044]图7为本申请另一实施例中情感模型训练方法的处理流程示意图;
[0045]图8为本申请一实施例中情感模型训练装置的结构示意图;
[0046]图9为本申请一实施例中计算机设备的结构示意图。
具体实施方式
[0047]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情感模型训练方法,其特征在于,所述方法包括:获取样本的信息;基于所述样本的信息确定所述样本的用户主题关系;基于所述样本的信息确定用户社交关系;基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,以使所述情感模型具备确定文本的情感极性的能力。2.根据权利要求1所述方法,其特征在于,所述基于所述样本的信息确定所述样本的用户主题关系,包括:基于所述样本的信息中的用户信息,确定用户样本关系;基于所述样本的信息中的主题信息,确定样本主题关系;根据所述用户样本关系和所述样本主题关系,确定至少两个样本是否属于同一个用户,以及所属至少两个样本是否属于同一个主题。3.根据权利要求1所述方法,其特征在于,所述基于所述样本的信息确定用户社交关系,包括:基于所述样本的信息中的用户信息,确定用户样本关系;基于所述样本的信息中的主题社交关系,确定用户的主题社交关系;根据所述用户样本关系和所述用户的主题社交关系,确定至少两个用户对同一个主题的样本是否存在赞同社交关系。4.根据权利要求1所述方法,其特征在于,所述基于所述样本的信息确定用户社交关系,包括:根据所述样本的信息中的用户的社交关系,确定所述用户之间的影响关系;基于所述用户之间的影响关系,确定所述用户的样本之间是否存在隐式社交关系,所述隐式社交关系表征每个用户的样本的情感极性受其它用户的样本的情感极性的影响。5.根据权利要求1所述方法,其特征在于,所述基于所述样本、所述用户主题关系和所述用户社交关系,训练情感模型,包括:基于所述样本、所述用户主题关系和所述用户社交关系,构建目标函数;基于所述目标函数,更新所述情感模型中的权...

【专利技术属性】
技术研发人员:刘威
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1