一种情绪分析模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:34933496 阅读:11 留言:0更新日期:2022-09-15 07:29
本发明专利技术涉及智能决策领域,提供一种情绪分析模型的训练方法,包括:获取用户发表的初始文本集数据;对初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据,将其输入到初始情绪分析模型中进行训练,得到中间情绪分析模型;获取已标注情绪的训练文本集数据;对训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据,将其输入到中间情绪分析模型中进行训练,得到训练好的情绪分析模型。通过本发明专利技术公开的一种情绪分析模型的训练方法,能够使训练后的情绪分析模型的精确度得到提升。训练后的情绪分析模型的精确度得到提升。训练后的情绪分析模型的精确度得到提升。

【技术实现步骤摘要】
一种情绪分析模型的训练方法、装置、设备及介质


[0001]本专利技术涉及智能决策
,特别是涉及一种情绪分析模型的训练方法、装置、设备及介质。

技术介绍

[0002]现今网络不断快速发展与普及,越来越多的用户在论坛或通讯软件中使用emoji表情符号,更有用户使用纯emoji表情符号编写文本内容。大量的数据产生也同时产生了大量的数据分析需求,分析用户文字的情绪是其中很重要的一个环节。现有的情绪分析模型,在对语句进行情绪分析时,分析结果精确度不理想。

技术实现思路

[0003]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种情绪分析模型的训练方法、装置、设备及介质,能够使训练后的情绪分析模型的精确度得到提升。
[0004]为实现上述目的及其他相关目的,本专利技术提供一种情绪分析模型的训练方法,包括:
[0005]获取用户发表的初始文本集数据,所述初始文本集数据包括多个初始文本数据;
[0006]对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据;
[0007]将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型;
[0008]获取已标注情绪的训练文本集数据,所述训练文本集数据包括多个训练文本数据;
[0009]对所述训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据;
[0010]将所述第一训练文本集数据与所述第二训练文本集数据输入到所述中间情绪分析模型中,并对所述中间情绪分析模型中的训练参数进行训练,得到训练好的情绪分析模型。
[0011]在本专利技术一实施例中,所述对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据的步骤包括:
[0012]对所述初始文本集数据内的链接与网址进行清除处理,生成中间文本集数据;
[0013]判断所述初始文本数据的长度是否大于预设长度阈值,若大于所述预设长度阈值,则所述初始文本数据表示为初始长文本数据,若不大于所述预设长度阈值,则所述初始文本数据表示为初始短文本数据;
[0014]对所述初始长文本数据进行关键句提取处理,生成所述初始关键句数据,对所述初始关键句数据进行汇总处理,生成第一初始文本集数据;
[0015]对所述初始短文本数据进行汇总处理,生成第二初始文本集数据。
[0016]在本专利技术一实施例中,所述将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型的步骤包括:
[0017]将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,获取嵌入向量集;
[0018]对所述嵌入向量集进行处理,生成搜索向量集、关键词向量集及值向量集;
[0019]根据所述搜索向量集、所述关键词向量集及所述值向量集,获取每个所述初始文本数据内的搜索向量分数、关键词向量分数以及值向量分数;
[0020]对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行处理,得到关注度加权向量;
[0021]将所述关注度加权向量输入到初始情绪分析模型中,并对初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型。
[0022]在本专利技术一实施例中,所述对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行处理,得到关注度加权向量的步骤包括:
[0023]对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行归一化处理,得到归一化数据;
[0024]对所述归一化数据进行激活处理,得到重要性数据;
[0025]对所述重要性集数据进行处理,得到关注度加权向量。
[0026]在本专利技术一实施例中,所述关注度加权向量M,表示为:其中,
[0027]Q表示为搜索向量,
[0028]K表示为关键词向量,
[0029]V表示为值向量,
[0030]T表示为转置,
[0031]d
k
表示为矩阵维度。
[0032]在本专利技术一实施例中,所述对训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据的步骤包括:
[0033]判断所述训练文本数据的长度是否大于预设长度阈值,若大于所述预设长度阈值,则所述训练文本数据表示为训练长文本数据,若不大于所述预设长度阈值,则所述训练文本数据表示为训练短文本数据;
[0034]对所述训练长文本数据进行关键句提取处理,生成训练关键句数据,对所述训练关键句数据进行汇总处理,生成第一训练文本集数据;
[0035]对所述训练短文本数据进行汇总处理,生成第二训练文本集数据。
[0036]在本专利技术一实施例中,所述将所述第一训练文本集数据与所述第二训练文本集数据输入到所述中间情绪分析模型中,并对所述中间情绪分析模型中的训练参数进行训练,得到训练好的情绪分析模型的步骤包括:
[0037]将所述第一训练文本集数据与所述第二训练文本集数据输入到所述中间情绪分
析模型中,获取第一训练文本集向量与第二训练文本集向量;
[0038]将部分所述第一训练文本向量与部分所述第二训练文本向量进行汇总处理,生成训练集数据,将其余所述第一训练文本向量与其余所述第二训练文本向量进行汇总处理,生成验证集数据;
[0039]将所述训练集数据与所述验证集数据输入到所述中间情绪分析模型中,对所述中间情绪分析模型内的训练参数进行训练,得到训练好的情绪分析模型。
[0040]本专利技术还提供一种情绪分析模型的训练装置,包括:
[0041]初始文本集数据获取模块,用于获取用户发表的初始文本集数据,所述初始文本集数据包括多个初始文本数据;
[0042]初始文本集数据处理模块,用于对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据;
[0043]第一训练模块,用于将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型;
[0044]训练文本集数据获取模块,用于获取已标注情绪的训练文本集数据,所述训练文本集数据包括多个训练文本数据;
[0045]训练文本集数据处理模块,用于对所述训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据;以及
[0046]第二训练模块,用于将所述第一训练文本集数据与所述第二训练文本集数据输入到所述中间情绪分析模型中,并对所述中间情绪分析模型中的训练参数进行训练,得到训练好的情绪分析模型。
[0047]本专利技术还提供一种计算机设备,包括存储器、处理器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情绪分析模型的训练方法,其特征在于,包括:获取用户发表的初始文本集数据,所述初始文本集数据包括多个初始文本数据;对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据;将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型;获取已标注情绪的训练文本集数据,所述训练文本集数据包括多个训练文本数据;对所述训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据;将所述第一训练文本集数据与所述第二训练文本集数据输入到所述中间情绪分析模型中,并对所述中间情绪分析模型中的训练参数进行训练,得到训练好的情绪分析模型。2.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据的步骤包括:对所述初始文本集数据内的链接与网址进行清除处理,生成中间文本集数据;判断所述初始文本数据的长度是否大于预设长度阈值,若大于所述预设长度阈值,则所述初始文本数据表示为初始长文本数据,若不大于所述预设长度阈值,则所述初始文本数据表示为初始短文本数据;对所述初始长文本数据进行关键句提取处理,生成所述初始关键句数据,对所述初始关键句数据进行汇总处理,生成第一初始文本集数据;对所述初始短文本数据进行汇总处理,生成第二初始文本集数据。3.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型的步骤包括:将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,获取嵌入向量集;对所述嵌入向量集进行处理,生成搜索向量集、关键词向量集及值向量集;根据所述搜索向量集、所述关键词向量集及所述值向量集,获取每个所述初始文本数据内的搜索向量分数、关键词向量分数以及值向量分数;对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行处理,得到关注度加权向量;将所述关注度加权向量输入到初始情绪分析模型中,并对初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型。4.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行处理,得到关注度加权向量的步骤包括:对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行归一化处理,得到归一化数据;
对所述归一化数据进行激活处理,得到重要性数据;对所述重要性集数据进行处理,得到关注度加权向量。5.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述关注度加权向量M,表示为:其中,Q表示为...

【专利技术属性】
技术研发人员:陈益梦车皓阳于水何超
申请(专利权)人:浙江吉利控股集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1