【技术实现步骤摘要】
一种情绪分析模型的训练方法、装置、设备及介质
[0001]本专利技术涉及智能决策
,特别是涉及一种情绪分析模型的训练方法、装置、设备及介质。
技术介绍
[0002]现今网络不断快速发展与普及,越来越多的用户在论坛或通讯软件中使用emoji表情符号,更有用户使用纯emoji表情符号编写文本内容。大量的数据产生也同时产生了大量的数据分析需求,分析用户文字的情绪是其中很重要的一个环节。现有的情绪分析模型,在对语句进行情绪分析时,分析结果精确度不理想。
技术实现思路
[0003]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种情绪分析模型的训练方法、装置、设备及介质,能够使训练后的情绪分析模型的精确度得到提升。
[0004]为实现上述目的及其他相关目的,本专利技术提供一种情绪分析模型的训练方法,包括:
[0005]获取用户发表的初始文本集数据,所述初始文本集数据包括多个初始文本数据;
[0006]对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据;
[0007]将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型;
[0008]获取已标注情绪的训练文本集数据,所述训练文本集数据包括多个训练文本数据;
[0009]对所述训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据;
[ ...
【技术保护点】
【技术特征摘要】
1.一种情绪分析模型的训练方法,其特征在于,包括:获取用户发表的初始文本集数据,所述初始文本集数据包括多个初始文本数据;对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据;将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型;获取已标注情绪的训练文本集数据,所述训练文本集数据包括多个训练文本数据;对所述训练文本集数据进行处理,生成第一训练文本集数据与第二训练文本集数据;将所述第一训练文本集数据与所述第二训练文本集数据输入到所述中间情绪分析模型中,并对所述中间情绪分析模型中的训练参数进行训练,得到训练好的情绪分析模型。2.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述对所述初始文本集数据进行处理,生成初始长文本集数据、第一初始文本集数据以及第二初始文本集数据的步骤包括:对所述初始文本集数据内的链接与网址进行清除处理,生成中间文本集数据;判断所述初始文本数据的长度是否大于预设长度阈值,若大于所述预设长度阈值,则所述初始文本数据表示为初始长文本数据,若不大于所述预设长度阈值,则所述初始文本数据表示为初始短文本数据;对所述初始长文本数据进行关键句提取处理,生成所述初始关键句数据,对所述初始关键句数据进行汇总处理,生成第一初始文本集数据;对所述初始短文本数据进行汇总处理,生成第二初始文本集数据。3.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,并对所述初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型的步骤包括:将所述初始长文本集数据、所述第一初始文本集数据以及所述第二初始文本集数据输入到初始情绪分析模型中,获取嵌入向量集;对所述嵌入向量集进行处理,生成搜索向量集、关键词向量集及值向量集;根据所述搜索向量集、所述关键词向量集及所述值向量集,获取每个所述初始文本数据内的搜索向量分数、关键词向量分数以及值向量分数;对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行处理,得到关注度加权向量;将所述关注度加权向量输入到初始情绪分析模型中,并对初始情绪分析模型中的训练参数进行训练,得到中间情绪分析模型。4.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行处理,得到关注度加权向量的步骤包括:对所述搜索向量分数、所述关键词向量分数以及所述值向量分数进行归一化处理,得到归一化数据;
对所述归一化数据进行激活处理,得到重要性数据;对所述重要性集数据进行处理,得到关注度加权向量。5.根据权利要求1所述的情绪分析模型的训练方法,其特征在于,所述关注度加权向量M,表示为:其中,Q表示为...
【专利技术属性】
技术研发人员:陈益梦,车皓阳,于水,何超,
申请(专利权)人:浙江吉利控股集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。