【技术实现步骤摘要】
一种内容推荐模型的生成方法、生成装置、设备及介质
[0001]本专利技术涉及神经网络模型领域,特别是涉及一种内容推荐模型的生成方法、生成装置、设备及介质。
技术介绍
[0002]现今网络不断快速发展与普及,越来越多的用户在论坛或通讯软件中使用emoji表情符号,更有用户使用纯emoji表情符号编写文本内容。大量的数据产生也同时产生了大量的数据分析需求,通过分析用户的文本内容,从而实现对用户的内容推荐,是其中很重要的一个环节。在对用户文本内容进行分析时,往往会将emoji表情符号剔除后进行分析,这样容易损失用户的个性化内容,导致内容推荐不精确。
技术实现思路
[0003]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种内容推荐模型的生成方法,本专利技术能够向用户精确推荐个性化内容。
[0004]为实现上述目的及其他相关目的,本专利技术提供一种内容推荐模型的生成方法,包括:
[0005]获取用户发表的第一初始文本数据集,其中,所述第一初始文本数据集包括多个发帖内容数据与多个评论内容数据;< ...
【技术保护点】
【技术特征摘要】
1.一种内容推荐模型的生成方法,其特征在于,包括:获取用户发表的第一初始文本数据集,其中,所述第一初始文本数据集包括多个发帖内容数据与多个评论内容数据;根据所述第一初始文本数据集对初始情绪分析模型进行训练,生成中间情绪分析模型;根据多个所述评论内容数据对所述中间情绪分析模型进行训练,生成目标情绪分析模型;获取用户发表的表情数据集,其中,所述表情数据集包括多个表情数据;根据所述表情数据集对初始统计分析模型进行训练,生成目标统计分析模型;将所述目标情绪分析模型与所述目标统计分析模型进行整合处理,生成内容推荐模型。2.根据权利要求1所述的内容推荐模型的生成方法,其特征在于,所述根据所述第一初始文本数据集对初始情绪分析模型进行训练,生成中间情绪分析模型的步骤包括:对所述第一初始文本数据集进行处理,生成第一中间文本数据集;根据所述第一中间文本数据集对初始情绪分析模型进行训练,生成中间情绪分析模型。3.根据权利要求2所述的内容推荐模型的生成方法,其特征在于,所述对所述第一初始文本数据集进行处理,生成第一中间文本数据集的步骤包括:对所述第一初始文本数据集进行清除处理,清除所述发帖内容数据与所述评论内容数据中的链接与网址,生成第一中间内容数据;判断所述第一中间内容数据的长度是否大于第一预设长度阈值,若大于所述第一预设长度阈值,则所述第一中间内容数据表示为第一初始长文本数据,若小于或等于所述第一预设长度阈值,则所述第一中间内容数据表示为第一初始短文本数据;对所述第一初始长文本数据进行关键句提取处理,生成第一初始关键句数据;对所述第一初始长文本数据、所述第一初始关键句数据以及所述第一初始短文本数据进行汇总处理,生成第一中间文本数据集。4.根据权利要求1所述的内容推荐模型的生成方法,其特征在于,所述根据多个所述评论内容数据对所述中间情绪分析模型进行训练,生成目标情绪分析模型的步骤包括:对多个所述评论内容数据进行处理,生成第二中间文本数据集;根据所述第二中间文本数据集对中间情绪分析模型进行训练,生成目标情绪分析模型。5.根据权利要求4所述的内容推荐模型的生成方法,其特征在于,所述对多个所述评论内容数据进行处理,生成第二中间文本数据集的步骤包括:对多个所述评论内容数据进行处理,生成已标注情绪的第二初始文本数据集;对所述第二初始文本数据集进行处理,生成第二中间文本数据集。6.根据权利要求5所述的内容推荐模型的生成方法,其特征在于,所述对多个所述评论内容数据进行处理,生成已标注情绪的第二初始文本数据集的步骤包括:对多个所述评论内容数据进行聚类处理,生成初始集合体数据;对所述初始集合体数据进行情绪值标注处理,生成已标注情绪的目标集合体数据,其
中,所述情绪值包括喜欢、中立、厌恶;对所述目标集合体数据进行集合处理,生成已标注情绪的第二初始文本数据集...
【专利技术属性】
技术研发人员:陈益梦,车皓阳,于水,谷永超,
申请(专利权)人:浙江吉利控股集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。