一种标签化的用户能力画像分析方法及系统技术方案

技术编号:36934011 阅读:18 留言:0更新日期:2023-03-22 18:56
本发明专利技术公开了一种标签化的用户能力画像分析方法及系统,根据历史课程数据提取出目标用户的历史学习特征,预测出目标用户的历史学习标签,基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征,基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征,基于综合学习特征预测出目标用户的下一时间段学习标签,基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。如此得到的目标用户的学习能力标签可以准确刻画和反应目标用户的学习能力和对相关知识的可接受程度,在此基础上,更进一步的对目标用户的学习能力标签进行优化和调整,得到的用户能力画像更加准确反应目标用户的真实情况。实情况。实情况。

【技术实现步骤摘要】
一种标签化的用户能力画像分析方法及系统


[0001]本专利技术涉及计算机
,具体而言,涉及一种标签化的用户能力画像分析方法及系统。

技术介绍

[0002]用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。用户画像是根据用户社会属性、生活习惯和行为等信息而抽象出的一个标签化的用户模型,用户画像包含了多个用户标签,用户标签用于表征用户的某种特性。在实际操作的过程中,往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来,作为实际用户的虚拟代表。
[0003]在高速发展的信息科技时代,用户的很多事情都是在网上完成,例如在网上学习、购物等等。根据用户的特性(用户画像)给用户推荐合适的产品、课程具有极大的社会意义和经济价值。
[0004]目前,主要以用户自己填写的基本属性信息标签来刻画用户的用户画像。但是事实上,一方面,用户填写的信息不一定准确,有可能是虚假的、随意填写的。另一方面,用户的基本信息并不一定能准确表征用户的特性,例如,一个学生的毕业学校是排名比较靠后的学校,但是该学生的能力很强、知识掌握程度很高,这个时候如果根据学校的属性去给该学生推荐较为基础的课程,那么推荐的课程对该学生来说是不适用的。

技术实现思路

[0005]本专利技术的目的在于提供了一种标签化的用户能力画像分析方法及系统,用以解决现有技术中存在的上述问题。
[0006]第一方面,本专利技术实施例提供了一种标签化的用户能力画像分析方法,包括:
[0007]获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;
[0008]将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签;
[0009]根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像;用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;
[0010]所述用户能力画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特
征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。
[0011]可选的,所述方法还包括:
[0012]基于所述用户能力画像,给所述目标用户推荐符合所述用户能力画像的课程。
[0013]可选的,所述用户能力画像估计模型的训练方法包括:
[0014]获得训练集,所述训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长;
[0015]将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性;
[0016]通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签;
[0017]通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列;
[0018]将多条第二学习特征序列构成第二学习特征图;
[0019]通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列;
[0020]通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签;
[0021]通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签;
[0022]当所述预测标签与所述第一训练标签的差异指数收敛,确定用户能力画像估计模型训练结束。
[0023]可选的,混合金字塔结构网络包括第一金字塔结构和第二金字塔结构;所述通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:
[0024]通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图;
[0025]通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图;
[0026]以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。
[0027]可选的,所述通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签,包括:
[0028]将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签;M为第一训练标签的长度,N为第二训练标签的长度;
[0029]通过CTC loss函数基于融合标签进行转录,得到预测标签。
[0030]第二方面,本专利技术实施例还提供了一种标签化的用户能力画像分析系统,包括:
[0031]获得模块,用于获得目标用户的基本属性信息和历史课程数据;所述基本属性信
息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;
[0032]预测模块,用于将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签;
[0033]调整模块,用于根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像;用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;
[0034]所述用户能力画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签化的用户能力画像分析方法,其特征在于,包括:获得目标用户的基本属性信息和历史课程数据;所述基本属性信息包括学校信息、专业信息、大赛参赛信息;历史课程数据包括:目标用户选课科目、目标用户选课时间、目标用户学习时间集合、目标用户反复学习次数,所述目标用户学习时间集合包括多个目标学习时长;将所述历史课程数据输入预先训练好的用户能力画像估计模型中,所述用户能力画像估计模型估计出所述目标用户的学习能力标签;根据所述基本属性信息和所述学习能力标签,生成目标用户的用户能力画像;用户能力画像包括多个用户标签,不同的用户标签用于表征目标用户在不同维度的特性;所述用户能力画像估计模型包括CNN网络、第一RNN网络、第二RNN网络,一个LSTM网络、混合金字塔结构网络和一个CTC loss层;CNN网络用于根据历史课程数据提取出目标用户的历史学习特征,第一RNN网络用于根据历史学习特征预测出目标用户的历史学习标签;LSTM网络用于基于目标用户的历史学习特征预测出目标用户的下一时间段学习特征;混合金字塔结构用于基于历史学习特征和下一时间段学习特征进行融合,得到综合学习特征;第二RNN网络用于基于综合学习特征预测出目标用户的下一时间段学习标签;CTC loss层用于基于历史学习标签对下一时间段学习标签进行矫正,得到目标用户的学习能力标签。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述用户能力画像,给所述目标用户推荐符合所述用户能力画像的课程。3.根据权利要求1所述的方法,其特征在于,所述用户能力画像估计模型的训练方法包括:获得训练集,所述训练集包括多个训练用户对应的多个训练子集,每个用户对应一个训练子集,每个训练子集包括多个科目的训练数据,每个训练数据包括训练用户选课科目、训练用户选课时间、训练用户学习时间集合、训练用户反复学习次数;所述训练用户学习时间集合包括多个训练学习时长;将多个训练子集输入CNN网络中,CNN网络基于每个训练用户的训练子集中的多个科目的训练数据,提取出训练用户的第一学习特征图,第一学习特征图包括多条第一学习特征序列,每条第一学习特征序列表征一个科目的学习特性;通过第一RNN网络对多条第一学习特征序列进行学习,预测出训练用户的第一训练标签;通过LSTM网络基于多条第一学习特征序列进行预测,对应得到多条第二学习特征序列;将多条第二学习特征序列构成第二学习特征图;通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,第三学习特征图包括多条第三学习特征序列;通过第二RNN网络对多条第三学习特征序列进行学习,预测出训练用户的第二训练标签;通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签;当所述预测标签与所述第一训练标签的差异指数收敛,确定用户能力画像估计模型训练结束。
4.根据权利要求3所述的方法,其特征在于,混合金字塔结构网络包括第一金字塔结构和第二金字塔结构;所述通混合金字塔结构对第一学习特征图和第二学习特征图进行融合,得到第三学习特征图,包括:通过第一金字塔结构将第一学习特征图进行降维操作,得到第一降维特征图;通过第二金字塔结构将第二学习特征图进行降维操作,得到第二降维特征图;以第二降维特征图作为核,对第一降维特征图进行卷积操作,得到第三学习特征图。5.根据权利要求3所述的方法,其特征在于,所述通过CTC loss层基于第一训练标签和第二训练标签进行融合转录,得到预测标签,包括:将第一训练标签和第二训练标签拼接,形成一个长度为M+N的融合标签;M为第一训练标签的长度,N为第二训练标签的长度;通过CTC loss函数基于融合标签进行转录,得到预测标签。6.一种标签化的用户能力画像分析系统...

【专利技术属性】
技术研发人员:郑楠曹鹏宇杨连增
申请(专利权)人:国信蓝桥教育科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1