一种学术画像模型的构建方法及装置制造方法及图纸

技术编号:21454024 阅读:41 留言:0更新日期:2019-06-26 04:48
本发明专利技术公开了一种学术画像模型的构建方法及装置,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,进而建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层和数据归纳分析标签层;根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。达到了提升用户在资源服务平台中获取信息的精准度,并实现用户聚类,且针对不同用户群体,制定不同服务策略的技术效果。

【技术实现步骤摘要】
一种学术画像模型的构建方法及装置
本申请涉及用户数据分析
,尤其涉及一种学术画像模型的构建方法及装置。
技术介绍
科研人员用于科研的文献种类众多,文献资源的增长速度飞快,可供用户使用的相关文献也很多,通过对用户画像信息的构建,分析用户兴趣及兴趣之间的关联关系,改变当前资源服务平台的服务模型由被动为主动,提供更加满足用户需求的文献资源。其中,用户画像是在用户完整信息的基础上,勾画目标用户喜好、用户诉求、潜在意愿,是一种产品设计与精准服务方向的有效工具,用户画像在各领域都已得到广泛的应用。比如,商业服务系统亚马逊、淘宝、京东等根据用户购买及浏览行为,构建用户商业行为个人画像,进而实现商品的推荐。但本申请专利技术人在实现本申请实施例中技术方案的过程中,发现上述现有技术至少存在如下技术问题:现有技术中互联网平台偏向于从日志行为中构建用户画像,由于日志行为数据稀疏,缺少多维度数据关联,维度分析不完整,标签体系粒度不精细,从而造成用户画像不完整不精准的技术问题。申请内容本申请实施例通过提供一种学术画像模型的构建方法及装置,用以解决现有技术中互联网平台偏向于从日志行为中构建用户画像,由于日志行为数据稀疏,缺少多维度数据关联,维度分析不完整,标签体系粒度不精细,从而造成用户画像不完整不精准的技术问题。通过构建多维度的科研用户画像模型,达到了提升用户在资源服务平台中获取信息的精准度,并实现用户聚类,且针对不同用户群体,制定不同服务策略的技术效果。为了解决上述问题,第一方面,本申请实施例提供了一种学术画像模型的构建方法,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。优选的,所述用户原始数据层包括:所述科研用户的基本信息维度数据;所述科研用户的科研活动行为日志数据;所述科研用户的产出科研成果数据;所述科研用户的补充数据。优选的,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层,包括:根据所述科研用户原始数据层中的行为日志数据,采用统计分析方法,获得所述科研用户的初步标签聚类;根据所述科研用户的初步标签聚类,完成定量标签计算,建立粗粒度抽取标签层。优选的,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层,包括:对所述科研用户的原始数据层进行统计分析,获得所述标签库中标签数据的权重值;根据所述标签数据和所述标签的权重值,完成定性标签计算,建立数据归纳分析标签层。优选的,所述根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层,包括:根据所述标签数据,通过K-means无监督学习算法,对所述科研用户的标签数据进行分类预测;获得所述分类预测的输出结果;根据所述输出结果,建立所述应用决策支撑标签层。优选的,所述通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像,包括:将所述输出结果作为所述多级科研用户学术画像模型的输入数据,通过多维度json概率模型输出格式,通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像;将所述科研用户的学术画像按照时间片段进行归类存储,获得不同时期的用户画像文件,包括用户的长期全景画像和短期兴趣画像。第二方面,本申请实施例还提供了一种学术画像模型的构建装置,所述装置包括:第一获得单元,所述第一获得单元用于获得科研用户与参加的科研活动、产出科研成果相关的数据信息;第一构建单元,所述第一构建单元用于根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;第一建立单元,所述第一建立单元用于根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;第二建立单元,所述第二建立单元用于根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;第三建立单元,所述第三建立单元用于根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;第四建立单元,所述第四建立单元用于根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;第一输出单元,所述第一输出单元用于通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。优选的,所述用户原始数据层包括:所述科研用户的基本信息维度数据;所述科研用户的科研活动行为日志数据;所述科研用户的科研成果产出数据;所述科研用户的补充数据。优选的,所述第二建立单元包括:第三获得单元,所述第三获得单元用于根据所述科研用户原始数据层中的行为日志数据,采用统计分析方法,获得所述科研用户的初步标签聚类;第五建立单元,所述第五建立单元用于根据所述科研用户的初步标签聚类,完成定量标签计算,建立粗粒度抽取标签层。优选的,所述第三建立单元包括:第四获得单元,所述第四获得单元用于对所述科研用户的原始数据层进行统计分析,获得所述标签库中标签数据的权重值;第六建立单元,所述第六建立单元用于根据所述标签数据和所述标签的权重值,完成定性标签计算,建立数据归纳分析标签层。优选的,所述第四建立单元包括:第一预测单元,所述第一预测单元用于根据所述标签数据,通过K-means无监督学习算法,对所述科研用户的标签数据进行分类预测;第五获得单元,所述第五获得单元用于获得所述分类预测的输出结果;第七建立单元,所述第七建立单元用于根据所述输出结果,建立所述应用决策支撑标签层。优选的,所述第一输出单元包括:第二输出单元,所述第二输出单元用于将所述输出结果作为所述多级科研用户学术画像模型的输入数据,通过多维度json概率模型输出格式,通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像;第六获得单元,所述第六单元用于将所述科研用户的学术画像按照时间片段进行归类存储,获得不同时期的用户画像文件,包括用户的长期全景画像和短期兴趣画像。第三方面,本申请实施例还提供了一种学术画像模型的构建装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;根据所述科研用户原始数据层,建立所述多级本文档来自技高网...

【技术保护点】
1.一种学术画像模型的构建方法,其特征在于,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。

【技术特征摘要】
1.一种学术画像模型的构建方法,其特征在于,所述方法包括:获得科研用户与参加的科研活动、产出科研成果相关的数据信息;根据所述数据信息,构建多级科研用户学术画像模型构架,其中,所述多级科研用户学术画像模型构架包括属性维度库和标签库;根据所述多级科研用户学术画像模型构架,建立多级科研用户学术画像模型的用户原始数据层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层;根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层;根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层;通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像。2.如权利要求1所述的方法,其特征在于,所述用户原始数据层包括:所述科研用户的基本信息维度数据;所述科研用户的科研活动行为日志数据;所述科研用户的科研成果产出数据;所述科研用户的补充数据。3.如权利要求1所述的方法,其特征在于,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的粗粒度抽取标签层,包括:根据所述科研用户原始数据层中的基本信息、科研行为日志、科研成果产出数据,采用统计分析方法,获得所述科研用户的初步标签聚类;根据所述科研用户的初步标签聚类,完成定量标签计算,建立粗粒度抽取标签层。4.如权利要求1所述的方法,其特征在于,所述根据所述科研用户原始数据层,建立所述多级科研用户学术画像模型的数据归纳分析标签层,包括:对所述科研用户的原始数据层进行统计分析,获得所述标签库中标签数据的权重值;根据所述标签数据和所述标签的权重值,完成定性标签计算,建立数据归纳分析标签层。5.如权利要求1所述的方法,其特征在于,所述根据所述粗粒度抽取标签层和所述数据归纳分析标签层,建立所述多级科研用户学术画像模型的应用决策支撑标签层,包括:根据所述标签数据,通过K-means无监督学习算法,对所述科研用户的标签数据进行分类预测;获得所述分类预测的输出结果;根据所述输出结果,建立所述应用决策支撑标签层。6.如权利要求5所述的方法,其特征在于,所述通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像,包括:将所述输出结果作为所述多级科研用户学术画像模型的输入数据,通过多维度json概率模型输出格式,通过所述多级科研用户学术画像模型,逐层输出科研用户的学术画像;将所述科研用户的学术画像按照时间片段进行归类存储,获得不同时期的用户画像文件,包括用户的长期全景画像和短期兴趣画像。7.一种学术画像模型的构建装置,其特征在于,所述装置包括:第一获得单元,所述...

【专利技术属性】
技术研发人员:谢靖孔贝贝钱力师洪波
申请(专利权)人:中国科学院文献情报中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1