用户画像生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:19593214 阅读:35 留言:0更新日期:2018-11-28 04:49
本申请涉及一种用户画像生成方法、系统、计算机设备和存储介质。所述方法包括:获取用户数据,用户数据包括用户标识、问诊数据和浏览行为数据;解析问诊数据得到对应的关键词和主题词;根据浏览行为数据获取对应的浏览类目,并计算浏览类目权重,对浏览类目权重进行排序,根据排序结果获取预设数的浏览类目词;根据关键词、主题词和浏览类目词确定中心词,根据中心词生成用户标识对应的用户画像。采用本方法能够提高用户画像生成的精确性。

【技术实现步骤摘要】
用户画像生成方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种用户画像生成方法、装置、计算机设备和存储介质。
技术介绍
用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据,抽象出一个用户的商业全貌作为企业应用大数据技术的基本方式。用户画像为公司或企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。目前,大多获取用户画像的方法都是通过人为的经验进行统计分析从而得到用户的画像,这种方法分析不全面、不准确,从而导致构建的用户画像不能很好的体现用户全貌,无法满足企业找到精准用户的需求。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够有效提高精准性的用户画像生成方法、装置、计算机设备和存储介质。一种用户画像生成方法,该方法包括:获取用户数据,用户数据包括用户标识、问诊数据和浏览行为数据;解析问诊数据得到对应的关键词和主题词;根据浏览行为数据获取对应的浏览类目,并计算浏览类目权重,对浏览类目权重进行排序,根据排序结果获取预设数的浏览类目词;根据关键词、主题词和浏览类目词确定中本文档来自技高网...

【技术保护点】
1.一种用户画像生成方法,所述方法包括:获取用户数据,所述用户数据包括用户标识、问诊数据和浏览行为数据;解析所述问诊数据得到对应的关键词和主题词;根据所述浏览行为数据获取对应的浏览类目,并计算所述浏览类目权重,对所述浏览类目权重进行排序,根据排序结果获取预设数的浏览类目词;根据所述关键词、所述主题词和所述浏览类目词确定中心词,根据所述中心词生成所述用户标识对应的用户画像。

【技术特征摘要】
1.一种用户画像生成方法,所述方法包括:获取用户数据,所述用户数据包括用户标识、问诊数据和浏览行为数据;解析所述问诊数据得到对应的关键词和主题词;根据所述浏览行为数据获取对应的浏览类目,并计算所述浏览类目权重,对所述浏览类目权重进行排序,根据排序结果获取预设数的浏览类目词;根据所述关键词、所述主题词和所述浏览类目词确定中心词,根据所述中心词生成所述用户标识对应的用户画像。2.根据权利要求1所述的方法,其特征在于,获取用户数据,包括获取预设数据库存储的用户历史数据,通过流式数据库获取用户实时数据,根据所述用户历史数据和所述用户实时数据得到用户数据,并对所述用户数据进行数据清洗。3.根据权利要求1所述的方法,其特征在于,解析所述问诊数据得到对应的关键词,包括:解析所述问诊数据得到问诊文本,将所述问诊文本进行分词,并对分词结果进行过滤;根据过滤后得到的词建立候选关键词图,并获取所述候选关键词图中词节点的预设初始权重;循环迭代候选关键词图,直至达到预设条件时,得到词节点权重;对所述词节点权重倒序排序,根据排序结果获取预设数的词作为关键词。4.根据权利要求1所述的方法,其特征在于,解析所述问诊数据得到对应的主题词,包括:解析所述问诊数据得到问诊文本,将所述问诊文本进行分词,并对分词结果进行过滤;根据过滤后得到的词计算每个预设主题的概率,根据所述每个预设主题的概率计算所述每个预设主题对应的词分类;计算所述词分类对每个预设主题的概率,根据所述词分类对每个预设主题的概率得到主题词。5.根据权利要求1所述的方法,其特征在于,根据所述浏览行为数据获取对应的浏览类目,并计算所述浏览类目权重,包括:根据所述浏览行为数据获取对应的浏览类目,根据所述浏览类目获取对应的历史权重;...

【专利技术属性】
技术研发人员:陈贇杨小成沈亚萍柴旭峰
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1