用户特征识别方法、装置、计算设备及计算机存储介质制造方法及图纸

技术编号:28135107 阅读:13 留言:0更新日期:2021-04-21 19:02
本发明专利技术实施例涉及大数据技术领域,公开了一种用户特征识别方法、装置、计算设备及计算机存储介质,该方法包括:采集用户行为数据;根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单;根据所述用户行业知识清单应用多种用户特征识别模型识别并输出用户的个性化特征与需求。通过上述方式,本发明专利技术实施例能够实现自动及时扩充有效行业领域画像识别,全面获知用户各行业偏好特征与潜在需求,提高应用成效与应用领域。提高应用成效与应用领域。提高应用成效与应用领域。

【技术实现步骤摘要】
用户特征识别方法、装置、计算设备及计算机存储介质


[0001]本专利技术实施例涉及大数据
,具体涉及一种用户特征识别方法、装置、计算设备及计算机存储介质。

技术介绍

[0002]随着移动通信技术与互联网的快速发展,通信运营商在生产经营中产生、收集、存储海量的数据信息。如何让数据呈现价值,驱动企业精细化运营?是企业大数据运营亟待解决的问题。然而面对的是一个个冰冷的号码、海量的详单数据以及庞大的文本数据、图片、音频视频等非结构化数据,如何从海量数据中洞察用户需求,发现市场商机,通信运营商们纷纷做了各种尝试,试图通过大数据方法解开数据背后的奥秘,意图清晰地了解用户行为特征。
[0003]目前常用的用户特征识别方法包括:利用挖掘模型识别潜在需求用户,以业务营销目标导向,进行已购买用户的特征分析,利用数据挖掘算法构建潜在识别模型,找出营销潜在目标用户群;利用企业自身运营数据进行用户画像,通过生产经营过程中,收集到的用户基本信息、使用行为、消费历史、触点记录等数据源,提炼业务特征,构建用户的各类标签属性,进行用户画像分析,了解用户特征;收集外部数据与内部数据结合,如收集酒店类号码、餐饮外卖数据等,与企业已有的用户行为数据结合,利用数据分析方法,识别用户的偏好特征;利用互联网公开信息,通过网络爬虫工具,对指定网站的页面信息进行抓取,收集用户的购买信息、商品信息、价格等,根据需要开展特定产品的用户偏好特征分析或市场竞争报告;一些管理咨询公司、调研公司通过设定问卷,以人工外呼方式对圈定用户进行逐个甄别收集。有的企业则通过渠道人员逐个拜访,填写上报的方式了解用户的特征及需求。
[0004]现有用户特征识别技术可使用的数据信息较少,相关联数据无法解读,对用户特征的解读并不全面,导致模型识别的用户特征准确性不高;分析维度单一,一次建模只能获取用户某一个方面的需求,单一维度预判用户对某些行为的倾向性概率,营销人员并不能理解用户的需求,有哪些其他偏好可能。

技术实现思路

[0005]鉴于上述问题,本专利技术实施例提供了一种用户特征识别方法、装置、计算设备及计算机存储介质,克服了上述问题或者至少部分地解决了上述问题。
[0006]根据本专利技术实施例的一个方面,提供了一种用户特征识别方法,所述方法包括:采集用户行为数据;根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单;根据所述用户行业知识清单应用多种用户特征识别模型识别并输出用户的个性化特征与需求。
[0007]在一种可选的方式中,所述采集用户行为数据,包括:采集运营域用户上网的DPI数据、以及用户移动位置数据;采集业务域的用户基本资料数据和账务行为数据,以及交换机上的通话详单数据、短信详单数据、测量报告详单数据。
[0008]在一种可选的方式中,所述根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单之前,包括:通过对所述用户行为数据进行DPI深度解析、网络信息爬取以及分类处理获取与所述用户行为数据对应的带业务标签的事件清单;根据所述带业务标签的事件清单构建行业知识图谱库。
[0009]在一种可选的方式中,所述通过对所述用户行为数据进行DPI深度解析、网络信息爬取以及分类处理获取与所述用户行为数据对应的带业务标签的事件清单,包括:对于通话维度数据,按照爬虫能力估算提取活跃的主叫号码,形成主叫活跃清单,从网站获取所述主叫活跃清单中的号码的互联网标记,形成知识库清单数据;对于非通话维度数据,应用DPI深度解析技术对互联网日志进行解析还原URL,根据所述URL爬取页面内容,解析页面要素形成知识库清单数据;对所述知识库清单数据进行自然语言的分词、分类识别和映射获取与所述用户行为数据对应的所述带业务标签的事件清单。
[0010]在一种可选的方式中,所述根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单,包括:对于可用构建的所述行业知识图谱库进行解读的部分,将所述用户行为数据与所述行业知识图谱库匹配后生成的字段信息进行合并,得到所述用户行业知识清单;对于不可用构建的所述行业知识图谱库进行解读的部分,对所述用户行为数据进行二次DPI深度解析、网络信息爬取以及分类处理,获取带业务标签的事件清单,构成所述用户行业知识清单,同时将所述带业务标签的事件清单增补至所述行业知识图谱库。
[0011]在一种可选的方式中,所述根据所述用户行业知识清单应用多种用户特征识别模型识别并输出用户的个性化特征与需求,包括:将所述用户行业知识清单和用户基本属性制成汇总的标准融合模型;基于输入的所述标准融合模型和所述用户行业知识清单,制成多种算法的标准输入格式;基于所述标准输入格式应用各种算法对所述用户行业知识清单进行运算,识别用户的个性化特征与需求。
[0012]在一种可选的方式中,所述应用各种算法对所述用户行业知识清单进行运算,识别用户的个性化特征与需求,包括:
[0013]应用用户特征识别综合评测算法提炼任一领域内的行业行为特征、基本特征以及用户偏好特征的契合程度,评测出用户在各类行业偏好特征的概率值,其中,用户特征识别综合评测算法至少包括深度神经网络算法、逻辑回归算法以及随机森林算法的其中之一;应用时间序列分析函数捕捉时间序列上的行业知识预设模式和频繁路径,对用户的行为轨迹特征进行分析,识别用户潜在行为特征,作为用户在一领域的动态需求倾向;对用户的通话行为进行分析,生成用户交往圈信息,根据所述用户交往圈信息应用社交发现和社交影响关系算法识别出用户的交往圈与行业特征标记关系,输出用户圈子关系需求。
[0014]根据本专利技术实施例的另一个方面,提供了一种用户特征识别装置,所述装置包括:数据采集单元,用于采集用户行为数据;知识解读单元,用于根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单;特征识别单元,用于根据所述用户行业知识清单应用多种用户特征识别模型识别并输出用户的个性化特征与需求。
[0015]根据本专利技术实施例的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0016]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述用户特征识别方法的步骤。
[0017]根据本专利技术实施例的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行上述用户特征识别方法的步骤。
[0018]本专利技术实施例通过采集用户行为数据;根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单;根据所述用户行业知识清单应用多种用户特征识别模型识别并输出用户的个性化特征与需求,能够实现自动及时扩充有效行业领域画像识别,全面获知用户各行业偏好特征与潜在需求,提高应用成效与应用领域。
[0019]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户特征识别方法,其特征在于,所述方法包括:采集用户行为数据;根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单;根据所述用户行业知识清单应用多种用户特征识别模型识别并输出用户的个性化特征与需求。2.根据权利要求1所述的方法,其特征在于,所述采集用户行为数据,包括:采集运营域用户上网的DPI数据、以及用户移动位置数据;采集业务域的用户基本资料数据和账务行为数据,以及交换机上的通话详单数据、短信详单数据、测量报告详单数据。3.根据权利要求1所述的方法,其特征在于,所述根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单之前,包括:通过对所述用户行为数据进行DPI深度解析、网络信息爬取以及分类处理获取与所述用户行为数据对应的带业务标签的事件清单;根据所述带业务标签的事件清单构建行业知识图谱库。4.根据权利要求3所述的方法,其特征在于,所述通过对所述用户行为数据进行DPI深度解析、网络信息爬取以及分类处理获取与所述用户行为数据对应的带业务标签的事件清单,包括:对于通话维度数据,按照爬虫能力估算提取活跃的主叫号码,形成主叫活跃清单,从网站获取所述主叫活跃清单中的号码的互联网标记,形成知识库清单数据;对于非通话维度数据,应用DPI深度解析技术对互联网日志进行解析还原URL,根据所述URL爬取页面内容,解析页面要素形成知识库清单数据;对所述知识库清单数据进行自然语言的分词、分类识别和映射获取与所述用户行为数据对应的所述带业务标签的事件清单。5.根据权利要求3所述的方法,其特征在于,所述根据行业知识图谱对所述用户行为数据进行知识解读,获取用户行业知识清单,包括:对于可用构建的所述行业知识图谱库进行解读的部分,将所述用户行为数据与所述行业知识图谱库匹配后生成的字段信息进行合并,得到所述用户行业知识清单;对于不可用构建的所述行业知识图谱库进行解读的部分,对所述用户行为数据进行二次DPI深度解析、网络信息爬取以及分类处理,获取带业务标签的事件清单,构成所述用户行业知识清单,同时将所述带业务标签的事...

【专利技术属性】
技术研发人员:蔡韵全东方储晶星傅一平
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1