一种基于大数据实时分析的人员画像分析方法技术

技术编号:27741836 阅读:21 留言:0更新日期:2021-03-19 13:35
本发明专利技术涉及大数据分析技术领域,提供一种基于大数据实时分析的人员画像分析方法,包括:步骤100,获取海量的人员静态数据和人员动态数据的样本,按照自然属性、行为属性、习惯爱好、人员关系四个标签维度将数据分类,建立人员画像标签模型;步骤200,获取待分析人员的人员静态数据和人员动态数据,计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案;步骤300,计算每个待分析人员的风险值;步骤400,通过关键字检索目标人员的人员画像标签和/或风险值,获取该目标人员的整体人员画像。本发明专利技术能够对人员静态数据和人员动态数据进行精准分析、评估,得到人员画像标签,能够提升人员分析的实时性和全面性。

【技术实现步骤摘要】
一种基于大数据实时分析的人员画像分析方法
本专利技术涉及大数据分析
,尤其涉及一种基于大数据实时分析的人员画像分析方法。
技术介绍
目前社区流动人口持续增长,社区出入人员流动性大,人员身份难掌握,市场上现有方案是在信息采集的基础上建立人员信息档案,提供人员信息查询功能。现有社区安防领域,对于人员的管理,现有方案一般是通过采集人员的静态数据和动态数据,综合起来建立人员档案,包括人员基本信息、人员社区活动数据等,便于后续查询。这种做法停留于数据的简单记录和查询,没有充分挖掘数据的价值,对于人的理解停留于表面,无法深刻理解人的多维度属性。
技术实现思路
本专利技术主要解决现有的社区安防管理技术对人的描述和评估停留于静态数据,无法做到动态实时的分析,提出一种基于大数据实时分析的人员画像分析方法,以达到对人员静态数据和人员动态数据进行精准分析、评估,得到人员画像标签,能够提升人员分析的实时性和全面性。本专利技术提供了一种基于大数据实时分析的人员画像分析方法,包括以下过程:步骤100,获取海量的人员静态数据和人员动态数据的样本,按照自然属性、行为属性、习惯爱好、人员关系四个标签维度将数据分类,建立人员画像标签模型;步骤200,获取待分析人员的人员静态数据和人员动态数据,计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案,具体包括步骤201至步骤205:步骤201,获取待分析人员的人员静态数据和人员动态数据,并根据人员静态数据确定该待分析人员的唯一标识;步骤202,利用流式实时分析处理技术,实时的将待分析人员的人员动态数据按照自然属性、行为属性、习惯爱好、人员关系四个标签维度分类放入数据管道kafka中,并抽取待分析人员的唯一标识,将唯一标识加入到累加器中广播到数据管道kafka中;步骤203,从数据管道kafka中批量取出待分析人员的唯一标识对应的人员动态数据,将该人员动态数据与数据库中的人员画像标签模型进行匹配,当人员动态数据满足人员画像标签模型中的一个或多个人员画像标签时,则该待分析人员获得该人员画像标签;步骤204,将待分析人员的人员静态数据、人员动态数据、人员画像标签合并存入大数据搜索引擎中;步骤205,按照步骤201至步骤204的方法,依次计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案。进一步的,所述自然属性的人员画像标签包括但不限于:男、女、国籍;行为属性的人员画像标签包括但不限于:昼伏夜出、步行族、出行频繁、开车族、正常起居、正常出行、宅居;习惯爱好的人员画像标签包括但不限于:门卡开门族、APP开门族、远程开门族、AI开门族、其他开门族;社会关系的人员画像标签包括但不限于:与家人同住、群居、正常社交、独居、普通家庭、不喜欢社交、与租客同住、丁克家族。进一步的,在步骤200之后,还包括:步骤300,利用以下公式计算每个待分析人员的风险值:R=score1*weight1+score2*weight2+.....+scoren*weightn其中,R表示风险值,score表示标签分数,weight表示标签权重,n表示标签数。进一步的,在步骤300之后,还包括:步骤400,通过关键字检索目标人员的人员画像标签和/或风险值,获取该目标人员的整体人员画像。本专利技术提供的一种基于大数据实时分析的人员画像分析方法,与现有技术相比具有以下优点:1、以社区采集的海量人员静态数据和人员动态数据为样本,按照自然属性、行为属性、习惯爱好、人员关系等维度建立人员画像标签模型,提升了人员分析的维度和深度,能够对社区人员进行全方位的人员画像评估;2、由于是通过分析人员动态数据建立的人员画像标签,人员动态数据随着时间不断产生,对人员画像标签会随着时间不断更新,极大提升了人员分析的实时性和有效性;3、基于多维度数据分析得到的人员画像标签,使用标签加权公式,计算人员风险值,增加了人员评估的量化指标,可通过人员风险值快速判断潜在风险,提升了安防风险评估的效率。附图说明图1是本专利技术提供的基于大数据实时分析的人员画像分析方法的实现流程图;图2是本专利技术提供的计算人员画像标签过程的实现流程图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。如图1所示,本专利技术实施例提供的基于大数据实时分析的人员画像分析方法,包括:步骤100,获取海量的人员静态数据和人员动态数据的样本,按照自然属性、行为属性、习惯爱好、人员关系四个标签维度将数据分类,建立人员画像标签模型,并将人员画像标签模型存入数据库中。人员静态数据为人员不随时间变化的基本信息,包括但不限于姓名、年龄、性别、住址等;人员动态数据为随着时间不断变化新增的数据,包括但不限于门禁通行记录、人脸抓拍记录、车辆通行记录、手机电围记录等。人员画像标签,即人员信息标签化,完美地抽象出一个人员的信息全貌,核心工作是为人员打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,也可以做数据挖掘工作:利用关联规则计算,利用聚类算法分析等。大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解”人。当计算机具备这样的能力后,在搜索引擎等应用领域,能进一步提升精准度和效率。本实施例按照自然属性、行为属性、习惯爱好、社会关系四个维度,分类建立人员画像标签。自然属性的人员画像标签包括但不限于:男、女、国籍等。行为属性的人员画像标签包括但不限于:昼伏夜出、步行族、出行频繁、开车族、正常起居、正常出行、宅居等。习惯爱好的人员画像标签包括但不限于:门卡开门族、APP开门族、远程开门族、AI开门族、其他开门族等。社会关系的人员画像标签包括但不限于:与家人同住、群居、正常社交、独居、普通家庭、不喜欢社交、与租客同住、丁克家族等。步骤200,获取待分析人员的人员静态数据和人员动态数据,计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案。如图2所示,步骤200具体包括如下步骤201至步骤206:步骤201,获取待分析人员的人员静态数据和人员动态数据,并根据人员静态数据确定该待分析人员的唯一标识。其中,所述唯一标识包括但不限于人、房、车、手机信息。所述唯一标识能够确认人员的身份。人员静态数据存入静态库,人员动态数据存入动态库,由于人员动态数据中包含人员身份信息,因此使用唯一标识可找到静态库和动态库中对应的该人员的所有数据。步骤202,利用流式实时分析处理技术,实时的将待分析人员的人员动态数据本文档来自技高网...

【技术保护点】
1.一种基于大数据实时分析的人员画像分析方法,其特征在于,包括以下过程:/n步骤100,获取海量的人员静态数据和人员动态数据的样本,按照自然属性、行为属性、习惯爱好、人员关系四个标签维度将数据分类,建立人员画像标签模型;/n步骤200,获取待分析人员的人员静态数据和人员动态数据,计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案,具体包括步骤201至步骤205:/n步骤201,获取待分析人员的人员静态数据和人员动态数据,并根据人员静态数据确定该待分析人员的唯一标识;/n步骤202,利用流式实时分析处理技术,实时的将待分析人员的人员动态数据按照自然属性、行为属性、习惯爱好、人员关系四个标签维度分类放入数据管道kafka中,并抽取待分析人员的唯一标识,将唯一标识加入到累加器中广播到数据管道kafka中;/n步骤203,从数据管道kafka中批量取出待分析人员的唯一标识对应的人员动态数据,将该人员动态数据与数据库中的人员画像标签模型进行匹配,当人员动态数据满足人员画像标签模型中的一个或多个人员画像标签时,则该待分析人员获得该人员画像标签;/n步骤204,将待分析人员的人员静态数据、人员动态数据、人员画像标签合并存入大数据搜索引擎中;/n步骤205,按照步骤201至步骤204的方法,依次计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案。/n...

【技术特征摘要】
1.一种基于大数据实时分析的人员画像分析方法,其特征在于,包括以下过程:
步骤100,获取海量的人员静态数据和人员动态数据的样本,按照自然属性、行为属性、习惯爱好、人员关系四个标签维度将数据分类,建立人员画像标签模型;
步骤200,获取待分析人员的人员静态数据和人员动态数据,计算所有待分析人员的人员画像标签,并在大数据搜索引擎中建立人员档案,具体包括步骤201至步骤205:
步骤201,获取待分析人员的人员静态数据和人员动态数据,并根据人员静态数据确定该待分析人员的唯一标识;
步骤202,利用流式实时分析处理技术,实时的将待分析人员的人员动态数据按照自然属性、行为属性、习惯爱好、人员关系四个标签维度分类放入数据管道kafka中,并抽取待分析人员的唯一标识,将唯一标识加入到累加器中广播到数据管道kafka中;
步骤203,从数据管道kafka中批量取出待分析人员的唯一标识对应的人员动态数据,将该人员动态数据与数据库中的人员画像标签模型进行匹配,当人员动态数据满足人员画像标签模型中的一个或多个人员画像标签时,则该待分析人员获得该人员画像标签;
步骤204,将待分析人员的人员静态数据、人员动态数据、人员画像标签合并存入大数据搜索引擎中;
步骤205,按照步骤201至步骤204的方法,依次计算所...

【专利技术属性】
技术研发人员:王长忠许宏达黄志道张仁庆
申请(专利权)人:大连源动力科技有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1