一种基于领域知识图谱的用户行为分析装置、方法及设备制造方法及图纸

技术编号:33531136 阅读:72 留言:0更新日期:2022-05-19 02:02
本发明专利技术涉及人工智能技术领域,具体公开了一种基于领域知识图谱的用户行为分析装置、方法及设备,包括知识图谱构建单元,基于用户多设备多账户异构结构化数据与非结构化数据进行融合分析,构建知识图谱;行为模式库构建单元,通过分析海量历史案件数据,挖掘涉案人员数据中共同的行为模式构建行为模式库;用户异常分析单元,应用用户数据和行为模式库数据,通过行为规律和行为内容分析,提取多模态特征,训练深度神经网络模型,分析用户指定时间段行为异常概率。本发明专利技术构建的领域知识图谱,提升了数据的协同效率;结合用户数据和历史案件数据,自动化提取多模态特征综合分析,结果更准确且具有说服力,可提高工作人员的工作效率。率。率。

【技术实现步骤摘要】
一种基于领域知识图谱的用户行为分析装置、方法及设备


[0001]本专利技术涉及人工智能
,具体是一种基于领域知识图谱的用户行为分析装置、方法及设备。

技术介绍

[0002]21世纪是互联网和通信技术大发展的时代,电信通讯、网络通讯、搜索浏览、购物消费、资金往来、娱乐视听、出行住宿等领域都极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。在此背景下,包括智能手机、智能手表、平板电脑在内的各类智能终端设备已渗透到人们生活的每个缝隙和角落,支撑着人们生活中各种有意识或无意识的重复且琐碎的活动。
[0003]近年来,以智能手机为代表的电子设备已经成为现代人生活和工作的必备工具,而各类违法犯罪活动也在电子设备中留下了大量的过程数据。在公共安全领域,基于电子物证数据的各种用户行为分析,尤其是用户行为异常分析可以为案件的推进提供重要线索,然而相关数据纷繁复杂,传统人工分析方法耗费大量人工劳动,分析的效率十分低下。
[0004]知识图谱作为一种刻画大规模数据关联的利器,在人的关系与行为分析中应用价值极大。同时,在电子物证领域中,海量历史案件数据的挖掘可以为用户行为异常的判别提供重要思路。开发一种综合电子数据和海量历史案件数据,应用人工智能算法和知识图谱技术,快速自动分析发现用户行为异常的方法和装置。可以极大的提升电子数据的协同利用效率,提高分析的准确率,进而提高相关工作人员的工作效率。

技术实现思路

[0005]本专利技术的目的在于提供一种基于领域知识图谱的用户行为分析装置、方法及设备,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:
[0007]一种基于领域知识图谱的用户行为分析装置,所述装置包括:
[0008]知识图谱构建单元,用于基于用户多设备多账户异构结构化数据与非结构化数据进行融合分析,识别出人与账户的关系以及人与人的关系信息,构建知识图谱;其中,识别人与人的关系信息的步骤包括基于会话上下文信息进行人员关系识别和基于信息流通模式进行人员关系识别;所述知识图谱包括社交关系知识图谱和应用程序使用行为知识图谱;
[0009]行为模式库构建单元,用于通过机器学习算法和数据挖掘算法分析历史案件数据,挖掘涉案人员数据中共同的行为模式,将所述行为模式向审核端发送,接收审核端反馈的行为模式库;
[0010]行为异常分析单元,用于基于所述行为模式库,从行为规律和行为内容两层面提取知识图谱中的多模态特征,训练人工智能算法,分析用户行为异常概率;
[0011]可视化单元,用于显示基于用户全部数据和部分数据分别构建的知识图谱以及用
户行为异常分析单元相关特征及结果;
[0012]存储单元,用于存储用户应用程序使用行为知识图谱和用户社交关系知识图谱、行为模式库和用户行为异常分析特征及结果。
[0013]1、知识图谱构建单元:
[0014]本单元中,所述多个终端设备,具体包含手机、智能手表、平板电脑、计算机等所有电子设备。基于多终端行为数据,根据行为内容和字段含义,按照统一规则进行字段映射,将不同来源的数据统一成结构化数据。统一字段主要包括,设备ID、行为大类、行为细类、应用名称、行为开始时间、行为持续时间、用户ID、联系人账号ID、联系人ID、行为内容、消息类型、行为地理位置、信息是否被删除。
[0015]标记所述结构化数据中用户ID、行为大类、应用名称和联系人ID四个字段为节点,抽取节点中的实体。所述行为大类具体包括:电信通讯、网络通讯、资金往来、购物消费、搜索浏览、娱乐视听、出行住宿和其他行为8类。
[0016]用于构建应用程序使用行为知识图谱的关系抽取,指从数据中抽取(用户,行为类型,应用程序)三元组关系;实体属性抽取,其中应用程序各实体属性为:行为开始时间,行为持续时间,联系人账号ID,行为内容,消息类型,行为地理位置,信息是否被删除。
[0017]基于会话上下文信息进行人员关系识别与信息流通模式进行人员关系识别,其中基于会话上下文信息进行人员关系识别是指,采用自然语言处理技术根据会话上下文分析多人之间的身份信息;其中基于信息流通模式进行人员关系识别是指通过多人间信息传递模式识别多人间的上下位关系。通过将两种人员关系识别方法进行融合使得分析结果更加准确。
[0018]用于构建社交关系知识图谱的关系抽取,指从数据中抽取(用户,联系人)二元组关系;实体属性抽取,其中联系人各实体属性为:行为开始时间,行为持续时间,联系人账号ID,行为内容,消息类型,行为地理位置,信息是否被删除。
[0019]应用自然语言处理中的语义分析方法,分析联系人的账号属性和交互行为内容,发现识别出同一好友在不同应用中的相应账号,实现实体消岐;将应用程序字段中如 ()等符号即解释内容去除,如将“微信(官方版)”转换为“微信”,实现实体名称规范化。进而构建用户应用程序使用行为知识图谱和用户社交关系知识图谱。
[0020]2、行为模式库构建:
[0021]通过机器学习、数据挖掘算法、专家总结等方法分析海量历史案件数据,构建行为模式库,行为模式库包括案件相关人员案前策划准备、案中实施手法、案后隐匿方式等多阶段行为模式。具体的:
[0022]通过分析大量真实历史案件数据,抽取案件特征如案件类型、案件严重程度等信息,涉案人员属性如性别、文化程度、初犯/再犯等信息,涉案人员数据行为模式如案前、案中、案后各阶段共同的行为模式构建行为模式库。
[0023]3、用户行为异常分析单元:
[0024]本单元中包含一种基于人工智能的用户行为异常分析方法,通过分析用户应用程序使用行为知识图谱、用户社交关系知识图谱、历史行为模式库,从行为规律和行为内容两个层面提取多模态特征并训练深度神经网络模型,分析用户行为异常概率。具体行为规律和行为内容的特征内容如下:
[0025]1)行为规律:
[0026]应用机器学习算法,判定用户指定日期应用程序使用行为模式与历史每天应用程序使用行为模式相比是否异常;确定与用户联系最密切的20位好友,应用机器学习算法,判定用户指定分析时间段与其好友的关系与历史相比是否存在异常;通过对比分析,确定该用户指定时间段行为模式与行为模式库中相似案件行为模式的重合比例。综合上述三部分分析结果,为学习到的用户行为规律的特征向量。
[0027]2)行为内容:
[0028]应用深度学习算法,获取用户指定时间段主动行为数据中的文本数据和语音数据,分析数据的情感状态分布情况,获得情感特征向量。
[0029]4、可视化单元,包含:
[0030]1)应用用户全部数据构建的完整的知识图谱和应用指定时间段行为数据构建的知识图谱,可直观展示用户整体的行为规律和指定时间段行为规律是否存在差异;
[0031]2)用户行为异常分析中提取的多模态特征,包含行为规律特征,及行为内容分析所得的情感特征向量。
[0032]3)用户行为异常分析结果,包含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于领域知识图谱的用户行为分析装置,其特征在于,所述装置包括:知识图谱构建单元,用于基于用户多设备多账户异构结构化数据与非结构化数据进行融合分析,识别出人与账户的关系以及人与人的关系信息,构建知识图谱;其中,识别人与人的关系信息的步骤包括基于会话上下文信息进行人员关系识别和基于信息流通模式进行人员关系识别;所述知识图谱包括社交关系知识图谱和应用程序使用行为知识图谱;行为模式库构建单元,用于通过机器学习算法和数据挖掘算法分析历史案件数据,挖掘涉案人员数据中共同的行为模式,将所述行为模式向审核端发送,接收审核端反馈的行为模式库;行为异常分析单元,用于基于所述行为模式库,从行为规律和行为内容两层面提取知识图谱中的多模态特征,训练人工智能算法,分析用户行为异常概率;可视化单元,用于显示基于用户全部数据和部分数据分别构建的知识图谱以及用户行为异常分析单元相关特征及结果;存储单元,用于存储用户应用程序使用行为知识图谱和用户社交关系知识图谱、行为模式库和用户行为异常分析特征及结果。2.根据权利要求1所述的基于领域知识图谱的用户行为分析装置,其特征在于,所述基于会话上下文信息进行人员关系识别的步骤包括采用自然语言处理技术根据会话上下文分析多人之间的身份信息;所述基于信息流通模式进行人员关系识别的步骤包括通过多人间信息传递模式识别多人间的上下位关系。3.根据权利要求1所述的基于领域知识图谱的用户行为分析装置,其特征在于,所述知识图谱构建单元中基于用户多设备多账户异构结构化数据与非结构化数据进行融合分析,识别出人与账户的关系以及人与人的关系信息,构建知识图谱的步骤包括:应用自然语言处理中的语义分析方法,分析联系人的账号属性和交互行为内容,识别出同一好友在不同应用中的相应账号;识别应用程序字段中的解释符号,基于所述解释符号剔除解释性内容;构建用户应用程序使用行为知识图谱和用户社交关系知识图谱。4.根据权利要求1所述的基于领域知识图谱的用户行为分析装置,其特征在于,所述行为模式库构建单元中通过机器学习算法和数据挖掘算法分析历史案件数据,挖掘涉案人员数据中共同的行为模式,将所述行为模式向审核端发送,接收审核端反馈的行为模式库的步骤包括:基于关联规则算法、相似度计算算法和聚类算法分析历史案件特征;其中,所述案件类型、案件级别和涉案人员属性;所述涉案人员属性包括性别、文化程度、初犯/再犯;挖掘不同案件特征和涉案人员属性下各涉案人员多设备行为数据中案前、案中及案后各阶段共同的行为模式;将所述行为模式向审核端发送,接收审核端反馈的行为模式库。5.根据权利要求1所述的基于领域知识图谱的用户行为分析装置,其特征在于,所述行为异常分析单元中基于所述行为模式库,根据行为规律提取...

【专利技术属性】
技术研发人员:王晓林周鹏飞马亮张新壮于静
申请(专利权)人:北京慧辰资道资讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1