当前位置: 首页 > 专利查询>清华大学专利>正文

用户数据可视化方法及系统技术方案

技术编号:18426536 阅读:48 留言:0更新日期:2018-07-12 02:02
本申请提供一种用户数据可视化方法及系统。其中,所述方法包括:获取一个群组的数据集,数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间;其中,数据集的数据特征被确定为不同的决策优先级;显示一个决策树图形以表征群组中所有用户的属性测试过程,其中:显示决策树图形根节点的第一优先级的数据特征及其决策值域;显示决策树图形每一叶节点表征的至少一个用户的最终属性;显示决策树图形每一非叶节点表征的多个用户的当前属性、当前优先级的数据特征及其决策值域;以及显示对应决策树图形中的根节点或每一非叶节点的决策路径,该些决策路径用不同颜色、形状或粗细的线条进行表征。

User data visualization method and system

The application provides a user data visualization method and system. The methods include: obtaining a group of data sets, which include user information, IP address, event type, event origin, event response party, and event occurrence time, in which the data features of the data set are determined as different decision priorities; a decision tree graph is displayed as a table. The attribute testing process of all users in the group, which shows the data features of the first priority of the decision tree graphical root node and its decision range; displays the final attribute of at least one user representing the decision tree graph each leaf node; displays the current attributes of multiple users representing each non leaf node of the decision tree graph. The data features of the current priority and their decision-making range; and the decision paths that display the root nodes or each non leaf node in the corresponding decision tree graphics, which are characterized by different colors, shapes, or thick lines.

【技术实现步骤摘要】
用户数据可视化方法及系统
本申请涉及计算机处理
,特别是涉及一种用户数据可视化方法及系统。
技术介绍
在线欺诈已经是众人熟知的当今互联网黑暗面了,它每年都会在世界范围内造成不可估量的损失。2015年,互联网犯罪投诉中心接到了全世界范围内的百万级别的关于欺诈问题的投诉,而网上欺诈每年也会在世界范围内造成几十亿的经济损失,欺诈用户通常而言会从帮忙推销某个具体商品,或者散布垃圾信息中得到报酬。在互联网金融中,欺诈用户利用假身份来申请贷款、用他们盗取的信用卡购买商品、甚至进行洗钱等非法活动。因此,在互联网商业场景中,找到合适的反欺诈算法变得越发关键,这一需求也与日俱增。尽管如今有很多方法来识别互联网上的欺诈,但是受所构建的欺诈事件检测系统的限制,所筛选出的对应欺诈嫌疑人的数据的可信性需要后续大量的人力验证,例如,平台监管人员需逐个排查验证。这使得欺诈事件检测系统中比如算法参数的修订、数据特征优先级的设计、算法模型选取等,不仅需要算法专家的软件设计,更需要领域专家的参与。因此,提高欺诈识别算法的透明度能有效改进欺诈事件检测准确率,以如何实现数据的可视化为本领域亟待解决的问题。
技术实现思路
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种用户数据可视化方法及系统,用于解决现有技术中欺诈识别算法可视化的问题。为实现上述目的及其他相关目的,本申请的第一方面提供一种用户数据可视化方法,应用于一欺诈事件检测系统中,所述可视化方法包括以下步骤:获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间;其中,所述数据集的数据特征被确定为不同的决策优先级;显示一个决策树图形以表征所述群组中所有用户的属性测试过程,其中:显示所述决策树图形根节点的第一优先级的数据特征及其决策值域;显示所述决策树图形每一叶节点表征的至少一个用户的最终属性;显示所述决策树图形每一非叶节点表征的多个用户的当前属性、当前优先级的数据特征及其决策值域;以及显示对应所述决策树图形中的根节点或每一非叶节点的决策路径,该些决策路径用不同颜色、形状或粗细的线条进行表征。本申请第二方面提供一种计算机设备,包括:处理器;在所述处理器上执行的呈现引擎,所述呈现引擎用于执行如上任一项所述的用户数据可视化方法。本申请第三方面提供一种用户数据可视化系统,包括:获取模块,用于获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间;其中,所述数据集的数据特征被确定为不同的决策优先级;以及显示模块,用于显示一个决策树图形以表征所述群组中所有用户的属性测试过程,其中,显示所述决策树图形根节点的第一优先级的数据特征及其决策值域;显示所述决策树图形每一叶节点表征的至少一个用户的最终属性;显示所述决策树图形每一非叶节点表征的多个用户的当前属性、当前优先级的数据特征及其决策值域;以及显示对应所述决策树图形中的根节点或每一非叶节点的决策路径,该些决策路径用不同颜色、形状或粗细的线条进行表征。本申请在第四方面提供一种客户端,通过网络连接一服务端,其特征在于,所述客户端基于发送请求以登录所述服务端执行上述任一项所述的用户数据可视化方法的步骤。本申请在第五方面提供一种服务器,通过网络连接一客户端,其特征在于,所述服务器基于所述客户端执行请求的操作,向所述客户端发送上述任一项所述的用户数据可视化方法的过程并通过所述客户端显示执行结果。本申请在第六方面提供一种浏览器,通过网络连接一服务端,其特征在于,所述浏览器基于发送请求以登录所述服务端执行所述任一项所述的用户数据可视化方法的步骤。本申请在第七方面提供一种计算机可读存储介质,存储有数据可视化计算机程序,其特征在于,所述数据可视化计算机程序被执行时实现上述任一项所述用户数据可视化方法的步骤。如上所述,本申请的用户数据可视化方法及系统,具有以下有益效果:通过将欺诈事件检测过程中所确定群组用户分组过程、数据特征分布、分类列表等方式予以呈现,实现了将欺诈事件检测期间所分群组以多种关系界面进行展示,有利于领域专家和算法专家对欺诈事件检测系统的检测算法进行评估和修订。附图说明图1显示为本申请在一实施例中的用户数据可视化方法流程图。图2显示为本申请所提供的一种实施方式以获取一个群组数据集的流程图。图3显示为本申请在一实施例中显示的包含多个群组的界面。图4显示为本申请在一实施例中显示的一个群组用户决策树图形的示意图。图5显示为本申请在一实施例中显示决策树图形中还包括分类至各节点的用户数量的显示界面。图6显示为本申请在一实施例中显示左侧为目标用户在时间轴上的操作日志、在右侧显示群组决策树图形的界面示意图。图7显示为本申请在一实施例中显示的一个群组的数据集的列表界面示意图。图8显示为本申请在一实施例中显示的一个群组中注册时间维度的信息熵在网络集群中的特征分布的界面示意图。图9显示为本申请在一实施例中显示所述群组的数据集的特征分布的界面的流程图。图10显示为本申请在一实施例中显示多个群组在集群中分布的步骤流程图。图11显示为本申请在一实施例中显示多个群组在集群中分布界面。图12显示为本申请计算机设备在一实施例中的架构示意图。图13显示为本申请所提供的用户数据可视化系统的模块结构示意图。具体实施方式以下由特定的具体实施例说明本申请的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本申请的其他优点及功效。在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。在欺诈事件检测技术中,领域专家为欺诈事件识别的核心技术提供数据分类的经验和分类结果准确性的需求,但算法架构本身及算法中的参数并不是他们所熟知的。领域专家由于无从得到检测期间对数据分类的方式,当利用欺诈事件检测系统得到欺诈事件检测结果时,领域专家除了对检测结果进行验证之外,无从判断所得到的检测结果的准确性。为了提高欺诈事件检测系统的准确性,本申请提供一种应用于欺诈事件检测系统的用户数据可视化方法,将欺诈事件检测系统中经分类得到的群组及其数据集以可视化的方式展示给算法专家和领域专家,使得不同的领域专家或算法专家通过多种交互式手段来探索各种欺诈行为,并能本文档来自技高网...

【技术保护点】
1.一种用户数据可视化方法,应用于一欺诈事件检测系统中,其特征在于,包括以下步骤:获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间;其中,所述数据集的数据特征被确定为不同的决策优先级;显示一个决策树图形以表征所述群组中所有用户的属性测试过程,其中:显示所述决策树图形根节点的第一优先级的数据特征及其决策值域;显示所述决策树图形每一叶节点表征的至少一个用户的最终属性;显示所述决策树图形每一非叶节点表征的多个用户的当前属性、当前优先级的数据特征及其决策值域;以及显示对应所述决策树图形中的根节点或每一非叶节点的决策路径,该些决策路径用不同颜色、形状或粗细的线条进行表征。

【技术特征摘要】
1.一种用户数据可视化方法,应用于一欺诈事件检测系统中,其特征在于,包括以下步骤:获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间;其中,所述数据集的数据特征被确定为不同的决策优先级;显示一个决策树图形以表征所述群组中所有用户的属性测试过程,其中:显示所述决策树图形根节点的第一优先级的数据特征及其决策值域;显示所述决策树图形每一叶节点表征的至少一个用户的最终属性;显示所述决策树图形每一非叶节点表征的多个用户的当前属性、当前优先级的数据特征及其决策值域;以及显示对应所述决策树图形中的根节点或每一非叶节点的决策路径,该些决策路径用不同颜色、形状或粗细的线条进行表征。2.根据权利要求1所述的用户数据可视化方法,其特征在于,所述显示一个决策树图形以表征所述群组中所有用户的属性测试过程中,在所述决策树图形中的根节点还显示群组用户数量,以及在所述决策树图形的每一非叶节点中还显示当前属性的用户数量。3.根据权利要求1或2所述的用户数据可视化方法,其特征在于,所述显示的决策树图形是经剪枝处理的决策树图形。4.根据权利要求1所述的用户数据可视化方法,其特征在于,还包括以下步骤:确定所述群组中的一个用户作为目标用户;在所述决策树图形的一侧显示一时间轴,用以呈现所述目标用户在所述时间轴上的操作日志。5.根据权利要求1所述的用户数据可视化方法,其特征在于,所述获取一个群组的数据集的步骤包括:获取由多个网络用户组成集群的操作日志;从所述多个网络用户的操作日志中确定至少一个数据特征,并分析所述操作日志中至少一组数据特征的相似度以确定所述群组;以及获取所述群组的数据集。6.根据权利要求1或5所述的用户数据可视化方法,其特征在于,还包括显示至少一个群组界面的步骤,所述群组界面中的群组大小以显示的几何图形大小进行表征。7.根据权利要求1或5所述的用户数据可视化方法,其特征在于,还包括显示一个群组的数据集的界面的步骤,所述群组的数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方,及事件发生时间中的至少二者数据特征,在所述群组数据集的界面中,所述群组数据集经分组后排序显示。8.根据权利要求1或5所述的用户数据可视化方法,其特征在于,还包括显示所述群组的数据集的特征分布的界面的步骤:选择一个所述群组,并从所述群组的数据集中确定至少一个数据特征,统计所述确定的至少一个数据特征在所述群组及集群中的特征分布;以及显示所述特征分布的直方图及对应所述直方图在整个集群直方图中的分布对比图。9.根据权利要求1或5所述的用户数据可视化方法,其特征在于,还包括显示多个群组的数据集的特征分布的界面的步骤:由多个网络用户组成的集群中确定多个群组,分别用不同形状、图标、标签和/或颜色表征所述多个群组的不同;从所述多个群组的数据集中确定至少一个数据特征;基于所述至少一个数据特征分析各该群组中每两个网络用户之间的相对信息熵作为度量所述每两个网络用户之间的相似程度;以及输出显示界面,在所述界面中,用形状、图标、和/或标签表征网络用户,用不同颜色表征所述多个群组的不同,用显示的距离表征每一群组中两个网络用户之间的相似程度。10.根据权利要求1所述的用户数据可视化方法,其特征在于,所述事件类型包括网络用户的关注、点赞、评论、馈赠、登录、登出、更新状态、注册、修改信息中的至少一者。11.一种计算机设备,其特征在于,包括:处理器;在所述处理器上执行的呈现引擎,所述呈现引擎用于执行如权利要求1-10任一项所述的用户数据可视化方法。...

【专利技术属性】
技术研发人员:徐葳孙娇姚期智
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1