The application provides a method and system for visualizing group membership data. Among them, the visualization method is applied to a fraudulent event detection system, including the following steps: obtaining a set of data sets of a group of data, including user information, IP address, event type, event origin, event response party, and one or more of the event occurrence times; from the data. The features determine the target features; and the members of the groups are associated according to the type of events described, and are represented in the output display interface with a point line graph; the points and / or lines are used to characterize the identified target features. By presenting the data sets of groups in the detection process of fraudulent events, the data features of the group in the detection of fraudulent events are displayed in a variety of relational interfaces, which is beneficial to the field experts and algorithm experts to evaluate the detection algorithms of the fraud detection system. Evaluation and revision.
【技术实现步骤摘要】
群组成员关系数据可视化方法及系统
本申请涉及计算机处理
,特别是涉及一种群组成员关系数据可视化方法及系统。
技术介绍
在线欺诈已经是众人熟知的当今互联网黑暗面了,它每年都会在世界范围内造成不可估量的损失。2015年,互联网犯罪投诉中心接到了全世界范围内的百万级别的关于欺诈问题的投诉,而网上欺诈每年也会在世界范围内造成几十亿的经济损失,欺诈用户通常而言会从帮忙推销某个具体商品,或者散布垃圾信息中得到报酬。在互联网金融中,欺诈用户利用假身份来申请贷款、用他们盗取的信用卡购买商品、甚至进行洗钱等非法活动。因此,在互联网商业场景中,找到合适的反欺诈算法变得越发关键,这一需求也与日俱增。尽管如今有很多方法来识别互联网上的欺诈,但是受所构建的欺诈事件检测系统的限制,所筛选出的对应欺诈嫌疑人的数据的可信性需要后续大量的人力验证,例如,平台监管人员需逐个排查验证。这使得欺诈事件检测系统中比如算法参数的修订、数据特征优先级的设计、算法模型选取等,不仅需要算法专家的软件设计,更需要领域专家的参与。因此,提高欺诈识别算法的透明度能有效改进欺诈事件检测准确率,以如何实现数据的可视化为本领域亟待解决的问题。
技术实现思路
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种群组成员关系数据可视化方法及系统,用于解决现有技术中欺诈识别算法可视化的问题。为实现上述目的及其他相关目的,本申请的第一方面提供一种群组数据可视化方法,应用于一欺诈事件检测系统中,包括以下步骤:获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间中的 ...
【技术保护点】
1.一种群组数据可视化方法,应用于一欺诈事件检测系统中,其特征在于,包括以下步骤:获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间中的一种或多种;从所述数据特征中确定目标特征;以及依据所述事件类型将所述群组的成员进行关联,并在输出的显示界面中用点线图进行表征;其中,所述点和/或线用于表征所确定的目标特征。
【技术特征摘要】
1.一种群组数据可视化方法,应用于一欺诈事件检测系统中,其特征在于,包括以下步骤:获取一个群组的数据集,所述数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方、及事件发生时间中的一种或多种;从所述数据特征中确定目标特征;以及依据所述事件类型将所述群组的成员进行关联,并在输出的显示界面中用点线图进行表征;其中,所述点和/或线用于表征所确定的目标特征。2.根据权利要求1所述的群组数据可视化方法,其特征在于,所述点的颜色和/或形状用于表征所述事件类型的事件发起源和事件响应方;所述线表征群组成员之间的关联,所述线的颜色和/或形状用于表征所确定的目标特征。3.根据权利要求1所述的群组数据可视化方法,其特征在于,还包括在所述显示界面中点线图的一侧以文本框的方式显示群组信息、用户信息、事件信息、以及预测信息中的至少一种的步骤。4.根据权利要求1所述的群组数据可视化方法,其特征在于,所述获取一个群组的数据集的步骤包括:获取由多个网络用户组成集群的操作日志;从所述多个网络用户的操作日志中确定至少一个数据特征,并分析所述操作日志中至少一组数据特征的相似度以确定所述群组;以及获取所述群组的数据集。5.根据权利要求1或4所述的群组数据可视化方法,其特征在于,还包括显示至少一个群组界面的步骤,所述群组界面中的群组大小以显示的几何图形大小进行表征。6.根据权利要求1或4所述的群组数据可视化方法,其特征在于,还包括显示一个群组的数据集的界面的步骤,所述群组的数据集的数据特征包括用户信息、IP地址、事件类型、事件发起源、事件响应方,及事件发生时间中的至少二者数据特征,在所述群组数据集的界面中,所述群组数据集经分组后排序显示。7.根据权利要求1或4所述的群组数据可视化方法,其特征在于,还包括显示所述群组的数据集的特征分布的界面的步骤:选择一个所述群组,并从所述群组的数据集中确定至少一个数据特征,统计所述确定的至少一个数据特征在所述群组及集群中的特征分布;以及显示所述特征分布的直方图及对应所述直方图在整个集群直方图中的分布对比图。8.根据权利要求1或4所述的群组数据可视化方法,其特征在于,还包括显示多个群组的数据集的特征分布的界面的步骤:由多个网络用户组成的集群中确定多个群组,分别用不同形状、图标、标签和/或颜色表征所述多个群组的不同;从所述多个群组的数据集中确定至少一个数据特征;基于所述至少一个数据特征分析各该群组中每两个网络用户之间的相对信息熵作为度量所述每两个网络用户之间的相似程度;以及输出显示界面,在所述界面中,用形状、图标、和/或标签表征网络用户,用不同颜色表征所述多个群组的不同,用显示的距离表征每一群组中两个网络用户之间的相似程度。9.根据权利要求1所述的群组数据可视化方法,其特征在于,所述事件类型包括网络用户的关注、点赞、评论、馈赠、登录、登出、更新状态、注册、修改信息中的至少一者。10.一种计算机设备,其特征在于,包括:处理器;在所述处理器上执行的呈现引擎,所述呈现引擎用于执行如权利要求1-9任一项所述的群组数据可视化方法。11...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。