【技术实现步骤摘要】
业务分析方法、装置及电子设备
本专利技术涉及互联网的
,尤其是涉及一种业务分析方法、装置及电子设备。
技术介绍
随着互联网技术的高速发展,产生了巨量数据,数据之间产生复杂的关联关系。上述业务场景涉及一种个体为主体,各种属性为关联的网状关系图。通常将主体和相关属性作为节点,构建网状结构图(这种图中,主体之间均由属性节点进行关联,结构一致)在网状结构图基础上进行社区发现,得到社区网络图,然后再对社区网络图中的每个社区进行业务分析。但是有些属性表象不一,实质是有关联关系的,无法在图中建立明确的属性节点,如果直接将属性节点显示在图中,会丢失很多关联关系,不符合实际。例如:北京市西城区阳光大厦与北京市西城区西直门外大街112号两个地址,从文字表述上看完全不一样,但实质是同一个地方。如果将这类表象不一但又有关联关系的属性节点,通过模糊匹配进行关联,形成主体之间的关联关系,同时主体之间通过其他属性节点也建立了关联关系,这样构建出来的图为异构图(即主体之间通过模糊匹配建立了主体之间直接关联关系,通过其它属性节点也建立了间接关联关系,在图上的表现不是同一种结构)。基于异构图进行社区发现,然后再进行业务分析时,社区发现后常常会得到大量大社区,同时这些大量大社区中边的性质不同,不利于后续的业务分析(因为有些业务分析是基于边权重的算法完成的),导致得到的业务分析结果的准确性差。综上,现有的基于异构图进行的业务分析方法准确性差。
技术实现思路
本专利技术的目的在于提供一种业务分析方法、装置及电子设备,以缓解现有的基于异构图进行的业务分析方法准确性差的技术问题。本专利技术提供的一种 ...
【技术保护点】
1.一种业务分析方法,其特征在于,包括:获取原始数据,并对所述原始数据进行模糊匹配,得到模糊匹配后的数据;对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图;采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据;对每组分组数据进行构图处理,得到社区网络图;通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息。
【技术特征摘要】
1.一种业务分析方法,其特征在于,包括:获取原始数据,并对所述原始数据进行模糊匹配,得到模糊匹配后的数据;对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图;采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据;对每组分组数据进行构图处理,得到社区网络图;通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息。2.根据权利要求1所述的方法,其特征在于,对所述原始数据进行模糊匹配,得到模糊匹配后的数据包括:通过字符串对比算法对所述原始数据中的数据进行对比,得到所述原始数据中任意两个原始数据之间的第一匹配估值;将所述第一匹配估值小于第一预设匹配估值阈值的两个原始数据分别与标准数据进行匹配,得到所述两个原始数据之间的第二匹配估值;基于所述第一匹配估值和所述第二匹配估值确定所述原始数据中任意两个原始数据之间的目标匹配估值,其中,所述目标匹配估值为所述第一匹配估值和所述第二匹配估值中较大的匹配估值;结合第二预设匹配估值阈值和所述目标匹配估值对所述原始数据进行匹配估值筛选,进而得到所述模糊匹配后的数据。3.根据权利要求1所述的方法,其特征在于,对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图包括:通过所述模糊匹配后的数据构建无向图;采用弱联通分量算法对所述无向图进行联通块划分,得到多个联通块,其中,每个所述联通块中包括:主体节点、所述主体节点之间的关联关系和所述联通块的标识号;基于每个所述联通块中的标识号生成属性编号,并将生成的所述属性编号作为其对应的联通块的虚拟属性节点;将每个所述联通块中的每个主体节点与其对应的虚拟属性节点进行连接,并去除所述主体节点之间的连线,得到所述二分图。4.根据权利要求1所述的方法,其特征在于,采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据包括:反复执行以下步骤,直至得到的所述多组分组数据满足预设要求为止,其中,所述预设要求包括:所述多组分组数据中每组分组数据的节点数不大于预设阈值,或者,所述多组分组数据中每组分组数据的节点数不再变化:按照数据处理规则对所述二分图所对应的数据进行数据处理,得到处理后的数据;通过社区发现算法对所述处理后的数据进行社区划分,得到多组分组数据;基于预设数据处理规则库对所述多组分组数据进行分析,根据分析结果确定目标数据处理规则;将所述目标数据处理规则作为所述数据处理规则,并将所述多组分组数据作为所述二分图所对应的数据。5.根据权利要求1所述的方法,其特征在于,通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息包括:确定所述社区网络图与所述预设业务分析规则的符合情况;根据所述符合情况对所述社区网络图进行业务打分,得到所述社区网络图的业务得分;根据所述业务得分确...
【专利技术属性】
技术研发人员:张亮杰,袁力,王亚亮,陈亮,
申请(专利权)人:北京阿尔山金融科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。