业务分析方法、装置及电子设备制造方法及图纸

技术编号:22055572 阅读:28 留言:0更新日期:2019-09-07 15:21
本发明专利技术提供了一种业务分析方法、装置及电子设备,在本发明专利技术的业务分析方法中,对原始数据进行模糊匹配后,构建得到的为二分图(其为同构图,即主体节点之间均由属性节点进行关联,结构一致),进而再采用社区发现迭代算法对二分图进行社区划分,最终基于划分得到的每组分组数据进行构图,得到社区网络图。本发明专利技术的方法是基于二分图进行的社区划分,同时在进行社区划分时,采用的又是社区发现迭代算法,最终得到的每个社区网络图的节点数符合业务分析需求,便于进行后续的业务分析,最终确定的每个社区网络图的业务信息更加准确,缓解了现有的基于异构图进行的业务分析方法准确性差的技术问题。

Business Analysis Method, Device and Electronic Equipment

【技术实现步骤摘要】
业务分析方法、装置及电子设备
本专利技术涉及互联网的
,尤其是涉及一种业务分析方法、装置及电子设备。
技术介绍
随着互联网技术的高速发展,产生了巨量数据,数据之间产生复杂的关联关系。上述业务场景涉及一种个体为主体,各种属性为关联的网状关系图。通常将主体和相关属性作为节点,构建网状结构图(这种图中,主体之间均由属性节点进行关联,结构一致)在网状结构图基础上进行社区发现,得到社区网络图,然后再对社区网络图中的每个社区进行业务分析。但是有些属性表象不一,实质是有关联关系的,无法在图中建立明确的属性节点,如果直接将属性节点显示在图中,会丢失很多关联关系,不符合实际。例如:北京市西城区阳光大厦与北京市西城区西直门外大街112号两个地址,从文字表述上看完全不一样,但实质是同一个地方。如果将这类表象不一但又有关联关系的属性节点,通过模糊匹配进行关联,形成主体之间的关联关系,同时主体之间通过其他属性节点也建立了关联关系,这样构建出来的图为异构图(即主体之间通过模糊匹配建立了主体之间直接关联关系,通过其它属性节点也建立了间接关联关系,在图上的表现不是同一种结构)。基于异构图进行社区发现,然后再进行业务分析时,社区发现后常常会得到大量大社区,同时这些大量大社区中边的性质不同,不利于后续的业务分析(因为有些业务分析是基于边权重的算法完成的),导致得到的业务分析结果的准确性差。综上,现有的基于异构图进行的业务分析方法准确性差。
技术实现思路
本专利技术的目的在于提供一种业务分析方法、装置及电子设备,以缓解现有的基于异构图进行的业务分析方法准确性差的技术问题。本专利技术提供的一种业务分析方法,包括:获取原始数据,并对所述原始数据进行模糊匹配,得到模糊匹配后的数据;对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图;采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据;对每组分组数据进行构图处理,得到社区网络图;通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息。进一步的,对所述原始数据进行模糊匹配,得到模糊匹配后的数据包括:通过字符串对比算法对所述原始数据中的数据进行对比,得到所述原始数据中任意两个原始数据之间的第一匹配估值;将所述第一匹配估值小于第一预设匹配估值阈值的两个原始数据分别与标准数据进行匹配,得到所述两个原始数据之间的第二匹配估值;基于所述第一匹配估值和所述第二匹配估值确定所述原始数据中任意两个原始数据之间的目标匹配估值,其中,所述目标匹配估值为所述第一匹配估值和所述第二匹配估值中较大的匹配估值;结合第二预设匹配估值阈值和所述目标匹配估值对所述原始数据进行匹配估值筛选,进而得到所述模糊匹配后的数据。进一步的,对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图包括:通过所述模糊匹配后的数据构建无向图;采用弱联通分量算法对所述无向图进行联通块划分,得到多个联通块,其中,每个所述联通块中包括:主体节点、所述主体节点之间的关联关系和所述联通块的标识号;基于每个所述联通块中的标识号生成属性编号,并将生成的所述属性编号作为其对应的联通块的虚拟属性节点;将每个所述联通块中的每个主体节点与其对应的虚拟属性节点进行连接,并去除所述主体节点之间的连线,得到所述二分图。进一步的,采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据包括:反复执行以下步骤,直至得到的所述多组分组数据满足预设要求为止,其中,所述预设要求包括:所述多组分组数据中每组分组数据的节点数不大于预设阈值,或者,所述多组分组数据中每组分组数据的节点数不再变化:按照数据处理规则对所述二分图所对应的数据进行数据处理,得到处理后的数据;通过社区发现算法对所述处理后的数据进行社区划分,得到多组分组数据;基于预设数据处理规则库对所述多组分组数据进行分析,根据分析结果确定目标数据处理规则;将所述目标数据处理规则作为所述数据处理规则,并将所述多组分组数据作为所述二分图所对应的数据。进一步的,通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息包括:确定所述社区网络图与所述预设业务分析规则的符合情况;根据所述符合情况对所述社区网络图进行业务打分,得到所述社区网络图的业务得分;根据所述业务得分确定所述社区网络图对应的团伙的业务信息。本专利技术还提供了一种业务分析装置,包括:模糊匹配模块,用于获取原始数据,并对所述原始数据进行模糊匹配,得到模糊匹配后的数据;二分图构建模块,用于对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图;社区划分模块,用于采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据;构图处理模块,用于对每组分组数据进行构图处理,得到社区网络图;业务评价模块,用于通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息。进一步地,所述模糊匹配模块包括:对比单元,用于通过字符串对比算法对所述原始数据中的数据进行对比,得到所述原始数据中任意两个原始数据之间的第一匹配估值;匹配单元,用于将所述第一匹配估值小于第一预设匹配估值阈值的两个原始数据分别与标准数据进行匹配,得到所述两个原始数据之间的第二匹配估值;确定单元,用于基于所述第一匹配估值和所述第二匹配估值确定所述原始数据中任意两个原始数据之间的目标匹配估值,其中,所述目标匹配估值为所述第一匹配估值和所述第二匹配估值中较大的匹配估值;筛选单元,用于结合第二预设匹配估值阈值和所述目标匹配估值对所述原始数据进行匹配估值筛选,进而得到所述模糊匹配后的数据。进一步的,所述二分图构建模块包括:构建单元,用于通过所述模糊匹配后的数据构建无向图;联通块划分单元,用于采用弱联通分量算法对所述无向图进行联通块划分,得到多个联通块,其中,每个所述联通块中包括:主体节点、所述主体节点之间的关联关系和所述联通块的标识号;生成单元,用于基于每个所述联通块中的标识号生成属性编号,并将生成的所述属性编号作为其对应的联通块的虚拟属性节点;连接单元,用于将每个所述联通块中的每个主体节点与其对应的虚拟属性节点进行连接,并去除所述主体节点之间的连线,得到所述二分图。进一步的,所述社区划分模块还用于:反复执行以下步骤,直至得到的所述多组分组数据满足预设要求为止,其中,所述预设要求包括:所述多组分组数据中每组分组数据的节点数不大于预设阈值,或者,所述多组分组数据中每组分组数据的节点数不再变化:按照数据处理规则对所述二分图所对应的数据进行数据处理,得到处理后的数据;通过社区发现算法对所述处理后的数据进行社区划分,得到多组分组数据;基于预设数据处理规则库对所述多组分组数据进行分析,根据分析结果确定目标数据处理规则;将所述目标数据处理规则作为所述数据处理规则,并将所述多组分组数据作为所述二分图所对应的数据。本专利技术还提供了一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述内容中所述的方法的步骤。在本专利技术实施例中,先获取原始数据,并对原始数据进行模糊匹配,得到模糊匹本文档来自技高网...

【技术保护点】
1.一种业务分析方法,其特征在于,包括:获取原始数据,并对所述原始数据进行模糊匹配,得到模糊匹配后的数据;对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图;采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据;对每组分组数据进行构图处理,得到社区网络图;通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息。

【技术特征摘要】
1.一种业务分析方法,其特征在于,包括:获取原始数据,并对所述原始数据进行模糊匹配,得到模糊匹配后的数据;对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图;采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据;对每组分组数据进行构图处理,得到社区网络图;通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息。2.根据权利要求1所述的方法,其特征在于,对所述原始数据进行模糊匹配,得到模糊匹配后的数据包括:通过字符串对比算法对所述原始数据中的数据进行对比,得到所述原始数据中任意两个原始数据之间的第一匹配估值;将所述第一匹配估值小于第一预设匹配估值阈值的两个原始数据分别与标准数据进行匹配,得到所述两个原始数据之间的第二匹配估值;基于所述第一匹配估值和所述第二匹配估值确定所述原始数据中任意两个原始数据之间的目标匹配估值,其中,所述目标匹配估值为所述第一匹配估值和所述第二匹配估值中较大的匹配估值;结合第二预设匹配估值阈值和所述目标匹配估值对所述原始数据进行匹配估值筛选,进而得到所述模糊匹配后的数据。3.根据权利要求1所述的方法,其特征在于,对所述模糊匹配后的数据进行二分图构建,得到与所述模糊匹配后的数据对应的二分图包括:通过所述模糊匹配后的数据构建无向图;采用弱联通分量算法对所述无向图进行联通块划分,得到多个联通块,其中,每个所述联通块中包括:主体节点、所述主体节点之间的关联关系和所述联通块的标识号;基于每个所述联通块中的标识号生成属性编号,并将生成的所述属性编号作为其对应的联通块的虚拟属性节点;将每个所述联通块中的每个主体节点与其对应的虚拟属性节点进行连接,并去除所述主体节点之间的连线,得到所述二分图。4.根据权利要求1所述的方法,其特征在于,采用社区发现迭代算法对所述二分图进行社区划分,得到多组分组数据包括:反复执行以下步骤,直至得到的所述多组分组数据满足预设要求为止,其中,所述预设要求包括:所述多组分组数据中每组分组数据的节点数不大于预设阈值,或者,所述多组分组数据中每组分组数据的节点数不再变化:按照数据处理规则对所述二分图所对应的数据进行数据处理,得到处理后的数据;通过社区发现算法对所述处理后的数据进行社区划分,得到多组分组数据;基于预设数据处理规则库对所述多组分组数据进行分析,根据分析结果确定目标数据处理规则;将所述目标数据处理规则作为所述数据处理规则,并将所述多组分组数据作为所述二分图所对应的数据。5.根据权利要求1所述的方法,其特征在于,通过预设业务分析规则对所述社区网络图进行业务评价,根据评价结果确定所述社区网络图对应的团伙的业务信息包括:确定所述社区网络图与所述预设业务分析规则的符合情况;根据所述符合情况对所述社区网络图进行业务打分,得到所述社区网络图的业务得分;根据所述业务得分确...

【专利技术属性】
技术研发人员:张亮杰袁力王亚亮陈亮
申请(专利权)人:北京阿尔山金融科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1