System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于企业知识图谱的异常企业识别方法及系统技术方案_技高网

一种基于企业知识图谱的异常企业识别方法及系统技术方案

技术编号:40668289 阅读:6 留言:0更新日期:2024-03-18 19:03
本发明专利技术公开了一种基于企业知识图谱的异常企业识别方法及系统,通过外部数据和内部数据整合形成图数据库结构形式的企业知识图谱,通过图数据库结构的形式所构建的企业知识图谱有利于对企业、个人等信息进行整合,为后续企业关联团队的识别提供依据,提升了企业关联团队识别的准确性。通过对企业异常指数进行计算,结合企业关联性,可以准确识别出异常企业,极大地提升了异常企业团队的覆盖度和准确率,从而解决了目前对于异常企业的识别困难、识别不精准的问题。

【技术实现步骤摘要】

本专利技术涉及异常企业识别,具体涉及一种基于企业知识图谱的异常企业识别方法及系统


技术介绍

1、近年来,市场上存在不少组织化、流水化作业的异常企业,威胁着金融市场稳定性。

2、当前,对异常企业进行专项整治已经成为共识,但目前对于异常企业的识别仍存难点。


技术实现思路

1、针对
技术介绍
所提出的问题,本专利技术目的在于提供一种基于企业知识图谱的异常企业识别方法及系统,通过构建企业知识图谱,对企业进行异常企业关联并计算企业团队的异常指数,通过异常指数识别出异常企业,极大地提升了异常企业团队的覆盖度和准确率,从而解决了目前对于异常企业的识别困难、识别不精准的问题。

2、本专利技术通过下述技术方案实现:

3、本专利技术第一方面提供了一种基于企业知识图谱的异常企业识别方法,包括

4、步骤s1、获取外部数据和内部数据,将所述外部数据和所述内部数据形成综合信息表,将所述综合信息表构建为图数据库结构的企业知识图谱;

5、步骤s2、获取和企业经营范围和异常企业经营范围,采用jieba分词对所述企业经营范围和所述异常企业经营范围进行分词并计算,得到异常企业词向量和企业词向量,通过余弦定理对所述企业词向量和所述异常企业词向量进行计算,得到企业异常指数;

6、步骤s3、基于企业知识图谱和企业异常指数对企业关联团队进行划分,生成k个团队;

7、步骤s4、定义关系风险权重,根据所述关系风险权重分别计算k个团队的异常指数,通过对所述异常指数进行筛选,得到异常企业。

8、在上述技术方案中,通过外部数据和内部数据整合形成图数据库结构形式的企业知识图谱,通过图数据库结构的形式所构建的企业知识图谱有利于对企业、个人等信息进行整合,为后续企业关联团队的识别提供依据,提升了企业关联团队识别的准确性。

9、通过对企业异常指数进行计算,结合企业关联性,可以准确识别出异常企业,极大地提升了异常企业团队的覆盖度和准确率,从而解决了目前对于异常企业的识别困难、识别不精准的问题。

10、在一种可选的实施例中,将所述综合信息表构建为图数据库结构的企业知识图谱包括:

11、构建图谱节点,所述图谱节点包括企业节点、客户节点、手机号节点和gps格子节点;

12、构建所述图谱节点的图谱节点属性、所述图谱节点之间的图谱关系以及所述图谱关系的图谱关系属性;

13、将所述图谱节点、所述图谱关系、所述图谱节点属性和所述图谱关系属性写入图数据库构建企业知识图谱。

14、在一种可选的实施例中,所述gps格子节点构建如下:

15、

16、上式中,gpsgrid表示gps格式,longitude表示经度,latitude表示纬度,[]表示取整函数。

17、在一种可选的实施例中,构建所述图谱节点之间的图谱关系包括:

18、以企业为开始节点,以企业为结束节点;以企业为开始节点,以联系方式为结束节点;以企业为开始节点,以gps格子为结束节点;以企业为开始节点,以客户为结束节点;

19、以客户为开始节点,以客户为结束节点;以客户为开始节点,联系方式为结束节点;以客户为开始节点,以企业为结束节点;

20、以手机号为开始节点,以手机号为结束节点。

21、在一种可选的实施例中,采用jieba分词对所述企业经营范围和所述异常企业经营范围进行分词并计算包括:

22、采用jieba分词企业经营范围x=x1,x2,……,xn和异常企业经营范围y=y1,y2,……,yn进行分词,分别得到m个企业关键词和m个异常企业关键词;

23、对所述企业关键词和所述异常企业关键词去重之后取并集,并按照拼音顺序进行排序;

24、分别统计所述企业关键词和所述异常企业关键词和词频,生成企业词向量和异常企业词向量其中,xij表示第i家企业经营范围xi包含第j个单词的数量,i=1,2,……,n;j=1,2,……,m。

25、在一种可选的实施例中,通过余弦定理对所述企业词向量和所述异常企业词向量进行计算,得到企业异常指数包括:

26、

27、上式中,si为企业xi的异常指数,i=1,2,……,n。

28、在一种可选的实施例中,基于企业知识图谱和企业异常指数对企业关联团队进行划分,生成k个团队包括:

29、步骤s31、根据所述企业异常指数以由高到低的顺序对企业进行排序,生成原始异常企业序列

30、步骤s32、以所述原始异常企业序列中的第一家企业作为初始节点,在所述企业知识图谱进行四度关联搜索,得到关联图谱,将所述关联图谱作为所述初始节点的关联团队;

31、步骤s33、汇集步骤s32中第一家企业及其关联团队,并将第一家企业及其关联团队从原始异常企业序列中删除,生成新异常企业序列;

32、步骤s34、重复步骤s32和步骤s33直至所述原始异常企业序列中的所有企业划分完成。

33、在一种可选的实施例中,定义关系风险权重包括:

34、根据企业知识图谱中图谱关系的重要程度,定义企业异常指数所对应的关系风险权重为其中,j表示第j个团队,i表示第j个团队拥有i个关联团队,

35、在一种可选的实施例中,根据所述关系风险权重计算多个团队的异常指数包括:

36、

37、上式中,qj表示异常指数,j表示第j个团队,j=1,2,…,k。

38、本专利技术第二方面提供了一种基于企业知识图谱的异常企业识别系统,包括:

39、企业知识图谱构建模块,所述企业知识图谱构建模块用于获取外部数据和内部数据,将所述外部数据和所述内部数据形成综合信息表,将所述综合信息表构建为图数据库结构的企业知识图谱;

40、企业异常指数计算模块,所述企业异常指数计算模块用于获取和企业经营范围和异常企业经营范围,采用jieba分词对所述企业经营范围和所述异常企业经营范围进行分词并计算,得到异常企业词向量和企业词向量,通过余弦定理对所述企业词向量和所述异常企业词向量进行计算,得到企业异常指数;

41、团队划分模块,所述团队划分模块用于基于企业知识图谱和企业异常指数对企业关联团队进行划分,生成k个团队;

42、异常企业筛选模块,所述异常企业筛选模块用于定义关系风险权重,根据所述关系风险权重分别计算k个团队的异常指数,通过对所述异常指数进行筛选,得到异常企业。

43、本专利技术与现有技术相比,具有如下的优点和有益效果:

44、通过外部数据和内部数据整合形成图数据库结构形式的企业知识图谱,通过图数据库结构的形式所构建的企业知识图谱有利于对企业、个人等信息进行整合,为后续企业关联团队的识别提供依据,提升了企业关联团队识别的准确性。

45、通过对企业异常指数进行计算,结合企业关联性,可以准确识别出异常本文档来自技高网...

【技术保护点】

1.一种基于企业知识图谱的异常企业识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,将所述综合信息表构建为图数据库结构的企业知识图谱包括:

3.根据权利要求2所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,所述GPS格子节点构建如下:

4.根据权利要求2所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,构建所述图谱节点之间的图谱关系包括:

5.根据权利要求1所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,采用jieba分词对所述企业经营范围和所述异常企业经营范围进行分词并计算包括:

6.根据权利要求5所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,通过余弦定理对所述企业词向量和所述异常企业词向量进行计算,得到企业异常指数包括:

7.根据权利要求1所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,基于企业知识图谱和企业异常指数对企业关联团队进行划分,生成k个团队包括:

8.根据权利要求1所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,定义关系风险权重包括:

9.根据权利要求8所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,根据所述关系风险权重计算多个团队的异常指数包括:

10.一种基于企业知识图谱的异常企业识别系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于企业知识图谱的异常企业识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,将所述综合信息表构建为图数据库结构的企业知识图谱包括:

3.根据权利要求2所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,所述gps格子节点构建如下:

4.根据权利要求2所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,构建所述图谱节点之间的图谱关系包括:

5.根据权利要求1所述的一种基于企业知识图谱的异常企业识别方法,其特征在于,采用jieba分词对所述企业经营范围和所述异常企业经营范围进行分词并计算包括:

6....

【专利技术属性】
技术研发人员:王萍刘振
申请(专利权)人:四川新网银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1