一种数据风险识别方法及相关装置制造方法及图纸

技术编号:32435145 阅读:62 留言:0更新日期:2022-02-24 19:07
本申请公开了一种数据风险识别方法,包括:对获取到的交易数据进行组织交易关系图谱构建,得到交易关系图谱;基于图算法对交易关系图谱进行社区挖掘处理,得到多个交易社区;基于交易信息对多个交易社区进行风险标记,得到风险交易社区数据。通过先对交易数据进行组织交易关系图谱构建,得到交易关系图谱,基于该交易关系图谱进行社区挖掘,得到多个交易社区,最后基于交易信息对挖掘出的交易社区进行风险标记,得到存在风险的风险交易社区数据,实现了基于图算法的风险挖掘处理,而不是通过人工的方式进行风险识别,提高了数据风险识别的准确性和精度。本申请还提供一种数据风险识别装置、服务器以及计算机可读存储介质,具有以上有益效果。以上有益效果。以上有益效果。

【技术实现步骤摘要】
一种数据风险识别方法及相关装置


[0001]本申请涉及数据处理
,特别涉及一种数据风险识别方法、数据风险识别装置、服务器以及计算机可读存储介质。

技术介绍

[0002]随着信息技术的不断发展,可以对数据进行更加智能的数据处理操作。例如,智能识别出符合某种特征的数据,或者是对数据进行自然语言识别。进一步的,会提高实际生产操作中对数据进行操作的效率,提高整体的生产效率。
[0003]相关技术中,一种是通过业务专家对出口企业的发票数据进行分析,找出出口企业的上游是否存在问题,从而判断出口企业是否有骗税行为。另一种是通过机器学习的方法,通过构造有问题的出口企业和正常企业的训练集,训练机器学习模型,利用机器学习模型来判断出口企业是否有骗税行为。但是,通过专家去分析出口企业的数据耗时费力,且过度依赖于专家的水平。此外,通过机器学习方法虽然能提升效率,但是在训练的集的获取以及模型的可解释性方面效果较差,在查处企业风险时需要提供证据链。降低了对数据风险进行识别的准确性。
[0004]因此,如何提高对数据风险进行识别的准确性是本领域技术人员本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据风险识别方法,其特征在于,包括:对获取到的交易数据进行组织交易关系图谱构建,得到交易关系图谱;基于图算法对所述交易关系图谱进行社区挖掘处理,得到多个交易社区;基于交易信息对所述多个交易社区进行风险标记,得到风险交易社区数据。2.根据权利要求1所述的数据风险识别方法,其特征在于,对获取到的交易数据进行组织交易关系图谱构建,得到交易关系图谱,包括:基于对象规则对所述获取到的交易数据进行筛选,得到多个目标对象;基于构建规则对所述多个目标对象进行组织交易关系图谱构建,得到所述交易关系图谱。3.根据权利要求1所述的数据风险识别方法,其特征在于,基于图算法对所述交易关系图谱进行社区挖掘处理,得到多个交易社区,包括:基于连通社区算法对所述交易关系图谱进行社区挖掘处理,得到所述多个交易社区。4.根据权利要求1所述的数据风险识别方法,其特征在于,基于图算法对所述交易关系图谱进行社区挖掘处理,得到多个交易社区,包括:基于louvain算法对所述交易关系图谱进行社区挖掘处理,得到所述多个交易社区。5.根据权利要求1所述的数据风险识别方法,其特征在于,基于交易信息对所述多个交易社区进行风险标记,得到风险交易社区数据,包括:获取风险规则模型;基于...

【专利技术属性】
技术研发人员:陈鹏飞沈懿忱刘子星王培勇杨袁伟
申请(专利权)人:税友信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1