一种风险企业识别方法、装置、设备和介质制造方法及图纸

技术编号:36874954 阅读:10 留言:0更新日期:2023-03-15 20:25
本发明专利技术公开了一种风险企业识别方法、装置、设备和介质,由于本发明专利技术中是通过确定与黑名单企业与黑名单企业员工存在二度关联的每个企业和每个企业员工,从企业关系图谱中筛选出有可能的风险企业,根据每个企业在子企业关系图谱中的节点采用向量化表示后的第一向量值,确定第一向量值与黑名单企业和黑名单企业员工分别对应的第二向量的相似度,从而预测出在各方面均高度相似的风险企业,实现了对风险企业的准确识别。企业的准确识别。企业的准确识别。

【技术实现步骤摘要】
一种风险企业识别方法、装置、设备和介质


[0001]本专利技术涉及风险预测
,尤其涉及一种风险企业识别方法、装置、设备和介质。

技术介绍

[0002]随着我国经济的飞速发展,税务监管变得越来越重要,税务监管部门需要精准打击存在税务风险的风险企业,全面挖掘企业税务风险,所以如何识别风险企业就成为一个很有价值的问题。
[0003]现有的一种基于企业进销关系图谱的企业风险识别方法与系统中,其技术方案主要包括三个步骤,第一步是采集目标税务数据,构建企业关系图谱;第二步是采用图查询语句(Gremlin)计算企业进销相似度,筛选进销相似企业,第三步是通过企业的行业属性对比,判断进销相似企业的行业属性是否一致,进而识别风险企业。
[0004]现有技术中仅通过行业属性对比的方式,无法准确地识别出风险企业,因此如何提高风险企业识别的准确度就成为亟待解决的技术问题。

技术实现思路

[0005]本专利技术提供了一种风险企业识别方法、装置、设备和介质,用以解决现有技术中无法准确地识别出风险企业的问题。
[0006]本专利技术提供了一种风险企业识别方法,所述方法包括:
[0007]基于预先构建完成的企业关系图谱,确定属性标签为黑名单企业和黑名单企业员工的每个第一节点及与所述每个第一节点存在二度关联的每个第二节点的子企业关系图谱;
[0008]根据所述子企业关系图谱中所述每个第二节点对应的属性标签及预先保存的风险模型,得到所述风险模型输出的所述子企业关系图谱中属性标签为企业的每个第二节点的第一向量;
[0009]针对所述属性标签为企业的每个第二节点,根据该第二节点的第一向量与预先确定的所述黑名单企业和所述黑名单企业员工分别对应的第二向量,确定该第一向量与每个第二向量的相似度,若任一相似度大于预设的相似度阈值,则确定该第一向量的第二节点对应的企业为风险企业。
[0010]进一步地,所述方法还包括:
[0011]根据识别出每个风险企业对应的每个第一向量,将所述每个风险企业对应的每个第一向量进行归一化处理,得到归一化的每个第一向量;
[0012]按照归一化后的每个第一向量的模值从大到小的顺序,将归一化后的每个第一向量的模值、以及对应的每个第二节点中包含的每个风险企业的标识信息输出。
[0013]进一步地,所述企业关系图谱的构建过程包括:
[0014]根据预先获取的税务数据中的企业的标识信息和企业员工的标识信息,构建关系
图谱中企业和企业员工的节点,将对应的标识信息作为节点标识信息,若任一企业为黑名单信息中的黑名单企业,则将该企业对应的节点的属性标签设置为黑名单企业,否则,将该企业对应的节点的属性标签设置为企业,若任一企业员工为黑名单信息中的黑名单企业员工,则将该企业员工对应的节点的属性标签设置为黑名单企业员工,否则,将该企业员工对应的节点的属性标签设置为企业员工;
[0015]针对所述税务数据中的每个发票信息,根据该发票信息中包含的两个目标企业的标识信息,连接所述两个目标企业的节点;
[0016]根据所述税务数据中目标企业员工与任职企业的信息,连接所述目标企业员工的节点与所述任职企业的节点。
[0017]进一步地,所述根据该发票信息中包含的两个目标企业的标识信息,连接所述两个目标企业的节点包括:
[0018]根据该发票信息中包含的两个目标企业的标识信息和对应保存的预设关键字,其中所述预设关键字包括购买方和销售方,将所述两个目标企业中所述预设关键字为销售方的节点指向所述预设关键字为购买方的节点,将边中所述销售方的节点一侧设置为销项边,将所述边中所述购买方边的节点一侧设置为进项边,并将该发票信息中的交易金额、交易时间以及商品名称作为对应边的属性信息。
[0019]进一步地,所述根据所述税务数据中目标企业员工与任职企业的信息,连接所述目标企业员工的节点与所述任职企业的节点包括:
[0020]根据所述税务数据中目标企业员工的第一标识信息与任职企业的第一标识信息、以及职务信息,在所述关系图谱中连接从所述目标企业员工的节点向所述任职企业的节点,并将所述职务信息作为边的属性信息。
[0021]相应地,本专利技术提供了一种风险企业识别装置,所述装置包括:
[0022]确定模块,用于基于预先构建完成的企业关系图谱,确定属性标签为黑名单企业和黑名单企业员工的每个第一节点及与所述每个第一节点存在二度关联的每个第二节点的子企业关系图谱;
[0023]处理模块,用于根据所述子企业关系图谱中所述每个第二节点对应的属性标签及预先保存的风险模型,得到所述风险模型输出的所述子企业关系图谱中属性标签为企业的每个第二节点的第一向量;
[0024]识别模块,用于针对所述属性标签为企业的每个第二节点,根据该第二节点的第一向量与预先确定的所述黑名单企业和所述黑名单企业员工分别对应的第二向量,确定该第一向量与每个第二向量的相似度,若任一相似度大于预设的相似度阈值,则确定该第一向量的第二节点对应的企业为风险企业。
[0025]进一步地,所述装置包括:
[0026]输出模块,用于根据识别出每个风险企业对应的每个第一向量,将所述每个风险企业对应的每个第一向量进行归一化处理,得到归一化的每个第一向量;按照归一化后的每个第一向量的模值从大到小的顺序,将归一化后的每个第一向量的模值、以及对应的每个第二节点中包含的每个风险企业的标识信息输出。
[0027]进一步地,所述装置包括:
[0028]模型构建模块,用于根据预先获取的税务数据中的企业的标识信息和企业员工的
标识信息,构建关系图谱中企业和企业员工的节点,将对应的标识信息作为节点标识信息,若任一企业为黑名单信息中的黑名单企业,则将该企业对应的节点的属性标签设置为黑名单企业,否则,将该企业对应的节点的属性标签设置为企业,若任一企业员工为黑名单信息中的黑名单企业员工,则将该企业员工对应的节点的属性标签设置为黑名单企业员工,否则,将该企业员工对应的节点的属性标签设置为企业员工;针对所述税务数据中的每个发票信息,根据该发票信息中包含的两个目标企业的标识信息,连接所述两个目标企业的节点;根据所述税务数据中目标企业员工与任职企业的信息,连接所述目标企业员工的节点与所述任职企业的节点。
[0029]进一步地,所述模型构建模块,具体用于根据该发票信息中包含的两个目标企业的标识信息和对应保存的预设关键字,其中所述预设关键字包括购买方和销售方,将所述两个目标企业中所述预设关键字为购买方的节点指向所述预设关键字为销售方的节点,将所述边中所述销售方的节点一侧设置为销项边,将所述边中所述购买方边的节点一侧设置为进项边,并将该发票信息中的交易金额、交易时间以及商品名称作为对应边的属性信息。
[0030]进一步地,所述模型构建模块,具体用于根据所述税务数据中目标企业员工的第一标识信息与任职企业的第一标识信息、以及职务信息,在所述关系图谱中连接从所述目标企业员工的节点向所述任职企业的节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险企业识别方法,其特征在于,所述方法包括:基于预先构建完成的企业关系图谱,确定属性标签为黑名单企业和黑名单企业员工的每个第一节点及与所述每个第一节点存在二度关联的每个第二节点的子企业关系图谱;根据所述子企业关系图谱中所述每个第二节点对应的属性标签及预先保存的风险模型,得到所述风险模型输出的所述子企业关系图谱中属性标签为企业的每个第二节点的第一向量;针对所述属性标签为企业的每个第二节点,根据该第二节点的第一向量与预先确定的所述黑名单企业和所述黑名单企业员工分别对应的第二向量,确定该第一向量与每个第二向量的相似度,若任一相似度大于预设的相似度阈值,则确定该第一向量的第二节点对应的企业为风险企业。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据识别出每个风险企业对应的每个第一向量,将所述每个风险企业对应的每个第一向量进行归一化处理,得到归一化的每个第一向量;按照归一化后的每个第一向量的模值从大到小的顺序,将归一化后的每个第一向量的模值、以及对应的每个第二节点中包含的每个风险企业的标识信息输出。3.根据权利要求1所述的方法,其特征在于,所述企业关系图谱的构建过程包括:根据预先获取的税务数据中的企业的标识信息和企业员工的标识信息,构建关系图谱中企业和企业员工的节点,将对应的标识信息作为节点标识信息,若任一企业为黑名单信息中的黑名单企业,则将该企业对应的节点的属性标签设置为黑名单企业,否则,将该企业对应的节点的属性标签设置为企业,若任一企业员工为黑名单信息中的黑名单企业员工,则将该企业员工对应的节点的属性标签设置为黑名单企业员工,否则,将该企业员工对应的节点的属性标签设置为企业员工;针对所述税务数据中的每个发票信息,根据该发票信息中包含的两个目标企业的标识信息,连接所述两个目标企业的节点;根据所述税务数据中目标企业员工与任职企业的信息,连接所述目标企业员工的节点与所述任职企业的节点。4.根据权利要求3所述的方法,其特征在于,所述根据该发票信息中包含的两个目标企业的标识信息,连接所述两个目标企业的节点包括:根据该发票信息中包含的两个目标企业的标识信息和对应保存的预设关键字,其中所述预设关键字包括购买方和销售方,将所述两个目标企业中所述预设关键字为销售方的节点指向所述预设关键字为购买方的节点,将边中所述销售方的节点一侧设置为销项边,将所述边中所述购买方边的节点一侧设置为进项边,并将该发票信息中的交易金额、交易时间以及商品名称作为对应边的属性信息。5.根据权利要求3所述的方法,其特征在于,所述根据所述税务数据中目标企业员工与任职企业的信息,连接所述目标企业员工的节点与所述任职企业的节点包括:根据所述税务数据中目标企业员工的第一标识信息与任职企业的第一标识信息、以及职务信息,在所述关系图谱中连接从所述目标企业员工的节点向所述任职企业的节点,并将所述职务信息作为边的属性信息。6.一种风险企业识别装置,其特征在于,所述装置包括:
确定模块,用于基于预先构建完成的企业关系图谱,确定属性标签为黑名单企业和黑名单企业员工的每个第一节点及与所述每个第一节点存在二度关联的每个第二节点的子企业关系图谱;...

【专利技术属性】
技术研发人员:王泽皓林文辉王志刚杨军钱剑林闫凯马谊骏
申请(专利权)人:安徽航天信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1