【技术实现步骤摘要】
一种基于图谱的审计信息识别方法与系统
[0001]本专利技术属于信息识别
,特别涉及一种基于图谱的审计信息识别方法、系统及装置。
技术介绍
[0002]审计工作亦称审计活动,广义指审计监督检查、综合管理、教育培训、科研宣传等一切审计业务活动的总称。具体内容包括:审核检查会计和有关资料的真实性、正确性、完整性和公允性;审查和评价财政预算、财务计算以及经营决策方案制订和执行情况;审核检查经济活动的合法性、合理性及其有效性;审查和评价内部控制制度的健全性和有效性,促进经营管理水平的提高;审查和鉴证有关经济效益和经济活动,为信息需要者提供服务。因此,审计工作对于促进国家计划的实现,合理利用资源,提高经济效益有极其重要的作用。
[0003]目前,在传统审计工作中,往往采取业务驱动数据的模式,限制了审计工作的效率,并且在分析处理数据方面片面且效率较低,还存在财务舞弊的可能性,也不易于发现隐藏的审计线索。比如,在传统的银行业风险管理流程中,多通过对目标主体的特征进行严格审核,例如:负债、资产状况、现金流水等方面,但是这些都无 ...
【技术保护点】
【技术特征摘要】
1.一种基于图谱的审计信息识别方法,其特征在于,所述方法包括:获取与审计信息相关的信息和数据;根据获取的所述与审计信息相关的信息和数据,确定审计信息关联指数,所述审计信息关联指数用于表征获取的审计信息之间的关联程度;根据所述审计信息关联指数,确定与审计信息有关的第一关联信息,或者通过审计信息关联指数的预设阈值,筛选出与审计信息有关的第二关联信息,其中,所述第一关联信息的范围大于等于所述第二关联信息的范围。2.根据权利要求1所述的一种基于图谱的审计信息识别方法,其特征在于,所述获取与审计信息相关的信息和数据,包括:获取多源异构数据中识别出的审计信息及其相关数据;将已在多源异构数据中识别出的审计信息中的至少一项审计信息确定为第一关键词,或者直接获取至少一项预设的审计信息作为第一关键词;将已在多源异构数据中识别出的审计信息中的除第一关键词以外的至少一项审计信息确定为第二关键词,或者直接获取除第一关键词以外的至少一项预设的审计信息作为第二关键词;在审计信息图数据库中筛选出与第一关键词相关的所有实体及其参数,作为第一实体;在审计信息图数据库中筛选出与第二关键词相关的所有实体及其参数,作为第二实体;在审计信息图数据库中获取第一实体与第二实体之间的所有关系路径及其参数。3.根据权利要求2所述的一种基于图谱的审计信息识别方法,其特征在于,所述根据获取的所述与审计信息相关的信息和数据,确定审计信息关联指数,包括:根据获取的所述第一关键词、第二关键词、第一实体和第二实体,确定第一关键词和第一实体的相似度、第二关键词和第二实体的相似度;根据获取的第一实体与第二实体之间的所有关系路径及其参数,确定第一实体与第二实体之间的相关系数;根据所述第一关键词和第一实体的相似度、所述第二关键词和第二实体的相似度和所述第一实体与第二实体之间的相关系数,进行加权计算得到审计信息关联指数。4.根据权利要求3所述的一种基于图谱的审计信息识别方法,其特征在于,根据所述第一关键词和第一实体的相似度、所述第二关键词和第二实体的相似度和所述第一实体与第二实体之间的相关系数,进行加权计算得到审计信息关联指数,包括:根据所述第一关键词和第一实体的相似度、所述第二关键词和第二实体的相似度和所述第一实体与第二实体之间的相关系数,利用第一关系式进行加权计算得到审计信息关联指数;其中,所述第一关系式包括:s=k1α+k2β+k3γ;其中,s为审计数据关联指数;k1为第一实体权重系数;α为第一关键词与第一实体的相似度;k2为第二实体权重系数;
β为第二关键词与第二实体的相似度;k3为第一实体与第二实体之间的相关性的权重;γ为第一实体与第二实体之间的相关系数。5.根据权利要求4所述的一种基于图谱的审计信息识别方法,其特征在于,所述第一关系式中,第一实体权重系数k1和第二实体权重系数k2,利用第二关系式进行计算得到;其中,所述第二关系式包括:其中,α
x
为第一实体分配系数;β
x
为第二实体分配系数;其中,所述第一实体分配系数α0和第二实体分配系数β0由如下关系式得到:其中,n1为在图数据库中与第一实体最近的关系的总数量;n2为在图数据库中与第二实体最近的关系的总数量;m为在图数据库中第一实体与第二实体之间所有的关系路径的总条数;δ为分配系数收敛参数。6.根据权利要求3
‑
5任一项所...
【专利技术属性】
技术研发人员:张莉,王磊,王宁宁,李卓松,
申请(专利权)人:北京信息科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。