企业异常行为分析方法、系统、装置和存储介质制造方法及图纸

技术编号:39135435 阅读:8 留言:0更新日期:2023-10-23 14:52
本申请涉及数据分析的领域,尤其是涉及企业异常行为分析方法、系统、装置和存储介质。包括获取目标企业在预设时间段内的进项票据和销项票据;基于进项票据和销项票据,采用光学字符识别OCR模型分别获取进项票据内容和销项票据内容;基于进项票据内容和销项票据内容,分别获取进项表格和销项表格;基于进项表格和销项表格,分别获取进项总税额和销项总税额;基于进项总税额和销项总税额,采用预设分析公式计算进销项差异度;将进销项差异度和预设差异度进行比对;若进销项差异度大于预设差异度,则判定目标企业具有异常行为,能够有效提升税收风险分析的效率。升税收风险分析的效率。升税收风险分析的效率。

【技术实现步骤摘要】
企业异常行为分析方法、系统、装置和存储介质


[0001]本申请涉及数据分析的领域,尤其是涉及企业异常行为分析方法、系统、装置和存储介质。

技术介绍

[0002]企业的正常运营对企业本身以及社会都具有重要的意义,但是在企业运营过程,可能会存在一些经营异常,发现并及时针对这些异常设置补救措施是至关重要的。但是目前社会上企业众多,且每个企业的内部情况各不相同,设置专门的监督人员来检查发现异常的效率较低,导致异常难以被及时发现,容易造成不可挽回的经济损失。

技术实现思路

[0003]为了提升检查发现企业异常的效率,本申请提供了企业异常行为分析方法、系统、装置和存储介质。
[0004]第一方面,本申请提供的企业异常行为分析方法,采用如下的技术方案:企业异常行为分析方法,所述方法包括:获取目标企业在预设时间段内的进项票据和销项票据;基于所述进项票据和所述销项票据,采用光学字符识别OCR模型分别获取进项票据内容和销项票据内容;基于所述进项票据内容和所述销项票据内容,分别获取进项表格和销项表格;基于所述进项表格和所述销项表格,分别获取进项总税额和销项总税额;基于所述进项总税额和所述销项总税额,采用预设分析公式计算进销项差异度;将所述进销项差异度和所述预设差异度进行比对;若所述进销项差异度大于所述预设差异度,则判定所述目标企业具有异常行为。
[0005]通过采用上述技术方案,当对目标企业进行异常行为判定时,首先能够获取预设时间内目标企业产生的进项票据和销项票据,然后根据进项票据和销项票据能够对应获取到进项表格、销项表格、进项总税额、销项总税额以及进销项差异度,之后根据预设分析公式即可计算出进销项差异度和预设差异度之间的大小关系,从而能够判定目标企业是否具有异常行为。
[0006]若目标企业具有异常行为,则能够基于异常行为判断出该目标企业具有异常的可能性,从而实现自动化分析,进而提升检查发现企业异常的效率。
[0007]可选的,所述基于所述进项票据和所述销项票据,采用光学字符识别OCR模型分别获取进项票据内容和销项票据内容包括:分别对所述进项票据和所述销项票据进行预处理,所述预处理包括灰度化处理、二值化处理和降噪处理;完成所述预处理后,识别所述进项票据中的第一文本内容,并对所述第一文本内容按照预设所需内容进行筛选,将筛选后的第一文本内容作为所述进项票据内容;
识别所述销项票据中的第二文本内容,并对所述第二文本内容按照预设所需内容进行筛选,将筛选后的第二文本内容作为所述销项票据内容。
[0008]通过采用上述技术方案,在获取进行票据和销项票据时,进项票据和销项票据都是以PDF格式的图像形式而存在。灰度化处理能够将多通道的彩色图像转换为单通道的灰度图像,二值化处理能够将灰度图像处理为只包含黑和白的图像,以便于后续的图像处理。而降噪处理能够减少图像的噪点,从而提升图像的清晰度。当进项票据和销项票据完成预处理后,经过识别即可获得对应的文本内容,然后对对应的文本内容进行筛选即可得到相应的进项票据内容和销项票据内容。
[0009]可选的,所述基于所述进项票据内容和所述销项票据内容,分别获取进项表格和销项表格包括:获取两个相同的表格模板,所述表格模板内包含有与所述进项票据内容和所述销项票据内容相对应的表格抬头;基于所述表格抬头,将所述进项票据内容对应填入至其中一个所述表格模板中,将所述进项票据内容对应填入至另一个所述表格模板中。
[0010]通过采用上述技术方案,两个表格模板能够分别用于承载进项票据内容和销项票据内容,进项票据内容能够根据其中一个表格模板的表格抬头对应填入至表格模板内,而销项票据内容则能够根据另一个表格模板的表格抬头对应填入至表格模板内,从而实现对进项表格和销项表格的获取。
[0011]可选的,所述基于所述进项总税额和所述销项总税额,采用预设分析公式计算进销项差异度包括:将所述进项总税额和所述销项总税额输入至预设分析公式中,计算得出实际差异度;对所述实际差异度进行取整,将取整以后的实际差异度作为所述进销项差异度。
[0012]通过采用上述技术方案,将进项总税额和销项总税额分别输入至预设分析公式中即可计算得出实际差异度,实际差异度在计算出来以后极有可能不是整数,不利于进行表示。此时对实际差异度进行取整即可获得便于表示的进销项差异度,之后将进销项差异度和实际差异度进行比对即可获取到二者之间的大小关系。
[0013]可选的,还包括:若所述进销项差异度大于所述预设差异度,则将所述目标企业列入灰名单;若所述进销项差异度小于等于所述预设差异度,则将所述目标企业列入白名单。
[0014]通过采用上述技术方案,灰名单和白名单的设置能够便于在分析完成以后知道哪些企业有异常行为,哪些企业没有异常行为。若在一段时间以后还需要对已经分析过的企业进行再次分析,可根据灰名单和白名单按照比例进行抽检,从而提升企业异常行为分析的便捷性,进而提升检查发现企业异常的效率。
[0015]可选的,还包括:若所述进销项差异度大于所述预设差异度,则输出分析报告,所述分析报告包括所述进销项差异度、所述进项表格和所述销项表格。
[0016]通过采用上述技术方案,在获取到分析报告以后,能够根据分析报告得出目标企业的进销项差异度、进项表格和销项表格,从而能够对目标企业的经营活动情况进行了解。
[0017]可选的,还包括:分别剔除所述进项票据和所述销项票据中的废票和红票。
[0018]通过采用上述技术方案,红票是指符合作废条件的票据,废票为开具错误的票据,红票和废票均为无效票据。将红票和废票进行剔除以后能够提升分析的精准度。
[0019]第二方面,本申请提供的企业异常行为分析系统,采用如下的技术方案:企业异常行为分析系统,包括:获取单元,用于获取目标企业在预设时间段内的进项票据和销项票据;用于采用光学字符识别OCR模型分别获取进项票据内容和销项票据内容;用于分别获取进项表格和销项表格;用于分别获取进项总税额和销项总税额;计算单元,用于采用预设分析公式计算进销项差异度;比对单元,用于将所述进销项差异度和预设差异度进行比对;判定单元,用于在所述进销项差异度大于所述预设差异度时判定所述目标企业具有异常行为。
[0020]通过采用上述技术方案,当对目标企业进行异常行为判定时,首先获取单元能够对目标企业在预设时间内产生的进项票据和销项票据进行获取,然后获取单元再采用光学字符识别OCR模型获取到进项票据中的进项票据内容和销项票据中的销项票据内容。之后获取单元再根据进项票据内容和销项票据内容获取到对应的进项表格和销项表格。最后获取单元再根据进项表格和销项表格分别获取到进项总税额和销项总税额。
[0021]在获取单元完成获取以后,计算单元再根据进项总税额和销项总税额的数值,采用预设分析公式即可直接计算出进销项差异度。之后比对单元将进销项差异度和预设差异度进行比对即可得出二者之间的大小关系。最后判定单元根据进销项差异度和预设差异度之间的大小关系即可判定出目标企业是否具有异本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业异常行为分析方法,其特征在于:所述方法包括:获取目标企业在预设时间段内的进项票据和销项票据;基于所述进项票据和所述销项票据,采用光学字符识别OCR模型分别获取进项票据内容和销项票据内容;基于所述进项票据内容和所述销项票据内容,分别获取进项表格和销项表格;基于所述进项表格和所述销项表格,分别获取进项总税额和销项总税额;基于所述进项总税额和所述销项总税额,采用预设分析公式计算进销项差异度;将所述进销项差异度和预设差异度进行比对;若所述进销项差异度大于所述预设差异度,则判定所述目标企业具有异常行为。2.根据权利要求1所述的企业异常行为分析方法,其特征在于,所述基于所述进项票据和所述销项票据,采用光学字符识别OCR模型分别获取进项票据内容和销项票据内容包括:分别对所述进项票据和所述销项票据进行预处理,所述预处理包括灰度化处理、二值化处理和降噪处理;完成所述预处理后,识别所述进项票据中的第一文本内容,并对所述第一文本内容按照预设所需内容进行筛选,将筛选后的第一文本内容作为所述进项票据内容;识别所述销项票据中的第二文本内容,并对所述第二文本内容按照预设所需内容进行筛选,将筛选后的第二文本内容作为所述销项票据内容。3.根据权利要求2所述的企业异常行为分析方法,其特征在于,所述基于所述进项票据内容和所述销项票据内容,分别获取进项表格和销项表格包括:获取两个相同的表格模板,所述表格模板内包含有与所述进项票据内容和所述销项票据内容相对应的表格抬头;基于所述表格抬头,将所述进项票据内容对应填入至其中一个所述表格模板中,将所述进项票据内容对应填入至另一个所述表格模板中。4.根据权利要求3所述的企业异常行为分析方法,其特征在于,所述基于所述进项总税额和所述销项总税额,采用预设分析公式计算进销项差异度包括:将...

【专利技术属性】
技术研发人员:段锐彭助亮杨波彭建文文思钧
申请(专利权)人:重庆远见信息产业集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1