一种财务数据造假识别方法技术

技术编号:33784591 阅读:35 留言:0更新日期:2022-06-12 14:39
本申请提供一种财务数据造假识别方法,包括:对企业进行分类,获得企业类别;根据企业类别,采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别;根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率;所述结合财务造假类别和企业财报预测企业造假概率,具体包括:利用差值进行缺失值处理,利用箱型图处理异常值,通过逻辑回归算法计算出企业整体造假概率;对拟投资但财务数据造假可能性超过预设阈值的企业,进行基于网上销售业绩的预测验证;根据验证结果提供投资决策;根据企业未来可弥补的造假程度和投后真实的获益率,调整投资比例。本发明专利技术能够验证财务造假,让投资者利益最大化。让投资者利益最大化。让投资者利益最大化。

【技术实现步骤摘要】
一种财务数据造假识别方法


[0001]本专利技术涉及智能设备
,尤其涉及一种财务数据造假识别方法。

技术介绍

[0002]在投资过程中,经常需要根据各企业财报进行分析。虽然可以让企业提供财报,但是有可能有些数据有造假的成分,不能完全信任财报。其实不同类型的企业,对造假项的偏向会不同,例如教育类企业经常是可以先拿到客户的钱再开始教学,因此他们对应收款的造假概率底,而有些销售型企业,则是先试用产品再收款,对应收款的造假概率大。因此如果通过应收款来判断一家企业的短期潜力,则销售型企业更有造假动机,因此如何根据不同行业和领域,判断哪些财务信息更容易被造假是一个难题,另一方面,企业会故意以空值来掩盖真实情况,有些企业则提供虚假数值来获得更多投资信任,这往往让没有经验的投资者受害。因此不能完全信任企业的财报数据,但是,很多时候造假信息并不是空穴来风,企业宁愿冒风险提供虚假信息,有时候,也是因为他们有期待和能力去达到这个目标,只是暂时达不到,因此造假。一般的投资者遇到造假都是嗤之以鼻,立刻离开,而这不一定是最科学的方式,如果有系统能根据系统预测的实际情况与企业财报提供情况做对比,获得造假可能和幅度,对应有能力的企业,即使出现小部分造假数据,也能发现其潜力,并调整投资的比例,则能减少很多错误的投资。

技术实现思路

[0003]本专利技术提供了一种财务数据造假识别方法,主要包括:
[0004]对企业进行分类,获得企业类别;根据企业类别,采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别;根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率;所述结合财务造假类别和企业财报预测企业造假概率,具体包括:利用差值进行缺失值处理,利用箱型图处理异常值,通过逻辑回归算法计算出企业整体造假概率;对拟投资但财务数据造假可能性超过预设阈值的企业,进行基于网上销售业绩的预测验证;根据验证结果提供投资决策;根据企业未来可弥补的造假程度和投后真实的获益率,调整投资比例。
[0005]进一步可选地,所述对企业进行分类,获得企业类别,包括:
[0006]建立企业类别数据库,获取企业的基本信息,通过基本信息判断行业类别中是否包含预设的行业类别关键字,得到所述待判断企业的企业类别,若企业类别具有多行业融合的性质,则给予所述企业多个分类标注值,获得第一维度企业分类;除了行业分类之外,再按照经济类型对企业进行分类,获得第二维度企业分类。
[0007]进一步可选地,所述采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别,包括:
[0008]建立财务类别数据库,包括应收票据、长期股权投资、预付款项、应交税费、资产总计、销售费用、流动资产合计、应付职工薪资、持续经营净利润、在建工程、无形资产和盈余
公积;将企业类别与财务造假类别通过关联挖掘算法进行计算,获得关联项,做为关联结果,并根据企业类别获得该类别下最常出现财务造假的财务类别;
[0009]进一步可选地,所述根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率,包括:
[0010]根据企业类别数据库和财务类别数据库获取企业及关联财务信息,判断所述企业类别最可能出现造假的财务类别项;获取企业财务报表,进行缺失值处理和异常值处理;所述缺失值处理,主要包括判断财报项目缺失比例是否大于预设的阈值,如果是,则说明财报数据缺失过大,判断该财报为缺失类型;对于缺失比例小于预设阈值%的财报数据,则根据财报的历史数据对该缺失值进行插值填充;所谓插值是采用插值法,根据数值过往和未来的数据,插值计算出最适合的值;
[0011]所述异常值处理,利用箱形图观察极大和极小值,观察财报异常数据与平均值的偏差是否远超过标准差;最后利用逻辑回归算法算出企业造假概率;
[0012]所述利用箱型图处理异常值,还包括:
[0013]上四分位数,中位数,下四分位数,下边缘,还有异常值的统计,高效获得异常值;并进行多组数据分布特征的比较,其将上下界作为数据分布的边界,高于上界或低于下界的数据点均视为离群点或异常值;
[0014]所述通过逻辑回归算法计算出企业整体造假概率,还包括:
[0015]获取财务数据,包括企业类型、应收款、预付款项、应交税费、资产总计、销售费用、流动资产合计、应付职工薪资、持续经营净利润、在建工程,将这些项目中缺失值通过插值法补全后,通过逻辑回归算法,预测企业财报的总体造假概率。
[0016]进一步可选地,所述对拟投资但财务数据造假可能性超过预设阈值的企业,进行基于网上销售业绩的预测验证,包括:
[0017]在获取企业财务数据造假可能性概率后,对所述企业进行进一步的验证来确定是否真实存在造假,并确定具体造假幅度是否能在未来进行弥补;针对具有网上电子商务销售的企业,通过爬虫获取包括企业官网、京东、淘宝、天猫、阿里巴巴上的所述企业的销售信息,针对不同的企业类别,爬取不同的销售数据;
[0018]所述爬取具体包括,根据配置预设的企业入口地址,将所述网址超链接加入下载队列中,所述下载队列,根据财务类别优先级进行顺序排序,优先抓取涉及财务数据多的页面,排除无财务信息相关的页面;
[0019]结合销售数据与造假数据的差距,预测未来预设时间段内,所述企业弥补造假空缺的可能性和时间周期;通过比较网上数据趋势与财务数据的差距,判断出现的财务造假数据是否能够在未来预设时间内,填补造假额。
[0020]进一步可选地,所述根据验证结果提供投资决策,包括:
[0021]根据企业营收,利用贴现指标和非贴现指标来对投资方案进行评价,主要包括净现值、现值指数、内含报酬率,判断回收期,通过观察净现值曲线中净现值与贴现率的关系并通过MIRR函数来修正内部收益率的计算,比较不同经济年限之间的差距,最后结合企业造假的概率来决定该企业是否值得进行投资。
[0022]进一步可选地,所述根据投资决策预测投资额,包括:
[0023]判断企业未来的生产能力,并根据财务造假概率进行折算;利用单位生产能力估
算法预测投资额,根据同类项目的单位生产能力投资额和拟建项目的生产能力来估算投资额,其中生产能力是指投资项目建成投产后每年达到的产量;采用下面公式根据折算后的投资决策预测投资额:项目投资总额=同类企业单位生产能力投资额
×
拟建项目生产能力
×
财务造假概率。
[0024]进一步可选地,所述根据企业未来可弥补的造假程度和投后真实的获益率,调整投资比例,包括:
[0025]获取企业造假数据和幅度、获取企业的网上销售数据、获取针对企业的拟投资额;并将造假额与销售额作为特征输入,将历史投资过程中,投后的真实回报率作为标注值,采用支持向量机分类器作为训练模型,训练二元分类器,预测投资回报率,根据预测结果并根据支持向量机中,对二个分类的置信度值乘以投资额,作为最终投资额度。
[0026]本专利技术实施例提供的技术方案可以包括以下有益效果:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种财务数据造假识别方法,其特征在于,所述方法包括:对企业进行分类,获得企业类别;根据企业类别,采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别;根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率;所述结合财务造假类别和企业财报预测企业造假概率,具体包括:利用差值进行缺失值处理,利用箱型图处理异常值,通过逻辑回归算法计算出企业整体造假概率;对拟投资但财务数据造假可能性超过预设阈值的企业,进行基于网上销售业绩的预测验证;根据验证结果提供投资决策;根据企业未来可弥补的造假程度和投后真实的获益率,调整投资比例。2.根据权利要求1所述的方法,其中,所述对企业进行分类,获得企业类别,包括:建立企业类别数据库,获取企业的基本信息,通过基本信息判断行业类别中是否包含预设的行业类别关键字,得到所述待判断企业的企业类别,若企业类别具有多行业融合的性质,则给予所述企业多个分类标注值,获得第一维度企业分类;除了行业分类之外,再按照经济类型对企业进行分类,获得第二维度企业分类。3.根据权利要求1所述的方法,其中,所述采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别,包括:建立财务类别数据库,包括应收票据、长期股权投资、预付款项、应交税费、资产总计、销售费用、流动资产合计、应付职工薪资、持续经营净利润、在建工程、无形资产和盈余公积;将企业类别与财务造假类别通过关联挖掘算法进行计算,获得关联项,做为关联结果,并根据企业类别获得该类别下最常出现财务造假的财务类别;其中,关联规则是形如X

Y的蕴含表达式,其中X和Y是不相交的项集,即关联规则的强度可以用它的支持度(support)和置信度(confidence)来度量;支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含X的事务中出现的频繁程度;支持度(s)和置信度(c)采用下面两种度量的形式:s(X

Y)=σ(X∪Y)/Nc(X

Y)=σ(X∪Y)/σ(X)其中,σ(X∪Y)是(X∪Y)的支持度计数,N为事务总数,σ(X)是X的支持度计数。4.根据权利要求1所述的方法,其中,所述根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率,包括:根据企业类别数据库和财务类别数据库获取企业及关联财务信息,判断所述企业类别最可能出现造假的财务类别项;获取企业财务报表,进行缺失值处理和异常值处理;所述缺失值处理,主要包括判断财报项目缺失比例是否大于预设的阈值,如果是,则说明财报数据缺失过大,判断该财报为缺失类型;对于缺失比例小于预设阈值%的财报数据,则根据财报的历史数据对该缺失值进行插值填充;所谓插值是采用插值法,根据数值过往和未来的数据,插值计算出最适合的值;所述异常值处理,利用箱形图观察极大和极小值,观察财报异常数据与平均值的偏差是否远超过标准差;最后利用逻辑回归算法算出企业造...

【专利技术属性】
技术研发人员:张良均王宏刚施兴张敏张尚佳刘名军
申请(专利权)人:广东泰迪智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1