【技术实现步骤摘要】
一种财务数据造假识别方法
[0001]本专利技术涉及智能设备
,尤其涉及一种财务数据造假识别方法。
技术介绍
[0002]在投资过程中,经常需要根据各企业财报进行分析。虽然可以让企业提供财报,但是有可能有些数据有造假的成分,不能完全信任财报。其实不同类型的企业,对造假项的偏向会不同,例如教育类企业经常是可以先拿到客户的钱再开始教学,因此他们对应收款的造假概率底,而有些销售型企业,则是先试用产品再收款,对应收款的造假概率大。因此如果通过应收款来判断一家企业的短期潜力,则销售型企业更有造假动机,因此如何根据不同行业和领域,判断哪些财务信息更容易被造假是一个难题,另一方面,企业会故意以空值来掩盖真实情况,有些企业则提供虚假数值来获得更多投资信任,这往往让没有经验的投资者受害。因此不能完全信任企业的财报数据,但是,很多时候造假信息并不是空穴来风,企业宁愿冒风险提供虚假信息,有时候,也是因为他们有期待和能力去达到这个目标,只是暂时达不到,因此造假。一般的投资者遇到造假都是嗤之以鼻,立刻离开,而这不一定是最科学的方式,如果有系统能根据系统预测的实际情况与企业财报提供情况做对比,获得造假可能和幅度,对应有能力的企业,即使出现小部分造假数据,也能发现其潜力,并调整投资的比例,则能减少很多错误的投资。
技术实现思路
[0003]本专利技术提供了一种财务数据造假识别方法,主要包括:
[0004]对企业进行分类,获得企业类别;根据企业类别,采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别;根据 ...
【技术保护点】
【技术特征摘要】
1.一种财务数据造假识别方法,其特征在于,所述方法包括:对企业进行分类,获得企业类别;根据企业类别,采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别;根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率;所述结合财务造假类别和企业财报预测企业造假概率,具体包括:利用差值进行缺失值处理,利用箱型图处理异常值,通过逻辑回归算法计算出企业整体造假概率;对拟投资但财务数据造假可能性超过预设阈值的企业,进行基于网上销售业绩的预测验证;根据验证结果提供投资决策;根据企业未来可弥补的造假程度和投后真实的获益率,调整投资比例。2.根据权利要求1所述的方法,其中,所述对企业进行分类,获得企业类别,包括:建立企业类别数据库,获取企业的基本信息,通过基本信息判断行业类别中是否包含预设的行业类别关键字,得到所述待判断企业的企业类别,若企业类别具有多行业融合的性质,则给予所述企业多个分类标注值,获得第一维度企业分类;除了行业分类之外,再按照经济类型对企业进行分类,获得第二维度企业分类。3.根据权利要求1所述的方法,其中,所述采用关联挖掘算法挖掘出企业经常出现财务造假的财务类别,包括:建立财务类别数据库,包括应收票据、长期股权投资、预付款项、应交税费、资产总计、销售费用、流动资产合计、应付职工薪资、持续经营净利润、在建工程、无形资产和盈余公积;将企业类别与财务造假类别通过关联挖掘算法进行计算,获得关联项,做为关联结果,并根据企业类别获得该类别下最常出现财务造假的财务类别;其中,关联规则是形如X
→
Y的蕴含表达式,其中X和Y是不相交的项集,即关联规则的强度可以用它的支持度(support)和置信度(confidence)来度量;支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含X的事务中出现的频繁程度;支持度(s)和置信度(c)采用下面两种度量的形式:s(X
→
Y)=σ(X∪Y)/Nc(X
→
Y)=σ(X∪Y)/σ(X)其中,σ(X∪Y)是(X∪Y)的支持度计数,N为事务总数,σ(X)是X的支持度计数。4.根据权利要求1所述的方法,其中,所述根据财务造假的财务类别和财务报表缺失值异常值,通过逻辑回归算法预测造假概率,包括:根据企业类别数据库和财务类别数据库获取企业及关联财务信息,判断所述企业类别最可能出现造假的财务类别项;获取企业财务报表,进行缺失值处理和异常值处理;所述缺失值处理,主要包括判断财报项目缺失比例是否大于预设的阈值,如果是,则说明财报数据缺失过大,判断该财报为缺失类型;对于缺失比例小于预设阈值%的财报数据,则根据财报的历史数据对该缺失值进行插值填充;所谓插值是采用插值法,根据数值过往和未来的数据,插值计算出最适合的值;所述异常值处理,利用箱形图观察极大和极小值,观察财报异常数据与平均值的偏差是否远超过标准差;最后利用逻辑回归算法算出企业造...
【专利技术属性】
技术研发人员:张良均,王宏刚,施兴,张敏,张尚佳,刘名军,
申请(专利权)人:广东泰迪智能科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。