【技术实现步骤摘要】
上市公司财务数据造假识别系统
[0001]本专利技术涉及一种数据造假识别系统,特别是一种上市公司财务数据造假识别系统。
技术介绍
[0002]资本市场的良好运行离不开公开、透明和真实的信息披露。如何通过公司特征提前判断出可能进行财务造假的公司就成为财务界、资本市场监管机构和学术界共同关心的重要问题。投资者需要对上市公司近几年的财务数据进行系统分析规避风险,从而保障投资安全。然而,传统市场预测模型对中国上市公司的财务数据进行分析评估时,其模型的预测能力较差,准确率较低。因此,现有的技术存在着预测能力较差的问题。
技术实现思路
[0003]本专利技术的目的在于,提供一种上市公司财务数据造假识别系统。本专利技术具有能够有效提高预测能力的特点。
[0004]本专利技术的技术方案:上市公司财务数据造假识别系统,包括数据获取模块,数据获取模块连接有数据预处理模块,数据预处理模块连接有指标筛选模块,指标筛选模块连接有造假识别模块,造假识别模块连接有报告生成模块。
[0005]前述的上市公司财务数据造假识别系 ...
【技术保护点】
【技术特征摘要】
1.上市公司财务数据造假识别系统,其特征在于:包括数据获取模块(1),数据获取模块(1)连接有数据预处理模块(2),数据预处理模块(2)连接有指标筛选模块(3),指标筛选模块(3)连接有造假识别模块(4),造假识别模块(4)连接有报告生成模块(5)。2.根据权利要求1所述的上市公司财务数据造假识别系统,其特征在于:所述数据获取模块(1)包括网络爬取数据单元(101)和用户上传数据单元(102);所述网络爬取数据单元(101)包括定时爬虫子单元和Scrapy爬虫子单元。3.根据权利要求2所述的上市公司财务数据造假识别系统,其特征在于:定时爬虫子单元用于监控爬虫运行状态、设置爬虫抓取频率以及爬虫程序异常处理;Scrapy爬虫模块:从目标网站上抓取数据,采集上市公司公开的财务数据并存入系统数据库。4.根据权利要求2所述的上市公司财务数据造假识别系统,其特征在于:用户上传数据单元(102)通过用户上传所要查询和分析的财务数据。5.根据权利要求1所述的上市公司财务数据造假识别系统,其特征在于:所述数据预处理模块(2)包括数据基本分析单元(201)、缺失值和异常值处理单元(202)、数据标准化处理单元(203)和数据预过滤筛选单元(204);数据基本分析单元(201)通过对互联网爬虫数据和用户上传数据进行审核、筛选和排序操作,然后识别无关指标并删除得到有效数据,无关指标包括实际披露时间、发布时间、报告截止时间、报告类型和会计区间;然后将有效数据进行单位统一后转化为满足要求的数据,得到预处理数据;缺失值和异常值处理单元(202)对预处理数据进行缺失值和异常值处理的具体操作包括以下方式:对于缺失率大于50%的数据,采取删除的方式;对于缺失率在20%
‑
50%之间的数据,采取填补的方式,以0值进行填充;对于缺失率小于20%的数据,采取随机森林填补的方式,选出缺失值数量最小的一列,进行随机森林回归模型训练填充,以此循环;对于数据异常值,先采用单边选择法进行欠采样,后采用ADASYN方法进行过采样;数据标准化处理单元(203)采用z
‑
score标准化方法将...
【专利技术属性】
技术研发人员:宋涛,陆欣怡,孟庆欣,韦艳芳,
申请(专利权)人:湖州师范学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。