【技术实现步骤摘要】
一种年报数据质量评价方法、装置、电子设备及存储介质
本专利技术涉及数据质量评价
,具体涉及一种年报数据质量评价方法、装置、电子设备及存储介质。
技术介绍
2014年10月1日我国正式实施企业年报公示制度,明确规定企业应当依法按时年报。企业年报内容涵盖了企业的资产、运营、税务、行政奖惩等大量数据信息,若能够将企业的年报数据加以科学合理的分析运用,既能为促进经济社会发展提供决策参考,也是政府部门监管能力的集中体现。但是,在年报工作推进过程中发现,尚有部分企业由于经营管理上不够规范、人员流动或交接不到位、财务管理混乱等原因导致年报信息往往随便填写,大大降低了企业年报数据的质量。因此,提供一种可靠的年报数据质量评价方法,对政府经济决策及政府精准监管无疑具有重要意义。现行的数据质量评价方法主要包括AHP层次分析法、缺陷扣分法等。AHP层次分析法首先将复杂的问题分解成若干层次,建立阶梯层次结构,然后构成判断矩阵,进行单排序一致性检验,最后进行层次总排序和一致性检验,得出结果,该方法的核心是对评价对象进行优劣排序、评价和选择 ...
【技术保护点】
1.一种年报数据质量评价方法,其特征在于,该检测方法包括以下步骤:/n对获取的企业年报数据进行标准化处理,得到标准化数据;/n将所述标准化数据输入由多种异常值检测算法构成的机器学习模型中识别相应的异常值;/n根据所述异常值对所述企业年报数据中相应的数据指标进行投票,若某一数据指标被两个及两个以上的异常值检测算法识别出异常而进行投票,则记录所述数据指标所关联的企业的异常得分,汇总所述企业所有数据指标的异常得分,得到所述企业的总异常得分。/n
【技术特征摘要】
1.一种年报数据质量评价方法,其特征在于,该检测方法包括以下步骤:
对获取的企业年报数据进行标准化处理,得到标准化数据;
将所述标准化数据输入由多种异常值检测算法构成的机器学习模型中识别相应的异常值;
根据所述异常值对所述企业年报数据中相应的数据指标进行投票,若某一数据指标被两个及两个以上的异常值检测算法识别出异常而进行投票,则记录所述数据指标所关联的企业的异常得分,汇总所述企业所有数据指标的异常得分,得到所述企业的总异常得分。
2.根据权利要求1所述的一种年报数据质量评价方法,其特征在于,所述多种由大数据算法构成的机器学习模型包括:双变量boxplot离群值模型、Cook距离模型、K均值聚类算法模型和Autoencoder自编码模型中的两种或者多种模型。
3.根据权利要求1所述的一种年报数据质量评价方法,其特征在于,在所述将所述标准化数据输入多种由大数据算法构成的机器学习模型中识别相应的异常值之后,还包括以下步骤:
判断所述企业年报数据的某一数据指标的同环比是否在合理区间;
若利用同环比判别出的年报数据的异常企业数量大于所述机器学习模型识别出来的数量,则通过适当调整所述机器学习模型参数和/或增加训练集样本数量的方法,进一步优化机器学习模型。
4.根据权利要求1所述的一种年报数据质量评价方法,其特征在于,所述将所述标准化数据输入多种由大数据算法构成的机器学习模型中识别相应的异常值之后,还包括以下步骤:
利用业务逻辑验证模型的准确性;
如果利用所述业务逻辑判别出的年报数据的异常企业数量大于所述机器学习模型识别出来的数量,则通过适当调整机器学习模型参数和/或增加训练集样本数量的方法,进一步优化机器学习模型。
5.一种年报数据质量评价装置,其特征在于,该装置包括:
预处理模块,用于对获取的企业年报数据进行...
【专利技术属性】
技术研发人员:贾新,李善平,朱红生,晋梁昊,
申请(专利权)人:河南拓普计算机网络工程有限公司,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。