一种基于数据挖掘的整合系统技术方案

技术编号:37531920 阅读:13 留言:0更新日期:2023-05-12 15:58
本发明专利技术提供一种基于数据挖掘的整合系统,涉及财务数据挖掘整合技术领域,所述互动体感式多媒体系统包括:服务器单元:用于存储、处理和传递财务数据,同时也用于接收各个单元发送的、待操作财务数据结构对应的操作指令;本发明专利技术中,通过财务数据统计单元能够将互联网以及人为录入的数据采集至服务器中,并对统计出的财务数据按照资产负债表、利润表、现金流量表、所有者权益变动表进行分类,从而生成相应的以图形曲线形式存在的当前财务报表信息,随后利用训练成熟的机器学习模型,识别采集在服务器单元中财务数据真伪以及可靠性,由于财务数据采集后通过筛选和过滤剔除了冗余,减少了服务器的负担,同时也增加了财务数据的可靠性。同时也增加了财务数据的可靠性。同时也增加了财务数据的可靠性。

【技术实现步骤摘要】
一种基于数据挖掘的整合系统


[0001]本专利技术涉及财务数据挖掘整合
,尤其涉及一种基于数据挖掘的整合系统。

技术介绍

[0002]数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标,项目财务数据预测简称项目财务预测,是指在投资决策之前,采用与企业财务口径相一致的计算方法,对拟投资项目的财务数据进行收集和测算,并编制财务预测表的一系列工作,为了获取财务预测数据通常使用数据挖掘手段来进行数据筛选和处理,由于财务数据量庞大,在数据挖掘过程中容易出现获取冗余或是虚假数据的情况,进而增加服务器的负载。

技术实现思路

[0003]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种基于数据挖掘的整合系统。
[0004]为了实现上述目的,本专利技术采用了如下技术方案:一种基于数据挖掘的整合系统,所述互动体感式多媒体系统包括:
[0005]服务器单元:用于存储、处理和传递财务数据,同时也用于接收各个单元发送的、待操作财务数据结构对应的操作指令;
[0006]财务数据统计单元:用于响应用户操作,基于多线程采集用户上传的财务数据,还能够用互联网搜索引擎实现财务数据抓取,按照实际需要制定规则和筛选标准进行财务数据归类,最终形成财务数据库文件,采集后的财务数据返回服务器财务数据库中;
[0007]财务数据分析单元:用于对统计出的财务数据按照资产负债表、利润表、现金流量表、所有者权益变动表进行分类,从而生成相应的以图形曲线形式存在的当前财务报表信息,最后呈现在前端页面,实现了财务数据的挖掘;
[0008]机器学习单元:利用训练成熟的机器学习模型,识别采集在服务器单元中财务数据真伪以及可靠性,并将识别结果呈现在前端页面通过人工方式筛选删洗,删洗后的财务数据在服务器单元中更新;
[0009]财务数据整合单元:将服务器中的财务报表上传至同一整合页中,实现财务数据的初步录入效果,随后将相同类型的财务报表分类整合即可,进而能够通过查询终端对财务数据查看。
[0010]为了去除财务数据冗余,本专利技术改进有,所述财务数据采集单元还包括财务数据筛选模块和财务数据过滤模块,财务数据筛选模块用于判断是否对主网页下的子网页的财务数据采集,财务数据过滤模块用于对采集过的网址过滤去重操作。
[0011]为了获得数据库,本专利技术改进有,所述财务数据库包括普通二维财务数据库以及
SSAS多维财务数据库。
[0012]为了保留需要分析的财务数据,本专利技术改进有,在财务数据分析前,服务器财务数据库需预先创建带备份财务数据存储表,用于存储待分析财务数据。
[0013]为了呈现不同效果,本专利技术改进有,所述财务数据分析单元还能够将所有财务报表信息的分析结果进行对比显示。
[0014]为了满足学习效果,本专利技术改进有,机器学习模型对模型进行训练后,可以使用它根据之前未见过的财务数据进行推理,并对这些财务数据进行预测,直到识别结果准确率达到设定阈值。
[0015]为了赋予机器模型性能,本专利技术改进有,所述机器学习模型基于连接逻辑回归模型输出、支持向量机模型输出、决策树模型输出、神经网络模型输出的Stacking算法模型。
[0016]为了防止财务数据丢失,本专利技术改进有,在删洗财务数据前能够人工选择是否备份当前财务数据,进而避免所需财务数据的丢失。
[0017]为了便于财务报表检索,本专利技术改进有,在财务报表整合过程中,财务数据整合单元会预先对相同类型的财务报表标记并赋予行号,便于后续对报表的检索。
[0018]与现有技术相比,本专利技术的优点和积极效果在于,
[0019]本专利技术中,通过财务数据统计单元能够将互联网以及人为录入的数据采集至服务器中,并对统计出的财务数据按照资产负债表、利润表、现金流量表、所有者权益变动表进行分类,从而生成相应的以图形曲线形式存在的当前财务报表信息,随后利用训练成熟的机器学习模型,识别采集在服务器单元中财务数据真伪以及可靠性,进而起到了辅助删洗虚假财务数据的作用,由于财务数据采集后通过筛选和过滤剔除了冗余,减少了服务器的负担,同时也增加了财务数据的可靠性。
附图说明
[0020]图1为本专利技术提出一种基于数据挖掘的整合系统的控制流程图。
具体实施方式
[0021]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和实施例对本专利技术做进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0022]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用不同于在此描述的其他方式来实施,因此,本专利技术并不限于下面公开说明书的具体实施例的限制。
[0023]实施例一,请参阅图1,本专利技术提供一种技术方案:一种基于数据挖掘的整合系统,互动体感式多媒体系统包括:
[0024]服务器单元:用于存储、处理和传递财务数据,同时也用于接收各个单元发送的、待操作财务数据结构对应的操作指令;
[0025]财务数据统计单元:用于响应用户操作,基于多线程采集用户上传的财务数据,还能够用互联网搜索引擎实现财务数据抓取,按照实际需要制定规则和筛选标准进行财务数据归类,最终形成财务数据库文件,采集后的财务数据返回服务器财务数据库中;
[0026]财务数据分析单元:用于对统计出的财务数据按照资产负债表、利润表、现金流量表、所有者权益变动表进行分类,从而生成相应的以图形曲线形式存在的当前财务报表信息,最后呈现在前端页面,实现了财务数据的挖掘;
[0027]机器学习单元:利用训练成熟的机器学习模型,识别采集在服务器单元中财务数据真伪以及可靠性,并将识别结果呈现在前端页面通过人工方式筛选删洗,删洗后的财务数据在服务器单元中更新;
[0028]财务数据整合单元:将服务器中的财务报表上传至同一整合页中,实现财务数据的初步录入效果,随后将相同类型的财务报表分类整合即可,进而能够通过查询终端对财务数据查看。
[0029]财务数据采集单元还包括财务数据筛选模块和财务数据过滤模块,财务数据筛选模块用于判断是否对主网页下的子网页的财务数据采集,财务数据过滤模块用于对采集过的网址过滤去重操作。
[0030]财务数据库包括普通二维财务数据库以及SSAS多维财务数据库。
[0031]在财务数据分析前,服务器财务数据库需预先创建带备份财务数据存储表,用于存储待分析财务数据。
[0032]财务数据分析单元还能够将所有财务报表信息的分析结果进行对比显示。
[0033]机器学习模型对模型进行训练后,可以使用它根据之前未见过的财务数据进行推理,并对这些财务数据进行预测,直到识别结果准确率达到设定阈值。
[0034]机器学习模型基于连接逻辑回归模型输出、支持向量机模型输出、决策树模型输出、神经网络模型输出的Sta本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据挖掘的整合系统,其特征在于,所述互动体感式多媒体系统包括:服务器单元:用于存储、处理和传递财务数据,同时也用于接收各个单元发送的、待操作财务数据结构对应的操作指令;财务数据统计单元:用于响应用户操作,基于多线程采集用户上传的财务数据,还能够用互联网搜索引擎实现财务数据抓取,按照实际需要制定规则和筛选标准进行财务数据归类,最终形成财务数据库文件,采集后的财务数据返回服务器财务数据库中;财务数据分析单元:用于对统计出的财务数据按照资产负债表、利润表、现金流量表、所有者权益变动表进行分类,从而生成相应的以图形曲线形式存在的当前财务报表信息,最后呈现在前端页面,实现了财务数据的挖掘;机器学习单元:利用训练成熟的机器学习模型,识别采集在服务器单元中财务数据真伪以及可靠性,并将识别结果呈现在前端页面通过人工方式筛选删洗,删洗后的财务数据在服务器单元中更新;财务数据整合单元:将服务器中的财务报表上传至同一整合页中,实现财务数据的初步录入效果,随后将相同类型的财务报表分类整合即可,进而能够通过查询终端对财务数据查看。2.根据权利要求1所述的基于数据挖掘的整合系统,其特征在于:所述财务数据采集单元还包括财务数据筛选模块和财务数据过滤模块,财务数据筛选模块用于判断是否对主网页下的子网页的财务数据采集,财务数据过滤...

【专利技术属性】
技术研发人员:江航宇
申请(专利权)人:中央财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1