一种多数据流的分析处理方法技术

技术编号:39395628 阅读:5 留言:0更新日期:2023-11-19 15:50
本发明专利技术涉及数据处理技术领域,具体为一种多数据流的分析处理方法;该方法通过采集财务流信息

【技术实现步骤摘要】
一种多数据流的分析处理方法


[0001]本专利技术涉及数据处理
,具体为一种多数据流的分析处理方法


技术介绍

[0002]企业财务数据通常是由企业内部的多方面数据进行分析和计算得到的,这些数据包括销售数据

采购数据

成本数据等等;企业可以通过财务数据了解自身的财务状况和经营表现,并作出相应的决策和规划;同时这些财务数据也为内外部的利益相关者提供了对企业的评估和判断的依据

[0003]存在以下方面的技术问题:
[0004]1、
财务数据质量问题:目前的企业通过多数据流对企业财务进行分析,采用人力对财务数据的缺失和异常进行溯源和校正,不仅浪费人力并且拉低财务数据溯源校正的效率;
[0005]2、
多数据流信息繁多杂乱:企业财务数据通常与其他多种数据流相关,当用户需要查询财务数据中的任一信息时,需要在繁多杂乱的数据中找到相关数据,严重降低工作效率,不便于用户展开工作


技术实现思路

[0006]本专利技术的目的在于提供一种多数据流的分析处理方法,以解决财务数据质量和多数据流信息繁多杂乱的问题

[0007]本专利技术的目的可以通过以下技术方案实现:一种多数据流的分析处理方法,包括以下步骤:
[0008]步骤一:通过采集财务流信息

业务流信息

资金流信息和发票流信息并将其保存以建立数据库;
[0009]步骤二:分别识别财务流信息

业务流信息

资金流信息和发票流信息中重复信息,并去除重复信息;
[0010]步骤三:通过对财务流信息中的数据进行分析以得到数值缺失位置和数值异常位置,并将数值缺失位置和数值异常位置的数值记为缺失数值和异常数值;
[0011]步骤四:通过对数值确缺失位置和数值异常位置进行数据溯源和叫数据校正,具体为:
[0012]S1
:当关键词条为营业收入类数值时,则进行营业收入类数值填充和数值替换,具体步骤为:
[0013]S11
:调取对应时间的订单信息,并提取对应订单的销售额,将对应时间的订单信息的销售额进行求和计算得到填充值1;
[0014]S12
:调取对应时间的资金流信息和业务流信息,按照业务流信息中的客户信息和供应商信息识别资金流信息中的交易双方,并从中筛选出交易方为客户的交易金额,并将交易金额进行求和计算得到填充值2;
[0015]S13
:调取相应时间的发票流信息中的出单类发票的开票金额,并将开票金额进行求和计算得到填充值3;
[0016]S14
:当填充值
1、
填充值2和填充值3存在两个或两个以上的填充值相等时,则将相等的填充值记为当天的营业收入数值,并将营业收入数值填充至对应数值缺失位置,或者替换对应数值异常位置的数值;当填充值
1、
填充值2和填充值3均不相等时,则将填充值1和填充值2取平均值得到当天的营业收入数值,并将当天的营业收入值填充至对应数值缺失位置,或者替换对应数值异常位置的数值;
[0017]S2
:当关键词条为产品成本类数值时,则进行产品成本类数值填充和数值替换,具体步骤为:
[0018]S21
:调取对应时间的业务流信息

资金流信息和发票流信息,按照业务流信息中的客户信息和供应商信息识别资金流信息中的交易双方,并从中筛选出交易方为供应商的交易金额,并将交易金额进行求和计算得到填充值4;
[0019]S22
:调取对应时间的发票流信息中的采购类发票,并提取采购类发票的开票金额,将开票金额进行求和计算得到填充值5;
[0020]S23
:当填充值4和填充值5相等时,则将相等的填充值记为当天的产品成本数值,并将当天的产品成本数值填充至对应数值缺失位置,或者替换对应数值异常位置的数值;当填充值4和填充值5不相等时,则将填充值4和填充值5取平均值得到当天的产品成本数值,并将当天的产品成本数值填充至对应数却缺失位置,或者替换对应数值异常位置的数值;
[0021]S3
:当关键词条为净利润类数值时,则调取对应时间的营业收入数值和产品成本数值,并将营业收入数值减去产品成本数值得到填充值6;将填充值6填充至对应时间的数值缺失位置,或者替换数值异常位置的数值;
[0022]步骤五:用户输入需要查询的数据信息,提取用户查询的数据信息,并将其记为目标数据信息;
[0023]步骤六:提取用户要查询的数据,识别用户要查询的数据的关键词条;将关键词条与业务流信息

资金流信息和发票流信息中信息的进行关联并连接得到关键词条的源信息;
[0024]步骤七:将目标数据信息和源信息发送至用户

[0025]优选地,通过对财务流信息中的数据进行分析以得到数值缺失位置和数值异常位置,其中分析步骤具体为:
[0026]步骤一:提取财务流信息中的营业收入信息

产品成本信息和净利润信息中的数值并将数值分别按照时间先后顺序生成营业收入报表

产品成本报表和净利润报表;
[0027]步骤二:识别营业收入报表

产品成本报表和净利润报表中存在数据缺失的位置并将其记为数值缺失位置;
[0028]步骤三:将报表的相邻时间的数值进行差值计算得到相邻差值;提取报表中数值中的最大值和最小值并将两者进行差值计算得到最大偏差;
[0029]步骤四:将所有的相邻差值与最大偏差进行比较分析,将大于最大偏差的相邻差值记为初步异常差值;识别初步异常差值,当任意两个初步异常差值存在重合时间点时,则将该时间点的数值记为异常数值,并将该位置记为数值异常位置

[0030]优选地,将关键词条与业务流信息

资金流信息和发票流信息中信息的进行关联与连接分析得到关键词条的源信息,其中关联分析的具体步骤为:
[0031]步骤一:将关键词条与业务流信息

资金流信息和发票流信息进行共同字段关联,将通过共同字段匹配得到的信息记为初步相关信息;提取初步相关信息的数据量,当数据量小于设定的字节阈值时,则执行步骤二;当数据量大于或等于设定的字节阈值时,则执行步骤三;
[0032]步骤二:采用人工智能语言训练模型提取若干条与关键词条相关的模糊细词条,并将模糊词条逐一与业务流信息

资金流信息和发票流信息进行共同字段关联得到模糊相关信息;
[0033]步骤三:提取关键词条

初步相关信息或模糊相关信息的对应时间,将初步相关信息或模糊相关信息的对应时间与关键词条的对应时间进行时间关联匹配得到关键词条的信息源;
[0034]步骤四:将源信息中的若干条数据信息按照相关度计算进行连接排序得到相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种多数据流的分析处理方法,其特征在于,包括以下步骤:步骤一:通过采集财务流信息

业务流信息

资金流信息和发票流信息并将其保存以建立数据库;步骤二:分别识别财务流信息

业务流信息

资金流信息和发票流信息中重复信息,并去除重复信息;步骤三:通过对财务流信息中的数据进行分析以得到数值缺失位置和数值异常位置;步骤四:通过其他数据流信息对数值确缺失位置和数值异常位置进行数据溯源和叫数据校正,具体为:
S1
:当关键词条为营业收入类数值时,则进行营业收入类数值填充和数值替换,具体步骤为:
S11
:调取对应时间的订单信息,并提取对应订单的销售额,将对应时间的订单信息的销售额进行求和计算得到填充值1;
S12
:调取对应时间的资金流信息和业务流信息,按照业务流信息中的客户信息和供应商信息识别资金流信息中的交易双方,并从中筛选出交易方为客户的交易金额,并将交易金额进行求和计算得到填充值2;
S13
:调取相应时间的发票流信息中的出单类发票的开票金额,并将开票金额进行求和计算得到填充值3;
S14
:当填充值
1、
填充值2和填充值3存在两个或两个以上的填充值相等时,则将相等的填充值记为当天的营业收入数值,并将营业收入数值填充至对应数值缺失位置,或者替换对应数值异常位置的数值;当填充值
1、
填充值2和填充值3均不相等时,则将填充值1和填充值2取平均值得到当天的营业收入数值,并将当天的营业收入值填充至对应数值缺失位置,或者替换数值异常位置的数值;
S2
:当关键词条为产品成本类数值时,则进行产品成本类数值填充和数值替换,具体步骤为:
S21
:调取对应时间的业务流信息

资金流信息和发票流信息,按照业务流信息中的客户信息和供应商信息识别资金流信息中的交易双方,并从中筛选出交易方为供应商的交易金额,并将交易金额进行求和计算得到填充值4;
S22
:调取对应时间的发票流信息中的采购类发票,并提取采购类发票的开票金额,将开票金额进行求和计算得到填充值5;
S23
:当填充值4和填充值5相等时,则将相等的填充值记为当天的产品成本数值,并将当天的产品成本数值填充至对应数值缺失位置,或者替换对应数值异常位置的数值;当填充值4和填充值5不相等时,则将填充值4和填充值5取平均值得到当天的产品成本数值,并将当天的产品成本数值填充至对应数却缺失位置,或者替换对应数值异常位置的数值;
S3
:当关键词条为净利润类数值时,则调取对应时间的营业收入数值和产品成本数值,并将营业收入数值减去产品成本数值得到填充值6;将填充值6填充至对应数值缺失位置,或者替换对应数值异常位置的数值;步骤五...

【专利技术属性】
技术研发人员:邢鸿超吴德永
申请(专利权)人:江苏税软软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1