一种基于大数据的财税智能化分析方法及系统技术方案

技术编号:34454135 阅读:13 留言:0更新日期:2022-08-06 16:58
本发明专利技术涉及财税领域,具体来说,涉及一种基于大数据的财税智能化分析方法及平台。包括以下步骤:S1、构建初始模型:S2、准备训练数据包;S3、导入数据、开始训练;S4、聚类测试;S5、人工调试;S6、用户输入;S7、调用并显示预案:S8、更新模型;本申请利用来自假设案例或真实案例的企业财税信息作为训练包,通过ML(machine learning)技术训练得到数学模型,可以快速、精准地完成对企业的聚类,并给出预先设置的财税方案,技术人员可以将模型给出的分类结果和实际分类结果进行比对,基于所述比对结果,对所述训练多维高斯模型进行人工调试,得到改进多维高斯模型,基于人工修正,提高了模型的准确度。度。度。

【技术实现步骤摘要】
一种基于大数据的财税智能化分析方法及系统


[0001]本专利技术涉及财税领域,具体来说,涉及一种基于大数据的财税智能化分析方法及系统。

技术介绍

[0002]财务分析是以会计核算和报表资料及其他相关资料为依据,采用一系列专门的分析技术和方法,对企业等经济组织过去和现在有关筹资活动、投资活动、经营活动、分配活动的盈利能力、营运能力、偿债能力和增长能力状况等进行分析与评价的经济管理活动。它是为企业的投资者、债权人、经营者及其他关心企业的组织或个人了解企业过去、评价企业现状、预测企业未来做出正确决策提供准确的信息或依据的经济应用学科。
[0003]税务规划指的是税务筹划,税务筹划是指在纳税行为发生之前,在不违反法律、法规(税法及其他相关法律、法规)的前提下,通过对纳税主体(法人或自然人)的经营活动或投资行为等涉税事项做出事先安排,以达到少缴税或递延纳税目标的一系列谋划活动。企业进行税务规划,有利于节约企业成本费用,实现利润最大化目标,同时增强企业的竞争力,降低法律风险。。包括前期规划和运营规划。前期规划主要表现为选择企业的组织形式,而运营规划的目的在于帮助企业增加成本费用减少利润从而达到降低税收。
[0004]目前的财税分析,主要是财税人员依靠专业知识来完成,存在以下几个问题:
[0005]1、财税人员作为自然人,对于专业知识知识和相关政策的更新存在滞后;
[0006]2、随着社会的发展,财税业务所涉及的知识面越来越广,包括知识产权、高新企业认定、科创版IPO等,财税人员作为专精人才,难以全面掌握各方面的知识;
[0007]3、对于小型企业,特别是创业型企业来说,建立、培育、保有一支高质量的财税人才队伍,是不小的经济负担。
[0008]基于上述问题,随着互联网平台技术和共享经济的发展,人们开始尝试通过建立财税分析平台来解决人工财税分析所存在的问题:
[0009]中国专利CN102236827A公开了一种税收管理分析系统,借助财务分析、数理统计分析等方法,科学进行各税种与生产经营信息的对称性分析,通过合理加工,设置出一套相互关联依存的管理分析系统,为客观比较企业各税纳税情况、合理评价各地区各税种征管力度、科学预测税源发展变化趋势提供依据;
[0010]中国专利CN103455636A公开了一种基于互联网税务数据自动抓取与智能分析的方法,具体步骤为:搭建电子商务税源管理云平台;部署hadoop集群,然后进行数据采集;动态抓取互联网交易网站网页上的涉税数据信息;进行数据采集抽取,实现目标数据从“异构”到“同构”的过程;将采集数据存储到云平台服务器各个节点上;进行数据智能分析。
[0011]中国专利CN104166934A公开了一种针对行业及税种的指标模型的税收分析方法及系统,通过对待分析纳税人的行业特征及其所属行业的税源分布数据、税源纳税数据进行提取,选取行业特征的分析标准,分析出各税源的纳税情况,并对各税源的纳税情况一一进行比对,获取各税源之间的纳税情况的数据分析。
[0012]但是,上述建立财税分析平台来解决人工财税分析所存在问题的尝试,仍然存在以下技术问题:
[0013]1、所涉及的数据模型的维度不足,上述尝试通常仅针对财税问题进行分析,而未能将于财税相关的知识产权、高新技术企业认定、IPO上市辅导、关联交易申报、等等问题纳入考虑;
[0014]2、缺乏上下游对接及交易功能,难以将自动分析与人工分析的优势相结合,具体来说,现有技术通过构建数据模型,在需求端提交请求时自动进行分析,然而,由于数据模型的固定性和滞后性,对于需求端的不同企业,无法做到准确匹配需求;而现有的财税专业人员,虽然具备专业知识,却难以在现有平台上提供专业服务,也难以通过提供专业服务来合法地获取经济报酬,造成人工服务资源端和企业需求端难以沟通;
[0015]3、现有的数据模型均为静态模型,即数据模型在完成构建后,无法进行调整,无法根据大数据进行自学习,具体来说,无法根据每一次的数据输入进行自学习及修正。
[0016]说明书内容
[0017]有鉴于此,本专利技术的目的在于提供一种基于大数据的财税智能化分析方法,包括以下步骤:
[0018]S1、构建初始模型:构建初始多维高斯模型;
[0019]S2、准备训练数据包:准备用于所述初始多维高斯模型的训练数据包,所述训练数据包具有多组企业数据,所述企业数据为来自假设案例或真实案例的企业财税信息,所述企业财税信息集合至少包括以下信息中的一种或多种:工商信息、财税审计信息、并购融资信息、土地资产信息、研发费用信息、主营业务方向信息;
[0020]S3、导入数据、开始训练:将部分或全部的所述训练数据包导入所述初始多维高斯模型,对所述初始多维高斯模型进行训练及无监督学习,得到训练多维高斯模型;
[0021]S4、聚类测试:利用所述训练多维高斯模型对部分或全部的所述训练用企业财税相关信息集合进行聚类分析,得到聚类结果;
[0022]S5、人工调试:技术人员基于所述聚类结果,对所述训练多维高斯模型进行人工调试,得到改进多维高斯模型;
[0023]S6、用户输入:用户根据系统指引,在用户截面输入真实的企业财税信息;系统将真实的所述企业财税信息导入所述改进多维高斯模型,进行聚类分析,得到企业分类建议;
[0024]S7、调用并显示预案:基于所述企业分类建议,调用预设的财税建议包,显示至用户界面;
[0025]S8、更新模型:系统将用户输入的真实的所述企业财税信息纳入所述训练数据包,基于预设的期限,或者在技术人员人为操作时,对所述改进多维高斯模型再次进行训练和无监督学习,完成模型更新。
[0026]进一步的,所述高斯混合模型的表达式为:
[0027][0028]其中,p
m
(z
i
)表示多维高斯模型的概率密度,q表示企业数据的样本,i表示企业数据编号,σ表示模型方差,μ表示模型期望,π表示权值因子,k表示多维高斯混合成分个数,N表示多维高斯分布中的一个分组,且N的表达式为:
[0029][0030]其中,e表示自然常数。
[0031]进一步的,所述步骤S3,包括以下子步骤:
[0032]S31、在参数空间中为λ定义初始值λ0,h∈{0,h
n
},Y=0,Y表示无监督最大期望算法迭代的次数,h表示最佳参数估计值,n表示参数数量;
[0033]S32、对参数进行判断,若h>1,Y=Y+1,则继续步骤S33,若h≤1,则跳转至步骤S35;
[0034]S33、通过当前参数及初始值λ0计算辅助函数;
[0035]S34、在参数空间中使辅助函数极大化,若小于预设阈值则终止迭代,若大于预设阈值则返回步骤S33;
[0036]S35、迭代算出每个分量的权重,并将权重为零的分量剔除,同时剔除剩余的分量中权重最小的;
[0037]S36、输出无监督结果,得到改进最大期望算法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的财税智能化分析方法,其特征在于:包括以下步骤:S1、构建初始模型:构建初始多维高斯模型;S2、准备训练数据包:准备用于所述初始多维高斯模型的训练数据包,所述训练数据包具有多组企业数据,所述企业数据为来自假设案例或真实案例的企业财税信息,所述企业财税信息集合至少包括以下信息中的一种或多种:工商信息、财税审计信息、并购融资信息、土地资产信息、研发费用信息、主营业务方向信息;S3、导入数据、开始训练:将部分或全部的所述训练数据包导入所述初始多维高斯模型,对所述初始多维高斯模型进行训练及无监督学习,得到训练多维高斯模型;S4、聚类测试:利用所述训练多维高斯模型对部分或全部的所述训练用企业财税相关信息集合进行聚类分析,得到聚类结果;S5、人工调试:技术人员基于所述聚类结果,对所述训练多维高斯模型进行人工调试,得到改进多维高斯模型;S6、用户输入:用户根据系统指引,在用户截面输入真实的企业财税信息;系统将真实的所述企业财税信息导入所述改进多维高斯模型,进行聚类分析,得到企业分类建议;S7、调用并显示预案:基于所述企业分类建议,调用预设的财税建议包,显示至用户界面;S8、更新模型:系统将用户输入的真实的所述企业财税信息纳入所述训练数据包,基于预设的期限,或者在技术人员人为操作时,对所述改进多维高斯模型再次进行训练和无监督学习,完成模型更新。2.根据权利要求1所述的一种基于大数据的财税智能化分析方法,其特征在于:所述高斯混合模型的表达式为:其中,p
m
(z
i
)表示多维高斯模型的概率密度,q表示企业数据的样本,i表示企业数据编号,σ表示模型方差,μ表示模型期望,π表示权值因子,k表示多维高斯混合成分个数,N表示多维高斯分布中的一个分组,且N的表达式为:其中,e表示自然常数。3.根据权利要求1或2所述的一种基于大数据的财税智能化分析方法,其特征在于:所述步骤S3,包括以下子步骤:S31、在参数空间中为λ定义初始值λ0,h∈{0,h
n
},Y=0,Y表示无监督最大期望算法迭代的次数,h表示最佳参数估计值,n表示参数数量;S32、对参数进行判断,若h>1,Y=Y+1,则继续步骤S33,若h≤1,则跳转至步骤S35;S33、通过当前参数及初始值λ0计算辅助函数;S34、在参数空间中使辅助函数极大化,若小于预设阈值则终止迭代,若大于预设阈值则返回步骤S33;S35、迭代算出每个分量的权重,并将权重为零的分量剔除,同时剔除剩余的分量中权重最小的;
S36、输出无监督结果,得到改进最大期望算法。4.根据权利要求1

3任一项所述的一种基于大数据的财税智能化分析方法,其特征在于,所述辅助函数的表达式为:其中,Q(λ,λ0)表示辅助函数,λ与λ0均表示多维高斯混合模型中的参数,且λ={p
j
,μ
j
,C
j
|j=1,2,...,M},M表示多维高斯模型的阶数,j表示高斯分布的数量,x
t
表示特征序列,μ
j
表示均值,C
j
表示协方差矩阵,p表示局部极值。5.根据权利要求1

4任一项所述的一种基于大数据的财税智能化分析方法,其特征在于,所述后验概率密度模型的表达式为:于,所述后验概率密度模型的表达式为:于,所述后验概率密度模型的表达式为:其中,γ
ji
表示后验概率密度函数,p表示高斯混合模型的概率密度,m表示高斯混合模型数量,q表示企业数据的样本,σ表示模型方差,μ表示模型期望,π表示权值因子,s
j
表示随机变量,P表示先验概率,i表示企业数据编号,j表示高斯分布的数量,l表示参数集合数量,k表示参数迭代次数。6.一种基于大数据的财税智能化分析系统,包括以下功能模块:主模块、专家咨询模块、用户模块,其特征在于:所述主模块包括主分析引擎,所述主分析引擎用于执行根据权利要求1

5任一项所述的分析方法;包括主界面,所述主界面上从左至右设置有括三个主按钮,第一主按钮为“税立方”按钮,第二主按钮为“专家咨询”按钮,第三主按钮为“我的”按钮;点击“税立方”按钮后,所述主界面分为上栏、中栏和下栏,所述上栏播放最新动态的宣传片,所述中栏包括多个对应子模块的一级按钮,所述下栏包括热门直播、当前最热门的业务或者政策事项、热点新闻、宣讲会图片、培训课程以及最新的事项,所述主模块还包括多个子模块:工商财税子模块、财税审计子模块、税务顾问子模块、财务顾问子模块、并购重组子模块、股权架构设计子模块、土地资产子模块、高收入高净值...

【专利技术属性】
技术研发人员:钟棂骜戴戴
申请(专利权)人:深圳前海税立方科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1