System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于电力数据分析税务风险的算法模型制造技术_技高网

一种基于电力数据分析税务风险的算法模型制造技术

技术编号:40417798 阅读:7 留言:0更新日期:2024-02-20 22:35
本发明专利技术属于风险算法模型技术领域,具体涉及一种基于电力数据分析税务风险的算法模型,包括下列步骤:项目需求分析与设计阶段包括业务梳理、需求分析和业务设计;数据准备阶段为数据需求梳理与溯源,对项目的具体数据需求进行梳理和对数据来源进行确定;对数据进行预处理,分析层数据接入技术路线设计,多维多层数据溯源;进行模型设计、模型构建以及模型训练与评估。本发明专利技术让数据更好赋能业务,打破专业壁垒,通过构建企业纳税波形库,识别企业电力用户,结合税务信息建立小企业画像,构建企业所属大行业波形库、行业电费及税收风险分析模型;本发明专利技术实现了数据增值服务,为提升电网效率效益提供强力支撑。

【技术实现步骤摘要】

本专利技术属于风险算法模型,具体涉及一种基于电力数据分析税务风险的算法模型


技术介绍

1、目前,税电模型用于电网安全态势预测。税电模型是将企业税收销售发票数据和用电数据结合起来的税电指数,经过测算得出的指标,所产生的税电模型。例如,在电网稳定运行情况下,企业用电量与企业开票金额在一定程度呈现正相关性,当出现税电背离情况时,则通常代表电网安全态势可能出现异常或风险。税电背离主要包括两种情况:一是用电规模与开票额规模背离;二是用电量增长趋势与开票额增长趋势背离,可以通过构建税电背离风险度风险指标体系,对税电背离风险进行量化分析。

2、在实际应用中,由于税务数据和电力基础数据本身存在异常,而现有的预测方法无法对异常数据进行处理或简单舍弃、覆盖异常数据,导致其建立模型后,对电网安全态势预测的准确度不高。


技术实现思路

1、针对上述电网安全态势预测的准确度不高的技术问题,本专利技术提供了一种效率高、准确度高、风险低的基于电力数据分析税务风险的算法模型。

2、为了解决上述技术问题,本专利技术采用的技术方案为:

3、一种基于电力数据分析税务风险的算法模型,包括下列步骤:

4、s1、项目需求分析与设计阶段包括业务梳理、需求分析和业务设计;

5、s2、数据准备阶段为数据需求梳理与溯源,对项目的具体数据需求进行梳理和对数据来源进行确定;

6、s3、对数据进行预处理,分析层数据接入技术路线设计,多维多层数据溯源;

7、s4、进行模型设计、模型构建以及模型训练与评估。

8、所述s1中业务梳理的方法为:对项目的涉及企业的数据特征、数据质量、存储方式、管理方法、业务逻辑方面的业务现状进行调查,并对调查结果进行分析研究。

9、所述s1中需求分析的方法为:充分理解项目涉及企业界定范围、业务特征、行为特征、用电特征典型特征,梳理各业务场景中企业识别和治理的难点和痛点,充分挖掘业务需求。

10、所述s1中业务设计的方法为:构建双高企业的台区用电量和纳税监测分析,通过关联关系,通过对企业的电能表日测量点曲线数据、市场监管局公开的企业工商信息、所属行业大类、税务局及企业app公开税务缴纳数据、敏感企业目录数据信息,完成用户活跃度分析、双高企业税收贡献指数的核定、台区企业用电监测及客户星级评价分析、企业税电费用回收风险预警,从而构建双高企业的台区用电量和纳税监测分析模型。

11、所述s3中分析层数据接入技术路线设计的方法为:按照系统总体架构要求,以数据需求的数据获取频度、业务规则、数据类型、数据存量、数据增量信息为输入,完成数据接入技术路线,技术路线包括历史存量数据抽取技术路线、增量数据抽取技术路线。

12、所述s3中多维多层数据溯源的方法为:

13、s3.1、多表整合,规范格式:数据集合的目的是将所有数据汇总在一张表里,方便计算和处理,将基层业务数据明细表合并汇总成一个完整的数据表,工序包括:导入明细表、转换数据存储格式、合并数据明细表;

14、s3.2、数据清洗,处理异常:根据s3.1合并完成的表单,进行数据清洗、提取工作,对数据进行重新审查和校验,目的在于删除重复信息、纠正存在的错误,并提供数据一致性,对于月电量为空的数据进行常数填充,用0补全缺失电量;针对计算过程中出现的无穷大,用0替换;

15、s3.3、数据探索,寻找特征:描述数据总体规模、分布、关键字段取值信息,反映数据的集中趋势、离散程度、分布形式,使用众数、中位数、平均数、极差、方差、离散系数参数进行表示;描述数据整体趋势和数据特征,通过相关性分析等方式确定与业务目标相关的数据特征、是否存在某种依存关系,包括分析两个因素间相关性、分析三个以上因素间相关性、假定其他因素不变,分析其中两个因素间相关性分析,做到量化。

16、所述s4中模型设计的方法为:按照分析主题场景,结合需求分析结果,借助统计分析、数据挖掘方法构建维度模型和指标模型,对业务需求进行抽象化表达,构建适用于主题的算法模型。

17、所述s4中模型构建的方法为:

18、s4.1、关联规则挖掘从数据集中发现项与项之间的关系,支持度大于等于最小支持度阈值的项集,所以小于最小值支持度的项目为非频度项集,而大于等于最小支持度的项集为频度项集,即缴费欠费次数与缴费违约次数的比值,通过对上述两项进行关联分析从而建立关联模型,能够有效实现有效的短期预测;

19、s4.2、随机选取k个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心,目的是将各项条件聚类子集内所有数据样本的均值作为该聚类的代表点,然后将每个数据点划分到最近的类别中,使得评价效果达到最优,从而使得同一类的对象相似度极高,获得各项指标的权重,并通过变量内部分类和woe权重转化方法进行数据转化对其进行指标分类,从而定义标签得到模型效果;

20、s4.3、时间序列分析是通过时间序列的历史数据揭示某种现象随着时间的变化而变化的规律,并将次规律应用到未来从而进行预测,将企业生产耗能、纳税、违约条件进行时间序列分析,预测企业的缴税行为。

21、所述s4中模型训练与评估的方法为:通过已有数据,对算法模型中未知参数确定后即可得到完整的算法模型,再使用已有数据对完整的算法模型的效果进行评价。

22、所述数据包括内部数据和外部数据,所述内部数据包括:营销业务系统、pms、用电信息采集等系统的台账数据和历史运行数据;

23、外部数据包括:政府侧提供的行业发展、经济数据,工商税务登记信息数据、税务缴费数据;并将获取的已整理清洗的数据按季导入至数据中台建立的表中以供读取使用。

24、本专利技术与现有技术相比,具有的有益效果是:

25、本专利技术通过数据分析得到优质用电企业,积极培育税源,促进企业持续健康发展,为公司发展业务转型升级,助力优化营商环境。本专利技术让数据更好赋能业务,打破专业壁垒,通过构建企业纳税波形库,识别企业电力用户,结合税务信息建立小企业画像,构建企业所属大行业波形库、行业电费及税收风险分析模型;本专利技术实现了数据增值服务,为提升电网效率效益提供强力支撑。

本文档来自技高网...

【技术保护点】

1.一种基于电力数据分析税务风险的算法模型,其特征在于:包括下列步骤:

2.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S1中业务梳理的方法为:对项目的涉及企业的数据特征、数据质量、存储方式、管理方法、业务逻辑方面的业务现状进行调查,并对调查结果进行分析研究。

3.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S1中需求分析的方法为:充分理解项目涉及企业界定范围、业务特征、行为特征、用电特征典型特征,梳理各业务场景中企业识别和治理的难点和痛点,充分挖掘业务需求。

4.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S1中业务设计的方法为:构建双高企业的台区用电量和纳税监测分析,通过关联关系,通过对企业的电能表日测量点曲线数据、市场监管局公开的企业工商信息、所属行业大类、税务局及企业APP公开税务缴纳数据、敏感企业目录数据信息,完成用户活跃度分析、双高企业税收贡献指数的核定、台区企业用电监测及客户星级评价分析、企业税电费用回收风险预警,从而构建双高企业的台区用电量和纳税监测分析模型。

5.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S3中分析层数据接入技术路线设计的方法为:按照系统总体架构要求,以数据需求的数据获取频度、业务规则、数据类型、数据存量、数据增量信息为输入,完成数据接入技术路线,技术路线包括历史存量数据抽取技术路线、增量数据抽取技术路线。

6.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S3中多维多层数据溯源的方法为:

7.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S4中模型设计的方法为:按照分析主题场景,结合需求分析结果,借助统计分析、数据挖掘方法构建维度模型和指标模型,对业务需求进行抽象化表达,构建适用于主题的算法模型。

8.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S4中模型构建的方法为:

9.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述S4中模型训练与评估的方法为:通过已有数据,对算法模型中未知参数确定后即可得到完整的算法模型,再使用已有数据对完整的算法模型的效果进行评价。

10.根据权利要求5所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述数据包括内部数据和外部数据,所述内部数据包括:营销业务系统、PMS、用电信息采集等系统的台账数据和历史运行数据;

...

【技术特征摘要】

1.一种基于电力数据分析税务风险的算法模型,其特征在于:包括下列步骤:

2.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述s1中业务梳理的方法为:对项目的涉及企业的数据特征、数据质量、存储方式、管理方法、业务逻辑方面的业务现状进行调查,并对调查结果进行分析研究。

3.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述s1中需求分析的方法为:充分理解项目涉及企业界定范围、业务特征、行为特征、用电特征典型特征,梳理各业务场景中企业识别和治理的难点和痛点,充分挖掘业务需求。

4.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述s1中业务设计的方法为:构建双高企业的台区用电量和纳税监测分析,通过关联关系,通过对企业的电能表日测量点曲线数据、市场监管局公开的企业工商信息、所属行业大类、税务局及企业app公开税务缴纳数据、敏感企业目录数据信息,完成用户活跃度分析、双高企业税收贡献指数的核定、台区企业用电监测及客户星级评价分析、企业税电费用回收风险预警,从而构建双高企业的台区用电量和纳税监测分析模型。

5.根据权利要求1所述的一种基于电力数据分析税务风险的算法模型,其特征在于:所述s3中分析层数据接入技术路...

【专利技术属性】
技术研发人员:落全钢刘冠雄李英张俊宇程强孙艳亮
申请(专利权)人:国网山西省电力公司朔州供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1