一种基于大数据分类算法的贸易摩擦预警模型制造技术

技术编号:18115747 阅读:138 留言:0更新日期:2018-06-03 08:35
本发明专利技术涉及经济运行监测系统技术领域,尤其是一种基于大数据分类算法的贸易摩擦预警模型,其中模型的方法步骤为:步骤一:构建数据标记与贸易摩擦体系指标分组;步骤二:构建专家评分模型;步骤三:构建SVM分类器;步骤四:训练分类模型;步骤五:贸易摩擦预警区间;步骤六:应用模型预测结果和区间确定。本发明专利技术有益效果:本发明专利技术提供的方法基于统计学理论,结合最新的数据挖掘理论实施方法,采用专家评分评估模型和层次分析法,并提前以历史数据作为模型构建的基础,能达到快速、科学、客观的计算贸易摩擦指数的结果;同时,模型提供了区间分类的算法,计算出了贸易摩擦风险等级区间,为计算出来的贸易摩擦结果提供贸易摩擦风险预测。

【技术实现步骤摘要】
一种基于大数据分类算法的贸易摩擦预警模型
本专利技术涉及经济运行监测系统
,尤其是一种基于大数据分类算法的贸易摩擦预警模型。
技术介绍
贸易摩擦,是指在国际贸易中,国与国之间在进行贸易往来的过程中,在贸易平衡上所产生的、一般是一国的持续顺差、另一国的逆差、或一国的贸易活动触及或伤害另一国的产业。当前的国际贸易摩擦形势呈现两个新特点:(1)正在上台阶;(2)日趋激烈化。上台阶是指正在上第三个台阶。第一个台阶是关税壁垒、行政保护措施。世贸组织使所有成员大大降低了关税,努力取消行政保护措施。因此,这种初级贸易摩擦形式和手段已经大大弱化。第二个台阶是世贸组织允许各成员采取的3种合法的贸易保护手段--反倾销、反补贴、保障措施方兴未艾,同时,一些针对中国的特别保障措施以及贸易转移、市场扰乱、市场经济地位等手段和概念也在频频发生与使用。目前,贸易保护措施又上到新的第三个台阶:技术性贸易壁垒。技术性贸易壁垒摩擦过去也有,但现在比过去更加广泛化。但是随着近年遭遇的反补贴、技术壁垒日益增多,如何贸易国之间的博弈能占据优势,如何能降低贸易摩擦发生的概率,如何能提早发现贸易摩擦的苗头,进而采取一系列措施来预防或者阻止贸易损害的发生。贸易摩擦预警指标模型的建立能够提前预知当前贸易摩擦的趋势,为政府提供辅助决策。现有的贸易摩擦指数考虑更多的是政策因素,缺少了其他因素的介入会导致数据结果产生一定的偏差,并且计算出来的结果缺少一个贸易摩擦风险等级区间参考。传统解决方案中对贸易摩擦指数基于政策因素较多,然后再人工计算评估,因此在评估过程中估存在一定的主观性,经验差异性、漏判、误判等情况,而且在贸易摩擦体系不完善,计算出来的结果存在不客观新和缺少科学依据。因此,对于上述问题有必要提出一种基于大数据分类算法的贸易摩擦预警模型。
技术实现思路
本专利技术目的是克服了现有技术中的不足,提供了一种基于大数据分类算法的贸易摩擦预警模型。为了解决上述技术问题,本专利技术是通过以下技术方案实现:一种基于大数据分类算法的贸易摩擦预警模型,其中模型的方法步骤为:步骤一:构建数据标记与贸易摩擦体系指标分组;步骤二:构建专家评分模型;步骤三:构建SVM分类器;步骤四:训练分类模型;步骤五:贸易摩擦预警区间;步骤六:应用模型预测结果和区间确定。优选地,其特征在于:步骤一中的贸易摩擦体系指标包括倾销因素指标、非倾销因素指标和对进口国构成产业损害的预警指标。优选地,其中倾销因素指标包括同类产品进出口量及价格的变化率、同类产品进出口量分国别变化率、同类产品进出口价格分国别变化率、产品产量、销售量和销售价格变化率、产品产销率变化率、产品产能变化率、产品库存变化率、产品期末开工率变化率、产品销售利润变化率和期末失业率变化率。优选地,其中构建专家评分模型包括专家评分模型建立和指标得分率计算。优选地,其中专家评分模型建立对数量和时间答案的处理式中为评价结果,p为正整数,n为专家数,专家评分值从大到小排列,则Xp+1公式表示奇数个专家评分的中位数,(Xp+Xp+1)/2表示偶数个专家评分的中位数。优选地,其中指标得分率计算设贸易摩擦指数有18个评价领域(鉴于模型的拓展性,将评价领域设定为m个),有n个专家参与评价,设某一专家k给出的评分值集合为{Xi(j)}(k),式中{Xi(j)}(k)表示第k=1,2,···,n个专家对第i(i=1,2,···,n)领域的评分序分值,其值为j(j=1,2,···,m)。根据可将序分值集合转化为基分值集合其中根据可将序分值集合转化为基分值集合其中表示第k个专家对第i个领域排在第j位时所对应的基数分值。然后,用下述公式计算每个研究领域的重要程度:在(2)以及(3)式中,m在(2)以及(3)式中,m表示领域数;Si表示i领域得分值;n表示专家数;Bi(j)表示i领域排在j位得分值;Ni表示赞同某一领域排在第j位的人计算得到的所有14个项目得分率Si组合成一个18维的向量x=[a1,a2,…,a18],该向量即表示一个二级指标的评分情况。计算所有二级指标评分情况向量,构成全体数据集Z={zn,n∈R}。优选地,进一步的对全体数据集Z中的数据进行标号分类,所有高得分率二级指标标注为1,非高得分率二级指标标注为-1。并将标注结果后全体数据集中随机取出的60%数据组合构成训练数据集Strain={(zn,yn)|zn∈Z,zn∈{-1,1},n=1,2,3…}其中zn为第n个二级指标的得分率向量,yn为对应第n个二级指标的得分率结果,其余40%作为测试数据集Stest={(zm,ym)|zm∈Z,ym∈{-1,1},m=1,2,3…}其中zm为第m个二级指标的得分率向量,ym为对应第m个二级指标的得分率结果。优选地,构建SVM分类器进一步的包括:设给定的训练集为{(z1,y1),(z2,y2),…,(zn,yn)}其中zi∈Rn为输入向量,yi∈{-1,1}为输出向量,假设该训练集可被一个超平面W·Z+b=0线性划分,问题转化为求最优化超平面问题:对于非线性可分的情况,可以通过一个映射函数(在SVM称核函数),将低维的输入空间Rn映射到高维的特征空间H,使线性可分。则优化问题转化为Step3.解出式(2)最优化函数为:从式(2)最小化问题可以得出,选择合适的函数K(·)和C即可以确定SVM分类器;选用RBF径向基核函数,即K(Zi,Zj)=exp(-γ||Zi-Zj||)2,则分类器的优化问题最终转化为参数对(C,γ)的选择问题。优选地,训练分类模型进一步的包括:(1)以1≤C≤1000和0≤γ≤100为范围,构建取值范围内所有C和γ组成的参数对。(2)依次取参数对(C,γ)作为基于RBF核函数的SVM分类器参数初始值,训练数据向量集Strain和测试数据向量集Stest,记这一分类模型下对测试数据集预测的准确率为pt。(3)针对测试集准确率,用计算机程序调整测试SVM算法中不同的C值和γ值参数对,使准确率pt达到预定要求的准确率p0,并保存记录这一准确率p0下的模型参数对(C0,γ0),即这一参数对为所求SVM分类模型的模型参数。优选地,其中应用模型预测结果和区间确定通过步骤五的训练分类模型,终求出的第三层对第二层的权重向量用代数分别表示为(α1,α2,…,αr),(β1,β2,…,βs),(γ1,γ2,…,γt),而第二层对第一层的权重向量可表示(ω1,ω2,ω3)。由于不同的数据有不同的意义和不同的量纲,为了进行有效地统一,必须对数据进行适当的变换。首先要对数据进行归一化变换,然后再进行标准化变换,把所有的数据都压缩到闭区间[0,1]中;假设某一指标近n年的指标值分别为x1,x2,...,xm,首先将每个指标数据归一化,归一化公式,其中为归一化后的数据,为n个指标值的平均值,为标准差。然后对归一化后的数据再进行极值标准化,其中和分别是n个中的最大值和最小值,经过这两步转换后便落到了闭区间[0,1]中。近n年所有指标数据都经过上述的过程进行转换,则得到转换后的数据:得到个指标数据的取值区间为:区间的上限和下限分别是指该指标近年的最大值和最小值,其中A对应的指标对贸易摩擦可能性起反向作用,即a1,a2,…,an表示的指标数据越大,贸易摩擦发生的可本文档来自技高网
...
一种基于大数据分类算法的贸易摩擦预警模型

【技术保护点】
一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:其中模型的方法步骤为:步骤一:构建数据标记与贸易摩擦体系指标分组;步骤二:构建专家评分模型;步骤三:构建SVM分类器;步骤四:训练分类模型;步骤五:贸易摩擦预警区间;步骤六:应用模型预测结果和区间确定。

【技术特征摘要】
1.一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:其中模型的方法步骤为:步骤一:构建数据标记与贸易摩擦体系指标分组;步骤二:构建专家评分模型;步骤三:构建SVM分类器;步骤四:训练分类模型;步骤五:贸易摩擦预警区间;步骤六:应用模型预测结果和区间确定。2.如权利要求1所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:步骤一中的贸易摩擦体系指标包括倾销因素指标、非倾销因素指标和对进口国构成产业损害的预警指标。3.如权利要求2所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:其中倾销因素指标包括同类产品进出口量及价格的变化率、同类产品进出口量分国别变化率、同类产品进出口价格分国别变化率、产品产量、销售量和销售价格变化率、产品产销率变化率、产品产能变化率、产品库存变化率、产品期末开工率变化率、产品销售利润变化率和期末失业率变化率。4.如权利要求1所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:其中构建专家评分模型包括专家评分模型建立和指标得分率计算。5.如权利要求1所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:其中专家评分模型建立对数量和时间答案的处理式中为评价结果,p为正整数,n为专家数,专家评分值从大到小排列,则Xp+1公式表示奇数个专家评分的中位数,(Xp+Xp+1)/2表示偶数个专家评分的中位数。6.如权利要求1所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:其中指标得分率计算设贸易摩擦指数有18个评价领域,有n个专家参与评价,设某一专家k给出的评分值集合为{Xi(j)}(k),式中{Xi(j)}(k)表示第k=1,2,···,n个专家对第i(i=1,2,···,n)领域的评分序分值,其值为j(j=1,2,···,m),根据可将序分值集合转化为基分值集合{Bi(j)}(k),其中根据可将序分值集合转化为基分值集合{Bi(j)}(k),其中{Bi(j)}(k)表示第k个专家对第i个领域排在第j位时所对应的基数分值,然后,用下述公式计算每个研究领域的重要程度:在(2)以及(3)式中,m在(2)以及(3)式中,m表示领域数;Si表示i领域得分值;n表示专家数;Bi(j)表示i领域排在j位得分值;Ni表示赞同某一领域排在第j位的人计算得到的所有14个项目得分率Si组合成一个18维的向量x=[a1,a2,…,a18],该向量即表示一个二级指标的评分情况,计算所有二级指标评分情况向量,构成全体数据集Z={zn,n∈R}。7.如权利要求6所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:进一步的对全体数据集Z中的数据进行标号分类,所有高得分率二级指标标注为1,非高得分率二级指标标注为-1;并将标注结果后全体数据集中随机取出的60%数据组合构成训练数据集Strain={(zn,yn)|zn∈Z,zn∈{-1,1},n=1,2,3…}其中zn为第n个二级指标的得分率向量,yn为对应第n个二级指标的得分率结果,其余40%作为测试数据集Stest={(zm,ym)|zm∈Z,ym∈{-1,1},m=1,2,3…}其中zm为第m个二级指标的得分率向量,ym为对应第m个二级指标的得分率结果。8.如权利要求6所述的一种基于大数据分类算法的贸易摩擦预警模型,其特征在于:构建SVM分类器进一步的包括:设给定的训练集为{(z1,y1),(z2,y2),…,(zn,yn)}其中zi∈Rn为输入向量,yi∈{-1,1}为输出向量,假设该训练集可被一个超平面W·Z+b=0线性划分,问题转化为求最优化超平面问题:对于非线性可分的情况,可以通过一个映射函数(在SVM称核函数),将低维的输入空间Rn映射到高维的特征空间H,使线性可分;则优化问题转化为

【专利技术属性】
技术研发人员:王晓佳蔡文鑫
申请(专利权)人:广东广业开元科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1