一种基于半监督学习的矿业项目评价方法技术

技术编号:38475452 阅读:12 留言:0更新日期:2023-08-15 16:55
本发明专利技术公开了一种基于半监督学习的矿业项目评价方法,包括以下步骤:分析矿业项目评价的影响因素确定出矿业项目的评价指标,依据历史矿业项目评价库抽取多种类历史矿业项目作为有标记训练样本和无标记训练样本,并将有标记训练样本的评价指标和评价结果进行逐一项目对应构建出有标记训练数据集,将无标记训练样本的评价指标构建出无标记训练数据集;采用半监督支持向量机基于有标记训练数据集和无标记训练数据集对有标记训练样本和无标记训练样本进行模型训练构建出矿业项目评价模型。本发明专利技术基于有限的矿业项目的评价结果,半监督方法解决了标签数据不足的情况,改善了无监督学习过程盲目性、监督学习在训练样本不足导致的学习效果不佳的问题。导致的学习效果不佳的问题。导致的学习效果不佳的问题。

【技术实现步骤摘要】
一种基于半监督学习的矿业项目评价方法


[0001]本专利技术涉及矿业项目评价
,具体涉及一种基于半监督学习的矿业项目评价方法。

技术介绍

[0002]目前,众多学者围绕着矿业项目评价的方法开展了一系列研究,如专家判别法、数据驱动方法。专家判别法主要根据以往人工经验进行判定,对评价人员的经验和水平要求较高,同时判别的结果也具有主观性;基于机器学习的数据驱动方法主要根据矿业项目的评价指标,采用机器学习方法进行自动识别,该方法对训练数据集要求较高,需要较多的训练数据集才能得到精度较高的模型。而由于矿业项目评价结果较少,也即数据标签较少,采用常规机器学习方法无法得到泛化性好、可移植性强的模型。

技术实现思路

[0003]本专利技术的目的在于提供一种基于半监督学习的矿业项目评价方法,以解决现有技术中无法得到泛化性好、可移植性强的模型的技术问题。
[0004]为解决上述技术问题,本专利技术具体提供下述技术方案:
[0005]一种基于半监督学习的矿业项目评价方法,包括以下步骤:
[0006]步骤S1、分析矿业项目评价的影响因素确定出矿业项目的评价指标,依据历史矿业项目评价库抽取多种类历史矿业项目作为有标记训练样本和无标记训练样本,并将有标记训练样本的评价指标和评价结果进行逐一项目对应构建出有标记训练数据集,将无标记训练样本的评价指标构建出无标记训练数据集;
[0007]步骤S2、采用半监督支持向量机基于有标记训练数据集和无标记训练数据集对有标记训练样本和无标记训练样本进行模型训练构建出矿业项目评价模型,其中,半监督支持向量机的参数采用改进的网格搜索方法进行优化;
[0008]步骤S3、获取当前待评价矿业项目的评价指标的数据值,利用矿业项目评价模型基于待评价矿业项目的评价指标的数据值得到当前待评价矿业项目的评价结果;
[0009]步骤S4、将当前待评价矿业项目的评价结果和评价指标的数据值对矿业项目评价模型进行更新迭代。
[0010]作为本专利技术的一种优选方案,所述矿业项目评价的影响因素包括矿业资源禀赋、矿业投资环境、矿业生产能力,所述矿业项目的评价指标包括矿山资源量、矿山储量、矿业政策风险、矿业法律风险、矿山设计产能,所述评价结果包括推介项目、重大项目和一般项目。
[0011]作为本专利技术的一种优选方案,所述依据历史矿业项目评价库抽取多种类历史矿业项目作为有标记训练样本和无标记训练样本,包括:
[0012]将历史矿业项目评价库中的所有历史矿业项目依据评价指标构建出矿业项目全关联网络,其中,矿业项目全关联网络的构建包括:
[0013]在历史矿业项目评价库中的所有历史矿业项目间量化任意两个历史矿业项目的评价指标相似性,并将评价指标相似性高于阈值的两个历史矿业项目间设置连接边;
[0014]将历史矿业项目评价库中的所有历史矿业项目抽象为网络节点,将存在连接边的历史矿业项目间对应的网络节点进行连接得到所述矿业项目全关联网络;
[0015]将历史矿业项目评价库中同历史时期的历史矿业项目依据评价指标构建出矿业项目同期关联网络,其中,矿业项目同期关联网络的构建包括:
[0016]在历史矿业项目评价库中同历史时期的历史矿业项目间量化任意两个历史矿业项目的评价指标相似性,并将评价指标相似性高于阈值的两个历史矿业项目间设置连接边;
[0017]将历史矿业项目评价库中同历史时期的历史矿业项目抽象为网络节点,将存在连接边的历史矿业项目间对应的网络节点进行连接得到所述矿业项目同期关联网络;
[0018]将所述矿业项目全关联网络与所述矿业项目同期关联网络分别进行社区划分得到多个矿业项目类别全关联集合和多个矿业项目同期关联集合,将多个矿业项目类别全关联集合和多个矿业项目同期关联集合进行交集运算得到多种类矿业项目集合;
[0019]在多种类矿业项目集合中分别抽取多个历史矿业项目组合成多种类历史矿业项目作为有标记训练样本;
[0020]在除多种类矿业项目集合外的矿业项目类别全关联集合中抽取多个历史矿业项目作为无标记训练样本;
[0021]所述矿业项目集合的种类包括推介项目、重大项目和一般项目。
[0022]作为本专利技术的一种优选方案,所述评价指标相似性利用欧式距离、相关系数、jaccard指数中的至少一种进行量化。
[0023]作为本专利技术的一种优选方案,所述社区划分的目标函数为模块度。
[0024]作为本专利技术的一种优选方案,所述采用半监督支持向量机基于有标记训练数据集和无标记训练数据集对有标记训练样本和无标记训练样本进行模型训练构建出矿业项目评价模型,包括:
[0025]采用半监督支持向量机基于有标记训练数据集进行模型训练构建出矿业项目评价初始模型SVM
init

[0026]利用矿业项目评价初始模型SVM
init
对无标记训练数据集的无标记训练样本进行评价结果预测,构建无标记训练样本的评价结果的迭代更新目标函数,以提高无标记训练样本的评价结果的准确性;
[0027]利用无标记训练样本的评价结果的迭代更新结果对无标记训练数据集进行更新,将更新后的无标记训练数据集与有标记训练数据集进行融合得到训练数据集;
[0028]基于融合得到的训练数据集利用网格搜索方法对矿业项目评价初始模型SVM
init
进行参数优化得到矿业项目评价最终模型SVM
last

[0029]所述迭代更新目标函数的函数表达式为:
[0030][0031]迭代更新目标函数的约束条件为:
[0032]y
i

T
κ(x
i
)+b]≥1

ξ
i
[0033][0034]ξ
i
≥0,i=1,2,

,N
[0035]式中,ω为权重矢量矩阵;κ()为核函数;x
i
为数据集中的特征参数,即评价指标;b为偏置,常数;C
l
和C
u
分别为有标记训练数据集与无标记训练数据集惩罚系数;ξ
i
为第i次迭代的松弛变量;N为无标记训练样本与有标记训练样本的个数总和;l为有标记训练样本的个数;为无标签数据集的预测结果;y
i
是有标签数据集对应的标签,为评价结果;min为最小化运算符;i为计数变量;T为转置运算符。
[0036]作为本专利技术的一种优选方案,所述半监督支持向量机的参数采用改进的网格搜索方法进行优化,包括:
[0037]在网格搜索方法中将惩罚系数C
l
和C
u
设置为非等间隔步长搜索,在惩罚系数C
l
和C
u
的取值范围内利用非等间隔步长搜索进行半监督支持向量机的参数搜索确定;
[0038]将每次搜索确定的各组半监督支持向量机的参数依次得到每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于半监督学习的矿业项目评价方法,其特征在于,包括以下步骤:步骤S1、分析矿业项目评价的影响因素确定出矿业项目的评价指标,依据历史矿业项目评价库抽取多种类历史矿业项目作为有标记训练样本和无标记训练样本,并将有标记训练样本的评价指标和评价结果进行逐一项目对应构建出有标记训练数据集,将无标记训练样本的评价指标构建出无标记训练数据集;步骤S2、采用半监督支持向量机基于有标记训练数据集和无标记训练数据集对有标记训练样本和无标记训练样本进行模型训练构建出矿业项目评价模型,其中,半监督支持向量机的参数采用改进的网格搜索方法进行优化;步骤S3、获取当前待评价矿业项目的评价指标的数据值,利用矿业项目评价模型基于待评价矿业项目的评价指标的数据值得到当前待评价矿业项目的评价结果;步骤S4、将当前待评价矿业项目的评价结果和评价指标的数据值对矿业项目评价模型进行更新迭代。2.根据权利要求1所述的一种基于半监督学习的矿业项目评价方法,其特征在于:所述矿业项目评价的影响因素包括矿业资源禀赋、矿业投资环境、矿业生产能力,所述矿业项目的评价指标包括矿山资源量、矿山储量、矿业政策风险、矿业法律风险、矿山设计产能,所述评价结果包括推介项目、重大项目和一般项目。3.根据权利要求1所述的一种基于半监督学习的矿业项目评价方法,其特征在于:所述依据历史矿业项目评价库抽取多种类历史矿业项目作为有标记训练样本和无标记训练样本,包括:将历史矿业项目评价库中的所有历史矿业项目依据评价指标构建出矿业项目全关联网络,其中,矿业项目全关联网络的构建包括:在历史矿业项目评价库中的所有历史矿业项目间量化任意两个历史矿业项目的评价指标相似性,并将评价指标相似性高于阈值的两个历史矿业项目间设置连接边;将历史矿业项目评价库中的所有历史矿业项目抽象为网络节点,将存在连接边的历史矿业项目间对应的网络节点进行连接得到所述矿业项目全关联网络;将历史矿业项目评价库中同历史时期的历史矿业项目依据评价指标构建出矿业项目同期关联网络,其中,矿业项目同期关联网络的构建包括:在历史矿业项目评价库中同历史时期的历史矿业项目间量化任意两个历史矿业项目的评价指标相似性,并将评价指标相似性高于阈值的两个历史矿业项目间设置连接边;将历史矿业项目评价库中同历史时期的历史矿业项目抽象为网络节点,将存在连接边的历史矿业项目间对应的网络节点进行连接得到所述矿业项目同期关联网络;将所述矿业项目全关联网络与所述矿业项目同期关联网络分别进行社区划分得到多个矿业项目类别全关联集合和多个矿业项目同期关联集合,将多个矿业项目类别全关联集合和多个矿业项目同期关联集合进行交集运算得到多种类矿业项目集合;在多种类矿业项目集合中分别抽取多个历史矿业项目组合成多种类历史矿业项目作为有标记训练样本;在除多种类矿业项目集合外的矿业项目类别全关联集合中抽取多个历史矿业项目作为无标记训练样本;所述矿业项目集合的种类包括推介项目、重大项目和一般项目。
4.根据权利要求3所述的一种基于半监督学习的矿业项目评价方法,其特征在于:所述评价指标相似性利用欧式距离、相关系数、jaccard指数中的至少一种进行量化。5.根据权利要求3所述的一种基于半监督学习的矿业项目评价方法,其特征在于:所述社区划分的目标函数为模块度。6.根据权利要求1所述的一种基于半监督学习的矿业项目评价方法,其特征在于:所述采用半监督支持向量机基于有标记训练数据集和无标记训练数据集对有标记训练样本和无标记训练样本进行模型训练构建出矿业项目评价模型,包括:采用半监督支持向量机基于有标记训练数据集进行模型训练构建出矿业项目评价初始模型SVM
init
;利用矿业项目评价初始模型SVM
init

【专利技术属性】
技术研发人员:张艳向杰朱清邢凯温鹏飞严煦陈志勇成少博陈洋
申请(专利权)人:中国矿业报社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1