数据分类的方法和装置制造方法及图纸

技术编号:16038698 阅读:34 留言:0更新日期:2017-08-19 20:33
本公开涉及一种数据分类的方法和装置,该方法包括:获取待分类数据以及已知分类结果的数据分类样本,根据该数据分类样本对该待分类数据进行分类得到第一分类结果,获取该数据分类样本的第一分类权重和该待分类数据的第二分类权重,根据该第二分类权重得到对应该第一分类结果的第三分类权重和第四分类权重,根据该第三分类权重和该第四分类权重得到目标分类权重,在该目标分类权重和该第一分类权重满足预设分类终止条件时,确定分类完成。

【技术实现步骤摘要】
数据分类的方法和装置
本公开涉及数据处理领域,具体地,涉及一种数据分类的方法和装置。
技术介绍
风能作为最具规模开发潜力的可再生新能源,近年来发展十分迅速,但是,当风力发电机的某些部件发生异常时,使得风力发电机的实际发电量无法达到目标发电量(即风力发电厂给风力发电机下达的发电量),从而造成限功率。为了解决这种情况,可以通过采集风力发电机的工作数据,并通过已知的限功率数据和非限功率数据对采集的工作数据进行分类,以确定该工作数据是造成限功率的限功率数据还是未造成限功率的非限功率数据,并根据分类结果确定会造成限功率的工作数据,从而调整风力发电机的工作数据,以避免限功率的发生。现有的分类方法包括获取未确定分类结果的待分类数据以及已知分类结果的数据分类样本(即限功率数据和非限功率数据),并将数据分类样本代入SVM(SupportVectorMachine,支持向量机)模型中进行训练得到训练后的分类模型,通过该训练后的分类模型对待分类数据进行分类得到初始分类结果,为了提高初始分类结果的准确率,进一步采用TSVM(TransductiveSupportVectorMachine,直推支持向量机)方本文档来自技高网...
数据分类的方法和装置

【技术保护点】
一种数据分类的方法,其特征在于,所述方法包括:获取待分类数据以及已知分类结果的数据分类样本;根据所述数据分类样本对所述待分类数据进行分类得到第一分类结果;获取所述数据分类样本的第一分类权重和所述待分类数据的第二分类权重,其中,所述第一分类权重表示所述数据分类样本的分类结果的置信度,所述第二分类权重表示所述待分类数据的分类结果的置信度;根据所述第二分类权重得到对应所述第一分类结果的第三分类权重和第四分类权重;根据所述第三分类权重和所述第四分类权重得到目标分类权重;在所述目标分类权重和所述第一分类权重满足预设分类终止条件时,确定分类完成。

【技术特征摘要】
1.一种数据分类的方法,其特征在于,所述方法包括:获取待分类数据以及已知分类结果的数据分类样本;根据所述数据分类样本对所述待分类数据进行分类得到第一分类结果;获取所述数据分类样本的第一分类权重和所述待分类数据的第二分类权重,其中,所述第一分类权重表示所述数据分类样本的分类结果的置信度,所述第二分类权重表示所述待分类数据的分类结果的置信度;根据所述第二分类权重得到对应所述第一分类结果的第三分类权重和第四分类权重;根据所述第三分类权重和所述第四分类权重得到目标分类权重;在所述目标分类权重和所述第一分类权重满足预设分类终止条件时,确定分类完成。2.根据权利要求1所述的方法,其特征在于,所述第一分类结果包括第一类数据和第二类数据,在所述根据所述第二分类权重得到对应所述第一分类结果的第三分类权重和第四分类权重前,所述方法还包括:获取所述第一类数据包括的数据的第一数量和所述第二类数据包括的数据的第二数量;计算所述第一数量和所述第二数量之间的和值;所述根据所述第二分类权重得到对应所述第一分类结果的第三分类权重和第四分类权重包括:根据所述和值以及第二分类权重得到所述第一类数据对应的第三分类权重和所述第二类数据对应的第四分类权重。3.根据权利要求2所述的方法,其特征在于,所述根据所述和值以及第二分类权重得到所述第一类数据对应的第三分类权重和所述第二类数据对应的第四分类权重包括:通过以下公式获取所述第三分类权重:其中,表示第三分类权重;Cz表示第二分类权重;n表示第一数量与第二数量之间的和值;表示第一数量;通过以下公式获取所述第四分类权重:其中,表示第四分类权重;Cz表示第二分类权重;n表示第一数量与第二数量之间的和值;表示第二数量。4.根据权利要求2所述的方法,其特征在于,在所述根据所述第三分类权重和所述第四分类权重得到目标分类权重前,所述方法还包括:计算所述第一数量和所述第二数量之间的差值;确定所述差值是否大于或者等于0;所述根据所述第三分类权重和所述第四分类权重得到目标分类权重包括:在所述差值大于或者等于0时,通过以下公式得到所述目标分类权重:1其中,表示目标分类权重;表示第三分类权重;表示第四分类权重;f(Δn)表示预设权重函数,Δn表示第一数量与第二数量之间的差值;在所述差值小于0时,通过以下公式得到所述目标分类权重:其中,表示目标分类权重;表示第三分类权重;表示第四分类权重;f(Δn)表示预设权重函数,Δn表示第一数量与第二数量之间的差值。5.根据权利要求1至4任一项所述的方法,其特征在于,所述预设分类终止条件包括:根据所述目标分类权重得到的第五分类权重大于或者等于所述第一分类权重,所述第五分类权重为所述目标分类权重与预设参数的乘积,所述预设参数为大于1的数值。6.根据权利要求5所述的方法...

【专利技术属性】
技术研发人员:周方超
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1