数据标签的标记方法、装置和处理器制造方法及图纸

技术编号:34448125 阅读:39 留言:0更新日期:2022-08-06 16:45
本申请提供了一种数据标签的标记方法、装置和处理器。获取第一类型数据和第二类型数据,且对第一类型数据进行标记,得到第一标签值,对第二类型数据进行标记,得到第二标签值;按照预定聚类算法对第一类型数据和第二类型数据进行聚类,得到多个数据簇;确定第一类型数据在各数据簇中的所占比例;根据所占比例,对第一类型数据和第二类型数据进行二次标记,使得各数据簇中的至少部分第一标签值更新为第二标签值,至少部分第二标签值更新为第一标签值。该方案中,根据第一类型数据在各数据簇中的所占比例,对第一类型数据和第二类型数据进行二次标记,数据进行了二次标记后,得到的标签数据较为准确,进而提高了对未知的数据进行预测时的准确性。行预测时的准确性。行预测时的准确性。

【技术实现步骤摘要】
数据标签的标记方法、装置和处理器


[0001]本申请涉及数据处理领域,具体而言,涉及一种数据标签的标记方法、装置、计算机可读存储介质和处理器。

技术介绍

[0002]在对数据进行聚类时,要对数据进行标记,得到标签数据,标签数据就带有了标记信息,对已有标记信息的标签数据通过机器学习算法进行模型训练,可以对未知的数据进行预测,但是,在对数据进行标记的过程中,由于是对数据进行一次标记,经过一次标记得到的标签数据并不准确,进而对未知的数据进行预测时的准确性较低。

技术实现思路

[0003]本申请的主要目的在于提供一种数据标签的标记方法、装置、计算机可读存储介质和处理器,以解决现有技术中经过一次标记的数据准确性较低的问题。
[0004]根据本专利技术实施例的一个方面,提供了一种数据标签的标记方法,包括:获取第一类型数据和第二类型数据,且对所述第一类型数据进行标记,得到第一标签值,对所述第二类型数据进行标记,得到第二标签值;按照预定聚类算法对所述第一类型数据和所述第二类型数据进行聚类,得到多个数据簇,各所述数据簇中包括至少一个所述第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据标签的标记方法,其特征在于,包括:获取第一类型数据和第二类型数据,且对所述第一类型数据进行标记,得到第一标签值,对所述第二类型数据进行标记,得到第二标签值;按照预定聚类算法对所述第一类型数据和所述第二类型数据进行聚类,得到多个数据簇,各所述数据簇中包括至少一个所述第一类型数据和至少一个所述第二类型数据;确定所述第一类型数据在各所述数据簇中的所占比例;根据所述所占比例,对所述第一类型数据和所述第二类型数据进行二次标记,使得各所述数据簇中的至少部分所述第一标签值更新为所述第二标签值,至少部分所述第二标签值更新为所述第一标签值。2.根据权利要求1所述的方法,其特征在于,根据所述所占比例,对所述第一类型数据和所述第二类型数据进行二次标记,使得各所述数据簇中的至少部分所述第一标签值更新为所述第二标签值,至少部分所述第二标签值更新为所述第一标签值,包括:在所述所占比例大于比例阈值的情况下,将当前的所述数据簇中的所述第二类型数据的标签值更新为所述第一标签值;在所述所占比例小于或者等于所述比例阈值的情况下,将当前的所述数据簇中的所述第一类型数据的标签值更新为所述第二标签值。3.根据权利要求2所述的方法,其特征在于,在所述所占比例大于比例阈值的情况下,将当前的所述数据簇中的所述第二类型数据的标签值更新为所述第一标签值,包括:将所述所占比例大于所述比例阈值的当前的所述数据簇确定为目标数据簇;将所述目标数据簇中的预定个数的所述第二类型数据的标签值更新为所述第一标签值。4.根据权利要求2所述的方法,其特征在于,在所述所占比例小于或者等于所述比例阈值的情况下,将当前的所述数据簇中的所述第一类型数据的标签值更新为所述第二标签值,包括:将所述所占比例小于或者等于所述比例阈值的当前的所述数据簇确定为非目标数据簇;将所述非目标数据簇中的所有的所述第一类型数据的标签值更新为所述第二标签值。5.根据权利要求2所述的方法,其特征在于,在所述所占比例大于比例阈值的情况下,将当前的所述数据簇中的所述第二类型数据的标签值更新为所述第一标签值,包括:在多个所述数据簇中的所述...

【专利技术属性】
技术研发人员:陈敏陈震宇刘国华李少波
申请(专利权)人:中国邮政储蓄银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1