数据分类方法、装置、计算机装置及存储介质制造方法及图纸

技术编号:22022204 阅读:54 留言:0更新日期:2019-09-04 01:16
本发明专利技术提供一种数据分类方法、装置、计算机装置及存储介质。所述方法包括:获取待标注的数据集;通过标注函数对所述数据集进行标注,得到所述数据集的初始标签;根据所述初始标签计算所述标识函数的成对相关性,根据所述成对相关性构建所述标注函数的生成模型;根据所述生成模型预估所述数据集的概率标签;根据所述概率标签对判别模型进行训练,得到训练后的判别模型;将待分类数据输入所述训练后的判别模型,得到所述待分类数据的类别。本发明专利技术提高了训练数据的标注效率和准确率,利用所述训练数据可以快速训练判别模型,利用所述判别模型实现了快速准确的数据分类。

Data Classification Method, Device, Computer Device and Storage Media

【技术实现步骤摘要】
数据分类方法、装置、计算机装置及存储介质
本专利技术涉及机器学习
,具体涉及一种数据分类方法、装置、计算机装置及计算机存储介质。
技术介绍
随着人工智能的快速发展,机器学习技术(尤其是深度学习技术)已经应用在了各个行业中。此时,训练数据标注已经逐渐成为广泛部署机器学习系统的最大瓶颈。现有传统的人工标注方法耗时耗力且成本颇高,而且现有的数据增强方法如半监督学习、主动学习和迁移学习等方法无法大规模快速生成训练数据。如何制定合适的方案,减少人工标注训练数据的工作量,提高训练数据的标注效率,是相关技术人员目前需要解决的技术问题。
技术实现思路
鉴于以上内容,有必要提出一种数据分类方法、装置、计算机装置及计算机存储介质,可以提高训练数据的标注效率,快速准确地对数据进行分类。本申请的第一方面提供一种数据分类方法,应用于机器学习系统,所述方法包括:获取待标注的数据集{xi|i=1,2,...,m};通过标注函数λj,j=1,2,...,n对所述数据集进行标注,得到所述数据集的初始标签Λi,j=λj(xi),i=1,2,...,m,j=1,2,...,n;根据所述初始标签计算所述标识函数的成对相关本文档来自技高网...

【技术保护点】
1.一种数据分类方法,应用于机器学习系统,其特征在于,所述方法包括:获取待标注的数据集{xi|i=1,2,…,m};通过标注函数λj,j=1,2,…,n对所述数据集进行标注,得到所述数据集的初始标签Λi,j=λj(xi),i=1,2,…,m,j=1,2,…,n;根据所述初始标签计算所述标识函数的成对相关性,根据所述成对相关性构建所述标注函数的生成模型;根据所述生成模型预估所述数据集的概率标签;根据所述概率标签对所述机器学习系统的判别模型进行训练,得到训练后的判别模型;将待分类数据输入所述训练后的判别模型,得到所述待分类数据的类别。

【技术特征摘要】
1.一种数据分类方法,应用于机器学习系统,其特征在于,所述方法包括:获取待标注的数据集{xi|i=1,2,…,m};通过标注函数λj,j=1,2,…,n对所述数据集进行标注,得到所述数据集的初始标签Λi,j=λj(xi),i=1,2,…,m,j=1,2,…,n;根据所述初始标签计算所述标识函数的成对相关性,根据所述成对相关性构建所述标注函数的生成模型;根据所述生成模型预估所述数据集的概率标签;根据所述概率标签对所述机器学习系统的判别模型进行训练,得到训练后的判别模型;将待分类数据输入所述训练后的判别模型,得到所述待分类数据的类别。2.如权利要求1所述的方法,其特征在于,所述生成模型为:其中Λ表示所述初始标签构成的初始标签矩阵,Y表示真实标签矩阵,Zw为归一化常数,φi(Λ,yi),i=1,2,…,m为针对所述数据集中的各个数据的所述标注函数的成对相关性,w为所述生成模型的待定参数,w∈R2n+|C|。3.如权利要求2所述的方法,其特征在于,所述成对相关性为:其中表示当括号{}内的条件成立与不成立时的取值。4.如权利要求1所述的方法,其特征在于:所述待标注的数据集是图像集,所述待分类数据是待分类图像;或者所述待标注的数据集是文本集,所述待分类数据是待分类文本;或者所述待标注的数据集是语音集,所述待分类数据是待分类语音。5.如权利要求4所述的方法,其特征在于,所述将待分类数据输入所述训练后的判别模型,得到所述待分类数据的类别包括:将所述待分类图像输入所述训练后的判别模型,得到所述待分类图像对应的用户、物体或人脸属性;将所述待分类文本输入所述训练后的判别模型,得到所述待分类文本对应的情...

【专利技术属性】
技术研发人员:刘康龙徐国强邱寒
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1