【技术实现步骤摘要】
一种数据处理方法、设备及存储介质
本专利技术涉及电子
,尤其涉及一种数据处理方法、设备及存储介质。
技术介绍
随着人脸识别技术在实际应用中的不断推广,人脸识别存在的问题和难点也逐渐凸显出来,在不可靠的采集环境中,用户的面部表现以及环境状态千变万化,其复杂程度远远超出了标准评测中获取的图片,例如,遮挡会导致人脸特征发生变化,会增加人脸识别的困难,增加拒识率;光照、姿态和表情的变化,也会导致一个人的不同环境下的人脸特征差异很大,降低了识别率,还可能会增加错误识别。目前,为了提升人脸识别技术在实际应用场景中的性能,最为直接有效的方法是通过增加大量的有身份标签的人脸训练数据,现实场景(如监控、商场、社区等)中存在的大量的人脸数据,但是绝大多数是没有身份标签的人脸数据,无法大量获取有身份标签的人脸训练数据,则无法通过增加人脸训练数据提升人脸识别性能。
技术实现思路
本专利技术实施例提供一种数据处理方法、设备及存储介质,可以提高人脸识别的准确率。本专利技术实施例一方面提供了一种数据处理方法,可包括:从多个多媒体数据中分别获取样本对象数据,提取所述样本对象数据的对象特征信息; ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:从多个多媒体数据中分别获取样本对象数据,提取所述样本对象数据的对象特征信息;根据所述对象特征信息对多个样本对象数据进行聚类,得到多个具有不同簇标签的第一对象特征簇;所有样本对象数据的对象标签均与所属的第一对象特征簇的簇标签相同;分别清理每个第一对象特征簇中的异类对象数据,将清理后的第一对象特征簇确定为第二对象特征簇;在多个第二对象特征簇之间进行同类簇合并,生成多个具有不同簇标签的第三对象特征簇,将所述样本对象数据的对象标签更新为所属的所述第三对象特征簇的簇标签;基于所述每个第三对象特征簇中的所述样本对象数据的对象标签和所述对象特征信息 ...
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:从多个多媒体数据中分别获取样本对象数据,提取所述样本对象数据的对象特征信息;根据所述对象特征信息对多个样本对象数据进行聚类,得到多个具有不同簇标签的第一对象特征簇;所有样本对象数据的对象标签均与所属的第一对象特征簇的簇标签相同;分别清理每个第一对象特征簇中的异类对象数据,将清理后的第一对象特征簇确定为第二对象特征簇;在多个第二对象特征簇之间进行同类簇合并,生成多个具有不同簇标签的第三对象特征簇,将所述样本对象数据的对象标签更新为所属的所述第三对象特征簇的簇标签;基于所述每个第三对象特征簇中的所述样本对象数据的对象标签和所述对象特征信息,训练对象识别模型;所述对象识别模型用于识别待预测对象数据与目标对象数据之间的相似度。2.根据权利要求1所述的方法,其特征在于,所述从多个多媒体数据中分别获取样本对象数据,提取所述样本对象数据对应的对象特征信息,包括:获取多个多媒体数据中的对象位置信息,根据所述对象位置信息从每个多媒体数据中分别获取具有目标尺寸的对象区域,将所述对象区域中的图像内容确定为样本对象数据,获取所述每个样本对象数据的对象特征信息;若所述多媒体数据为图像数据,则为所述图像数据中的所述样本对象数据随机设置对象标签;若所述多媒体数据为视频数据,则检测所述样本对象数据在所述视频数据中的跟踪轨迹信息,将具有相同所述跟踪轨迹信息的样本对象数据设置关联属性,并为具有所述关联属性的样本对象数据设置相同的对象标签。3.根据权利要求2所述的方法,其特征在于,所述将所述对象区域中的图像内容确定为样本对象数据,包括:将所述对象区域中的图像内容进行基于目标方位的仿射变换,将仿射变换后的图像内容确定为样本对象数据;所述样本对象数据中的对象处于所述目标方位;则所述方法还包括:获取待预测多媒体数据;根据所述待预测多媒体数据中的对象位置信息获取具有目标尺寸的目标对象区域,将所述目标对象区域中的待预测图像内容进行基于所述目标方位的仿射变换,将仿射变换后的待预测图像内容确定为待预测对象数据;基于对象识别模型获取待预测对象数据与目标对象数据之间的相似度。4.根据权利要求1所述的方法,其特征在于,所述根据所述对象特征信息对多个样本对象数据进行聚类,得到多个具有不同簇标签的第一对象特征簇,包括:从多个样本对象数据中获取第一样本对象数据和第二样本对象数据,将所述第一样本对象数据的对象标签确定为第一对象标签,将所述第二样本对象数据的对象标签确定为第二对象标签;所述第一对象标签和所述第二对象标签不相同;获取所述第一样本对象数据的对象特征信息和所述第二样本对象数据的对象特征信息之间的第一图像相似度;若所述第一图像相似度大于第一阈值,则将具有所述第一对象标签的至少一个样本对象数据和具有第二对象标签的至少一个样本对象数据,划分到相同的第一对象特征簇,并将第一对象标签和第二对象标签设置为所划分的第一对象特征簇的簇标签;当所有样本对象数据均被划分到所属的第一对象特征簇时,并将每个第一对象特征簇以及所述对象特征簇中的样本对象数据进行存储。5.根据权利要求1所述的方法,其特征在于,所述分别清理每个第一对象特征簇中的异类对象数据,将清理后的第一对象特征簇确定为第二对象特征簇,包括:响应针对所述第一对象特征簇的第一标记操作,将所述第一标记操作所指示的所述第一对象特征簇中的样本对象数据,确定为所述第一对象特征簇对应的标准对象数据;响应针对非标准对象数据的第二标记操作,将所述第二标记操作所指示的非标准对象数据确定为异类对象数据;所述非标准对象数据为所述第一对象特征簇中除所述标准对象数据之外的样本对象数据;将所述异类对象数据从所述第一对象特征簇中删除,将删除异类对象数据的第一对象特征簇确定为第二对象特征簇。6.根据权利要求1所述的方法,其特征在于,所述在多个第二对象特征簇之间进行同类簇合并,生成多个具有不同簇标签的第三对象特征簇,将所述样本对象数据的对象标签更新...
【专利技术属性】
技术研发人员:徐兴坤,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。