对象识别方法、装置、设备和存储介质制造方法及图纸

技术编号:37200511 阅读:26 留言:0更新日期:2023-04-20 22:56
本申请涉及人工智能技术领域,提供一种对象识别方法、装置、设备和存储介质,相关实施例可应用于云技术、云安全、人工智能、智慧交通等场景,从海量数据中挖掘出更多模型训练样本,提高模型对用户进行类别的预测准确性。该方法包括:对候选对象的多个候选对象信息进行提取得到候选对象特征,对融合各候选对象特征得到的对象提取特征进行对象类别可能度识别,得到候选对象属于目标对象类别的识别可能度;对候选对象对应的对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合,将子提取特征集合中的对象提取特征对应的候选对象组成子对象集合;基于子对象集合中各个候选对象对应的识别可能度,从子对象集合中选取得到代表对象。象。象。

【技术实现步骤摘要】
对象识别方法、装置、设备和存储介质


[0001]本申请涉及人工智能领域,特别是涉及一种对象识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]在人工智能时代,通过人工智能的方式从海量的数据中挖掘出有价值的信息,以实现信息的有效传递,是当前研究热点之一;例如,通过人工智能模型预测用户所属的类别,基于该预测结果为用户推荐与该类别对应的内容,实现信息的有效传递。
[0003]人工智能的关键点之一是待挖掘的对象的选取,如果对象选取不合适,则会影响后续的预测准确性,目前,存在对象选取准确度低的情况。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种对象识别方法、装置、计算机设备和存储介质。
[0005]一种对象识别方法,所述方法包括:获取候选对象集合;所述候选对象集合包括多个候选对象;获取所述候选对象的多个候选对象信息,提取得到各个候选对象信息对应的候选对象特征,融合各个候选对象特征得到所述候选对象对应的对象提取特征,基于所述对象提取特征进行对象类别可能度识别,得到所述候选对象属于目标对象类别的识别可能度;对所述候选对象对应的对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合,将所述子提取特征集合中的对象提取特征对应的候选对象组成子对象集合;基于所述子对象集合中各个所述候选对象对应的识别可能度,从所述子对象集合中选取得到代表对象。
[0006]一种对象识别装置,所述装置包括:候选对象集合获取模块,用于获取候选对象集合;所述候选对象集合包括多个候选对象;可能度识别模块,用于获取所述候选对象的多个候选对象信息,提取得到各个候选对象信息对应的候选对象特征,融合各个候选对象特征得到所述候选对象对应的对象提取特征,基于所述对象提取特征进行对象类别可能度识别,得到所述候选对象属于目标对象类别的识别可能度;聚类模块,用于对所述候选对象对应的对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合,将所述子提取特征集合中的对象提取特征对应的候选对象组成子对象集合;代表对象选取模块,用于基于所述子对象集合中各个所述候选对象对应的识别可能度,从所述子对象集合中选取得到代表对象。
[0007]在一些实施例中,所述对象提取特征是通过对象筛选模型进行特征提取得到的;所述装置还包括:对象筛选模型构建模块,用于获取所述目标对象类别对应的种子对象;获取所述种子对象对应的种子对象信息,将所述种子对象信息作为训练样本中的训练特征,将所述目标对象类别作为所述训练样本中的标签,组成所述训练样本;基于所述训练样本进行模型训练,得到所述对象筛选模型。
[0008]在一些实施例中,所述可能度识别模块,还用于将所述候选对象的多个候选对象信息输入到所述对象筛选模型的特征提取层中进行特征提取,得到各个候选对象信息对应的候选对象特征;将各个候选对象特征输入到所述对象筛选模型的分类层,以使所述分类层融合各个候选对象特征得到对象提取特征;获取所述分类层对所述对象提取特征进行对象类别可能度识别后输出的所述候选对象属于目标对象类别的识别可能度。
[0009]在一些实施例中,所述聚类模块,还用于获取对应于不同候选对象的对象提取特征之间的特征距离;对于各个对象提取特征,基于各特征距离,确定位于所述各个对象提取特征所在的区域内的对象提取特征的数量,基于所述数量,得到所述各个对象提取特征的区域对象密度;基于所述各个对象提取特征的区域对象密度选取聚类中心,基于所述聚类中心对对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合;所述子提取特征集合中的对象提取特征对应的候选对象组成所述子对象集合。
[0010]在一些实施例中,所述聚类模块,还用于在区域对象密度大于所述对象提取特征的区域对象密度的特征中,确定所述对象提取特征的邻近提取特征;将所述对象提取特征与所述邻近提取特征之间的特征距离,作为所述对象提取特征对应的目标距离;基于所述对象提取特征的区域对象密度以及所述对象提取特征对应的目标距离,选取聚类中心。
[0011]在一些实施例中,所述聚类模块,还用于获取待确定聚类类别的当前对象提取特征;获取区域对象密度大于所述当前对象提取特征的区域对象密度的聚类中心,作为所述当前对象提取特征对应的候选聚类中心;所述当前对象提取特征对应的候选聚类中心组成候选中心集合;基于所述当前对象提取特征与候选聚类中心的距离,从所述候选中心集合中选取所述当前对象提取特征对应的邻近聚类中心,将所述当前对象提取特征加入到将所述邻近聚类中心所对应的子提取特征集合中。
[0012]在一些实施例中,所述代表对象选取模块,还用于从所述子对象集合中,获取识别可能度满足可能度条件的候选对象,作为所述子对象集合中对应的代表对象;所述可能度条件包括识别可能度大于可能度阈值或者可能度排序在第一排序阈值之前的至少一个。
[0013]在一些实施例中,所述装置还包括第二集合处理模块,用于基于候选对象属于目标对象类别的识别可能度,确定各个候选对象对于对象识别模型的训练梯度影响度,所述训练梯度影响度与所述识别可能度成正相关关系;基于各个候选对象对于对象识别模型的训练梯度影响度,从所述候选对象集合中选取满足影响度条件的候选对象,将满足影响度条件的候选对象加入到所述训练样本集合中;所述影响度条件包括训练梯度影响度大于影响度阈值或者影响度排序在第二排序阈值之前的至少一个。
[0014]在一些实施例中,所述装置还包括目标对象识别模型构建模块,用于从所述训练样本集合中选取相似的第一训练对象以及第二训练对象,将所述第一训练对象以及所述第二训练对象组成对象组;将所述对象组中各个训练对象对应的训练对象信息输入到同一个特征提取层中,提取得到各个训练对象分别对应的训练对象特征;基于所述训练对象特征,得到所述对象组中的训练对象之间的对象相似度;基于所述对象相似度得到模型损失值;所述模型损失值与所述对象相似度成负相关关系;基于所述模型损失值对对象识别模型进行训练,得到所述目标对象识别模型。
[0015]在一些实施例中,所述装置还包括对象信息处理模块,用于获取对象信息类别;获取所述训练对象在所述对象信息类别对应的时间维度集合以及信息统计角度,所述时间维
度集合包括多个信息统计时间维度;获取各个所述信息统计时间维度中,基于所述信息统计角度统计得到的所述训练对象对应的对象信息统计值;所述对象信息统计值为所述对象信息类别对应的信息统计值;对所述时间维度集合中,各个所述信息统计时间维度对应的对象信息统计值进行信息聚合,将聚合得到对象信息作为所述训练对象对应的训练对象信息。
[0016]在一些实施例中,所述对象信息处理模块,还用于基于所述时间维度集合中,各个所述信息统计时间维度对应的对象信息统计值得到综合信息统计值;确定各个所述对象信息统计值与所述综合信息统计值的统计值差异;基于所述统计值差异得到所述时间维度集合对应的统计值离散度,将所述统计值离散度作为所述训练对象对应的训练对象信息;所述统计值离散度与所述统计值差异成正相关关系。
[0017]一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象识别方法,其特征在于,所述方法包括:获取候选对象集合;所述候选对象集合包括多个候选对象;获取所述候选对象的多个候选对象信息,提取得到各个候选对象信息对应的候选对象特征,融合各个候选对象特征得到所述候选对象对应的对象提取特征,基于所述对象提取特征进行对象类别可能度识别,得到所述候选对象属于目标对象类别的识别可能度;对所述候选对象对应的对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合,将所述子提取特征集合中的对象提取特征对应的候选对象组成子对象集合;基于所述子对象集合中各个所述候选对象对应的识别可能度,从所述子对象集合中选取得到代表对象。2.根据权利要求1所述的方法,其特征在于,所述对象提取特征是通过对象筛选模型进行特征提取得到的,得到所述对象筛选模型的步骤包括:获取所述目标对象类别对应的种子对象;获取所述种子对象对应的种子对象信息,将所述种子对象信息作为训练样本中的训练特征,将所述目标对象类别作为所述训练样本中的标签,组成所述训练样本;基于所述训练样本进行模型训练,得到所述对象筛选模型。3.根据权利要求2所述的方法,其特征在于,所述获取所述候选对象的多个候选对象信息,提取得到各个候选对象信息对应的候选对象特征,包括:将所述候选对象的多个候选对象信息输入到所述对象筛选模型的特征提取层中进行特征提取,得到各个候选对象信息对应的候选对象特征;所述融合各个候选对象特征得到所述候选对象对应的对象提取特征,基于所述对象提取特征进行对象类别可能度识别,得到所述候选对象属于目标对象类别的识别可能度,包括:将各个候选对象特征输入到所述对象筛选模型的分类层,以使所述分类层融合各个候选对象特征得到对象提取特征;获取所述分类层对所述对象提取特征进行对象类别可能度识别后输出的所述候选对象属于目标对象类别的识别可能度。4.根据权利要求1所述的方法,其特征在于,所述对所述候选对象对应的对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合,将所述子提取特征集合中的对象提取特征对应的候选对象组成子对象集合,包括:获取对应于不同候选对象的对象提取特征之间的特征距离;对于各个对象提取特征,基于各特征距离,确定位于所述各个对象提取特征所在的区域内的对象提取特征的数量,基于所述数量,得到所述各个对象提取特征的区域对象密度;基于所述各个对象提取特征的区域对象密度选取聚类中心,基于所述聚类中心对对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合;所述子提取特征集合中的对象提取特征对应的候选对象组成所述子对象集合。5.根据权利要求4所述的方法,其特征在于,所述基于所述各个对象提取特征的区域对象密度选取聚类中心,包括:在区域对象密度大于所述对象提取特征的区域对象密度的特征中,确定所述对象提取特征的邻近提取特征;
将所述对象提取特征与所述邻近提取特征之间的特征距离,作为所述对象提取特征对应的目标距离;基于所述对象提取特征的区域对象密度以及所述对象提取特征对应的目标距离,选取聚类中心。6.根据权利要求4所述的方法,其特征在于,所述基于所述聚类中心对对象提取特征进行聚类,得到各个聚类类别对应的子提取特征集合,包括:获取待确定聚类类别的当前对象提取特征;获取区域对象密度大于所述当前对象提取特征的区域对象密度的聚类中心,作为所述当前对象提取特征对应的候选聚类中心;所述当前对象提取特征对应的候选聚类中心组成候选中心集合;基于所述当前对象提取特征与候选聚类中心的距离,从所述候选中心集合中选取所述当前对象提取特征对应的邻近聚类中心,将所述当前对象提取特征加入到将所述邻近聚类中心所对应的子提取特征集合中。7.根据权利要求1所述的方法,其特征在于,所述基于所述子对象集合中各个所述候选对象对应的识别可能度,从所述子对象集合中选取得到代表对象,包括:从所述子对...

【专利技术属性】
技术研发人员:樊鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1