一种提高数据特征比对效率的方法、装置制造方法及图纸

技术编号:27031991 阅读:33 留言:0更新日期:2021-01-12 11:15
本申请公开了一种提高数据特征比对效率的方法,该方法包括,获取当前待识别目标特征数据、以及该数据所关联的时间信息;根据该数据所关联的时间信息,确定所述时间信息对应的子模板库,将所述当前待识别目标特征数据与所述子模板库中样本进行比对,其中,所述子模板库包括,至少根据样本所关联的时间信息获得的基于时间序列分割聚类的样本集合。从而使得比对的样本数大幅降低,提高了比对的效率,缩短了比对时间,在同样性能指标下,减少了相似度的计算量,减低了硬件开销,获得了更好的设备响应性能。

【技术实现步骤摘要】
一种提高数据特征比对效率的方法、装置
本专利技术涉及特征识别领域,特别地,涉及一种提高数据特征比对效率的方法。
技术介绍
随着AI技术的发展,现有的特征识别大多采用了深度学习算法,具体来说,通过大量的附带标签的特征数据样本去训练算法,当算法性能指标(拒真率、误识率、建模时间等)满足要求时,将通过训练算法所获得的特征数据样本集合作为特征数据库(即模板库)予以保存;在识别过程中,需要将待识别的目标数据特征通过训练后的深度学习算法与模板库中的数据进行遍历比对,得到N个相似度值,最后将相似度值最高、且大于设定的相似度阈值的特征数据作为识别结果。以基于人脸识别的考勤机为例,考勤机摄像头实时抓拍图片,并基于抓拍的图片进行人脸建模,建模成功则获得当前人脸的特征向量,将当前人脸的特征向量与考勤机内的N张人脸图片特征向量数据库(即模板库)进行遍历比对,并得出N个相似度值,最后将相似度值最高且大于设定的相似度阈值的那张人脸图片作为结果返回,从而完成1:N比对流程。在现有技术中,对特征数据比对深度学习算法的优化主要集中在人脸建模算法优化、相似度比较算法优化等方面,虽然这些优化提高了拒真率、误识率、建模时间等性能指标,但随着特征数据的容量越来越大,1:N比对耗时并没有得到显著的提升,在同样性能处理器上(如GPU或者CPU),所表现出的性能就越差,识别的响应性能也越差。
技术实现思路
本专利技术提供了一种提高数据特征比对效率的方法,以优化识别过程中的数据特征比对效率,提高响应性能。本专利技术提供的一种提高数据特征比对效率的方法,该方法包括,获取当前待识别目标特征数据、以及该数据所关联的时间信息;根据该数据所关联的时间信息,确定所述时间信息对应的子模板库,将所述当前待识别目标特征数据与所述子模板库中样本进行比对,其中,所述子模板库包括,至少根据样本所关联的时间信息获得的基于时间序列分割聚类的样本集合。较佳地,所述子模板库基于包括N个样本集合的模板库,通过基于时间序列分割聚类的无监督深度学习算法,获得该子模板库包括的样本集合,其中,N为自然数,且随着时间的推移而增加。较佳地,所述基于包括N个样本集合的模板库,通过基于时间序列分割聚类的无监督深度学习算法,获得该子模板库包括的样本集合包括:确定子模板库的数量,获取当前待识别目标特征数据,将其作为样本增加至所述模板库中,对于所述模板库中任一样本,构建当前样本的第一特征向量,该第一特征向量至少包括当前样本的特征信息向量、以及当前样本关联的时间信息向量;至少提取第一特征向量中的时间向量,通过基于时间序列分割聚类的无监督深度学习算法,根据时间信息向量,对所述第一特征向量进行聚类,得到当前聚类结果,对当前聚类结果进行训练,直至当前聚类结果收敛,得到当前样本所归属的子模板库;对于模板库中的下一样本,返回执行所述构建当前样本的第一特征向量的步骤,直至模板库中所有样本处理完毕,得到各个以时间信息为聚类中心的子模板库。较佳地,所述将所述当前待识别目标特征数据与所述子模板库中样本进行比对,包括,将所述当前待识别目标特征数据与所述时间信息对应的子模板库中的各个样本分别进行比对,获得与每个样本的相似度计算结果;判断获得的每个样本相似度计算结果中是否存在相似度计算结果大于设定的相似度阈值,如果是,则输出比对结果;否则,将当前待识别目标特征数据与所述时间信息相邻时间对应的子模板库中各个的样本进行相似度计算。较佳地,,所述确定子模板库的数量包括,根据待识别目标特征数据、和/或样本集中样本的时间特性,确定子模板库的数量K,其中K大于等于1,所述直至模板库中所有样本处理完毕,得到各个以时间信息为聚类中心的子模板库之后,还包括,将所述各个子模板库按照时间顺序进行排序,并按大小数值分配序号,得到各个子模板库对应的序号。较佳地,所述将当前待识别目标特征数据与所述时间信息相邻时间对应的子模板库中各个的样本进行相似度计算包括,根据当前待识别目标特征数据对应的子模板库序号,按照时间顺序,分别得到小于该子模板库序号的第一相邻序号、和大于该子模板库序号的第二相邻序号,判断所述相邻序号中的任一序号是否存在,如果存在,则将当前待识别目标特征数据与所述相邻序号对应的子模板库中的各个样本分别进行比对,获得与每个样本的相似度计算结果。较佳地,所述当前聚类结果不收敛时,则将当前样本设置归属于临时子模板库;所述相邻序号中的任一序号都不存在时,则将当前待识别目标特征数据与所述临时子模板库中的各个样本进行比对。较佳地,所述待识别目标特征数据包括具有生物特征信息的图像数据的特征向量,所述数据所关联的时间信息包括数据被获取的当前时间,所述样本所关联的时间信息包括样本的历史时间信息;所述临时子模板库中的样本在该样本累计的历史时间信息到达设定的阈值时触发和/或者定期触发执行所述构建当前样本的第一特征向量的步骤。本专利技术还提供一种可提高数据特征比对效率的电子设备,包括存储器和处理器,其中,存储器用于存储指令和用于进行数据特征比对的子模板库,所述指令在由处理器执行时使得处理器执行以上任一所述提高数据特征比对效率的方法步骤。本专利技术还提供一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现以上任一所述数据存储方法的步骤。本专利技术根据各个样本关联的时间信息,获得根据样本所关联的时间信息获得的基于时间序列分割聚类的样本集合,将所述样本集合形成子模板库;当对待识别目标特征数据进行比对时,根据该待识别目标特征数据关联的时间信息确定其对应的子模板库,将待识别目标特征数据与子模板库中的样本进行比对。本专利技术通过时间信息的样本聚类,从而使得比对的样本数大幅降低,提高了比对的效率,缩短了比对时间,在同样性能指标下,减少了相似度的计算量,减低了硬件开销,获得了更好的设备响应性能。附图说明图1为构建基于时间序列分割聚类的子模板库的一种流程示意图。图2示出了基于考勤数据得到的以时间向量、年龄向量的2维聚类结果的一种示意图。图3为基于K个子模板库的待识别目标特征数据在识别过程中进行比对的一种流程示意图。具体实施方式为了使本申请的目的、技术手段和优点更加清楚明白,以下结合附图对本申请做进一步详细说明。申请人通过分析发现,现有技术中相似度计算的效率低下,其主要原因是每次比对都要进行N次相似度计算,N越大,相似度计算工作量越大,基于此,本专利技术将用于进行比对的模板库根据时间序列进行分割,即,将模板库根据时间段分割成K个子模板库,其中,N为模板库中的样本总数,K大于等于1;当进行比对时,优先与当前时间段对应的子模板库进行相似度计算。以下以基于人脸识别的考勤机为实施例来进行说明,所应理解的是,本专利技术的技术方案不限于人脸识别,对于基于任何特征数据进行分类识别的应用均可适用。对于具有时间性关联本文档来自技高网...

【技术保护点】
1.一种提高数据特征比对效率的方法,其特征在于,该方法包括,/n获取当前待识别目标特征数据、以及该数据所关联的时间信息;/n根据该数据所关联的时间信息,确定所述时间信息对应的子模板库,/n将所述当前待识别目标特征数据与所述子模板库中样本进行比对,/n其中,所述子模板库包括,至少根据样本所关联的时间信息获得的基于时间序列分割聚类的样本集合。/n

【技术特征摘要】
1.一种提高数据特征比对效率的方法,其特征在于,该方法包括,
获取当前待识别目标特征数据、以及该数据所关联的时间信息;
根据该数据所关联的时间信息,确定所述时间信息对应的子模板库,
将所述当前待识别目标特征数据与所述子模板库中样本进行比对,
其中,所述子模板库包括,至少根据样本所关联的时间信息获得的基于时间序列分割聚类的样本集合。


2.如权利要求1所述的方法,其特征在于,所述子模板库基于包括N个样本集合的模板库,通过基于时间序列分割聚类的无监督深度学习算法,获得该子模板库包括的样本集合,其中,N为自然数,且随着时间的推移而增加。


3.如权利要求2所述的方法,其特征在于,所述基于包括N个样本集合的模板库,通过基于时间序列分割聚类的无监督深度学习算法,获得该子模板库包括的样本集合包括:
确定子模板库的数量,
获取当前待识别目标特征数据,将其作为样本增加至所述模板库中,
对于所述模板库中任一样本,
构建当前样本的第一特征向量,该第一特征向量至少包括当前样本的特征信息向量、以及当前样本关联的时间信息向量;
至少提取第一特征向量中的时间向量,
通过基于时间序列分割聚类的无监督深度学习算法,根据时间信息向量,对所述第一特征向量进行聚类,得到当前聚类结果,对当前聚类结果进行训练,直至当前聚类结果收敛,得到当前样本所归属的子模板库;
对于模板库中的下一样本,返回执行所述构建当前样本的第一特征向量的步骤,直至模板库中所有样本处理完毕,得到各个以时间信息为聚类中心的子模板库。


4.如权利要求2所述的方法,其特征在于,所述将所述当前待识别目标特征数据与所述子模板库中样本进行比对,包括,
将所述当前待识别目标特征数据与所述时间信息对应的子模板库中的各个样本分别进行比对,获得与每个样本的相似度计算结果;
判断获得的每个样本相似度计算结果中是否存在相似度计算结果大于设定的相似度阈值,如果是,则输出比对结果;否则,将当前待识别目标特征数据与所述时间信息相邻时间对应的子模板库中各个的样本进行相似度计算。
<...

【专利技术属性】
技术研发人员:郑涛王梁夏秋桃
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1