档案管理方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:29025387 阅读:21 留言:0更新日期:2021-06-26 05:26
本发明专利技术提供了一种档案管理方法、装置、设备及计算机可读存储介质,其中该方法包括:分别将多个档案数据中每两个档案数据作为一个档案数据组,计算所述档案数据组中的档案封面图像之间的相似度值,将所述相似度值作为所述档案数据组的第一相似度;每个所述档案数据包括档案封面图像和档案特征事件;根据获取到的第一相似度,从多个档案数据组中确定目标档案数据组;根据确定出的目标档案数据组所包含的档案数据的档案特征事件,确定所述多个档案数据中的相似档案数据。本发明专利技术能提高查找相似档案的准确率。案的准确率。案的准确率。

【技术实现步骤摘要】
档案管理方法、装置、设备及计算机可读存储介质


[0001]本专利技术涉及档案管理
,特别涉及一种档案管理方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着社会的进步,人员流通更加普遍,加大了人员管理的难度。基于此,一些部门或者系统通过建立人员档案,对人员进行管理。但在建档和归档的过程中,事件数据(即抓拍人脸数据特征值)只和档案封面图像(即每个档案都会有一个封面特征值,该特征值代表这个人)进行1:1的比对或多封面归档则采用1:N的方式进行归档,由于抓拍人脸的角度、光线、是否戴配饰等原因导致事件数据归档不成功,进而对同一个人进行重复建档,造成一人多档,增加了档案数据的管理工作量。为减少一人多档以及便于档案数据的查询,在对档案数据进行管理时,需要查找出众多档案数据中的相似档案,但目前普遍通过封面图像之间的相似度来查找相似档案,而由于抓拍人脸的角度、光线、是否戴配饰等原因,造成查找相似档案的准确率低。

技术实现思路

[0003]本专利技术提供了一种档案管理方法、装置、设备及计算机可读存储介质,其目的是为了解决查找相似档案的准确率低的问题。
[0004]为了达到上述目的,第一方面,本专利技术的实施例提供了一种档案管理方法,该方法包括:
[0005]分别将多个档案数据中每两个档案数据作为一个档案数据组,计算所述档案数据组中的档案封面图像之间的相似度值,将所述相似度值作为所述档案数据组的第一相似度;每个所述档案数据包括档案封面图像和档案特征事件;
[0006]根据获取到的第一相似度,从多个档案数据组中确定目标档案数据组;
[0007]根据确定出的目标档案数据组所包含的档案数据的档案特征事件,确定所述多个档案数据中的相似档案数据。
[0008]第二方面,本专利技术的实施例还提供了一种档案管理装置,该装置包括:
[0009]获取模块,用于分别将多个档案数据中每两个档案数据作为一个档案数据组,计算所述档案数据组中的档案封面图像之间的相似度值,将所述相似度值作为所述档案数据组的第一相似度;每个所述档案数据包括档案封面图像和档案特征事件;
[0010]第一确定模块,用于根据获取到的第一相似度,从多个档案数据组中确定目标档案数据组;
[0011]第二确定模块,用于根据确定出的目标档案数据组所包含的档案数据的档案特征事件,确定所述多个档案数据中的相似档案数据。
[0012]第三方面,本专利技术的实施例还提供了一种档案管理设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机
程序时实现上述的档案管理方法的步骤。
[0013]第四方面,本专利技术的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的档案管理方法的步骤。
[0014]本专利技术的上述方案至少有如下的有益效果:
[0015]在本专利技术的实施例中,通过将多个档案数据中每两个档案数据作为一个档案数据组,计算每个档案数据组中的档案封面图像之间的相似度值,并将该相似度值作为该档案数据组的第一相似度,然后根据获取到的第一相似度,从多个档案数据组中确定目标档案数据组;最终根据目标档案数据组所包含的档案数据的档案特征事件,确定多个档案数据中的相似档案数据,即通过各档案数据中的档案封面图像和档案特征事件完成相似档案的查找,这与仅通过档案封面图像之间的相似度查找相似档案的方式相比,能大大提高查找相似档案的准确率。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本专利技术实施例的档案管理方法的流程图;
[0018]图2是本专利技术实施例的分布式并行计算的示意图;
[0019]图3是本专利技术实施例的实例中档案特征事件的第三相似度的结果示意图;
[0020]图4是本专利技术实施例的图3中各第三相似度排序后的示意图;
[0021]图5是本专利技术实施例的实例中提示信息的示意图;
[0022]图6是本专利技术实施例的档案管理装置的结构示意图;
[0023]图7是本专利技术实施例的档案管理设备的结构示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0026]如图1所示,本专利技术的实施例提供了一种档案管理方法,该方法包括:
[0027]步骤11,分别将多个档案数据中每两个档案数据作为一个档案数据组,计算所述档案数据组中的档案封面图像之间的相似度值,将所述相似度值作为所述档案数据组的第
一相似度。
[0028]其中,上述档案数据为人员的档案数据,该档案数据包括档案封面图像和档案特征事件。其中,档案封面图像可以为人员的一人脸图像(该人脸图像的形态可以为低头、仰头、侧脸等),档案特征事件可以包括该人员在多种不同状态时的人脸图像,如戴眼镜时的人脸图像、不戴眼镜时的人脸图像、戴帽子时的人脸图像、不戴帽子时的人脸图像、仰头时的人脸图像、低头时的人脸图像、侧脸时的人脸图像以及大笑时的人脸图像等。可以理解的是,为提高获取第一相似度的效率,可通过计算档案封面图像的特征值的相似度的方式得到该第一相似度。即,可分别针对每个档案数据组内的两个档案数据,提取该两个档案数据的档案封面图像的特征值,然后计算提取到的两个特征值的相似度,最终将该相似度作为该档案数据组的第一相似度。
[0029]其中,针对档案封面图像的特征值的提取,具体可通过图像特征提取算法,提取档案数据的档案封面图像的特征值,且该特征值可具体为人脸特征值。
[0030]作为一个优选的示例,为进一步提高获取第一相似度的效率,上述特征值可以为高维度图,如512*2*2维度的特征图。当然至于特征值之间的相似度可通过目前通用的相似度计算公式快速得到。
[0031]需要说明的是,通常上述档案数据的数量庞大,为提高获取上述第一相似度的效率,以提高查找相似档案的效率,在本专利技术的实施例中,可通过多个相似度计算单元,分别将多个档案数据中每两个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种档案管理方法,其特征在于,包括:分别将多个档案数据中每两个档案数据作为一个档案数据组,计算所述档案数据组中的档案封面图像之间的相似度值,将所述相似度值作为所述档案数据组的第一相似度;每个所述档案数据包括档案封面图像和档案特征事件;根据获取到的第一相似度,从多个档案数据组中确定目标档案数据组;根据确定出的目标档案数据组所包含的档案数据的档案特征事件,确定所述多个档案数据中的相似档案数据。2.根据权利要求1所述的方法,其特征在于,所述根据获取到的第一相似度,从多个档案数据组中确定目标档案数据组的步骤,包括:判断获取到的第一相似度是否大于第一预设阈值;当获取到的第一相似度大于所述第一预设阈值时,将该第一相似度对应的档案数据组作为目标档案数据组。3.根据权利要求1所述的方法,其特征在于,所述根据确定出的目标档案数据组所包含的档案数据的档案特征事件,确定所述多个档案数据中的相似档案数据的步骤,包括:分别针对确定出的每一目标档案数据组,根据所述目标档案数据组所包含的两个档案数据的档案特征事件,获取所述目标档案数据组所包含的两个档案数据的第二相似度,得到多个第二相似度;根据所述多个第二相似度,确定所述多个档案数据中的相似档案数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标档案数据组所包含的两个档案数据的档案特征事件,获取所述目标档案数据组所包含的两个档案数据的第二相似度的步骤,包括:分别从所述目标档案数据组所包含的两个档案数据的档案特征事件中提取多个预设类别的档案特征事件;分别针对每一预设类别的档案特征事件,获取从所述两个档案数据中提取到的该预设类别的档案特征事件的特征值,计算获取到的两个特征值的相似度,并将该相似度作为所述两个档案数据中该预设类别的档案特征事件的第三相似度,得到多个第三相似度;按照从大至小的顺序,从所述多个第三相似度中选择预设数量的第三相似度;其中,所述预设数量小于或等于所述预设类别的数量;计算选择出的预设数量的第三相似度的平均值,并将所述平均值作为所述目标档案数据组所包含的两个档案数据的第二相似度。5.根据权利要求3所述的方法,其特...

【专利技术属性】
技术研发人员:戴世稳
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1