一种档案合并方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23852337 阅读:31 留言:0更新日期:2020-04-18 09:17
本发明专利技术实施例提供一种档案合并方法、装置、电子设备及存储介质,所述档案合并方法包括步骤:检测多个待合并档案中每两个待合并档案的相似度,所述待合并档案包括档案ID以及用于计算相似度的档案特征;当检测到所述多个待合并档案中存在两个待合并档案之间的相似度达到预设相似度阈值时,以两个相似待合并档案分别为节点进行连接,得到节点对;基于所述节点对构建得到档案树,所述档案树包括至少一个节点对以及对应的至少两个档案ID;基于所述档案树进行档案合并,得到目标档案。这样,可以将多个待合并档案中同一个人的档案进行合并,使得每个人只有唯一一个档案,从而减少个人档案数量,便于档案管理,进而提高档案的管理效率。

A method, device, electronic equipment and storage medium for file merging

【技术实现步骤摘要】
一种档案合并方法、装置、电子设备及存储介质
本专利技术涉及档案管理
,尤其涉及一种档案合并方法、装置、电子设备及存储介质。
技术介绍
随着社会的进步,人员流通更加普遍,这样就加大了城市级大规模人员管理的难度。目前有一些部门或者系统可以为每个人员建立人员档案,以方便对人员的管理。目前均是通过摄像头拍摄人员图像并基于该摄像头下拍摄到的图像建立人员档案。为了更有效的管理人员,一般将每个摄像头拍摄到的不同的人分别建立对应的人员档案,若某个人员再次被同一摄像头拍摄,则将当前拍摄到的图像归入已经建立的人员档案中。当部门或系统中均设置有多个摄像头,如果多个摄像头分别拍摄到同一个人时,也会分别基于每个摄像头下的图像分别建档。在处理城市级大规模个人档案时,档案数量过于庞大,如百亿级的数量,因此,很容易发生同一个人存在多个档案的情况,从而造成多个人有多个档案,使得个人档案的数据量增加,不便于城市级大规模档案管理,从而导致档案管理效率较差。可见,现有人员档案的管理中存在管理效率低的问题。
技术实现思路
本专利技术实施例提供一种档案合并方法、装置、电子设备及存储介质,能够提高档案管理效率。第一方面,本专利技术实施例提供一种档案合并方法,包括以下步骤:检测多个待合并档案中每两个待合并档案的相似度,所述待合并档案包括档案ID以及用于计算相似度的档案特征;当检测到所述多个待合并档案中存在两个待合并档案之间的相似度达到预设相似度阈值时,以两个相似待合并档案分别为节点进行连接,得到多个节点对,所述节点包含对应的待合并档案的档案ID;基于所述多个节点对构建得到目标档案树,每棵所述目标档案树包括至少一个节点对;基于每棵所述目标档案树进行档案合并,得到对应的目标档案。可选的,所述检测多个待合并档案中每两个待合并档案的相似度包括:提取每个待合并档案的档案特征;计算每两个档案特征之间的相似度;基于所述每两个档案特征之间的相似度,得到多个待合并档案中每两个待合并档案的相似度。可选的,所述基于所述多个节点对构建得到目标档案树的步骤包括:对所述多个节点对进行去重,得到多个去重节点对;任意选取一个去重节点对作为基础档案树;在剩余的去重节点对中选取与所述基础档案树有共同节点的去重节点对与所述基础档案树进行结合,每次与所述基础档案树结合后,更新一次所述基础档案树,直到所述剩余的去重节点对不包含与更新后的基础档案树中存在相同节点的去重节点对,以得到目标档案树。可选的,所述基于所述多个节点对构建得到目标档案树的步骤还包括:判断所述剩余的去重节点中是否存在与所述基础档案树没有共同节点的去重节点对;若所述剩余的去重节点中存在与所述基础档案没有共同节点对的去重节点对,则在所述与所述基础档案树没有共同节点的去重节点对中任意选取一个去重节点对作为新的基础档案树;基于所述新的基础档案树,得到新的目标档案树。可选的,所述基于每棵所述目标档案树进行档案合并,得到目标档案的步骤包括:将每棵所述目标档案树中的子节点合并到根节点上,得到目标档案。将每棵所述目标档案树中的任意一个节点的档案ID作为所述目标档案的档案ID。第二方面,本专利技术实施例提供一种档案合并装置,包括:相似度检测模块,用于检测多个待合并档案中每两个待合并档案的相似度,所述待合并档案包括档案ID以及用于计算相似度的档案特征;节点对获取模块,用于当检测到所述多个待合并档案中存在两个待合并档案之间的相似度达到预设相似度阈值时,以两个相似待合并档案分别为节点进行连接,得到多个节点对,所述节点包含对应的待合并档案的档案ID;档案树构建模块,用于基于所述多个节点对构建得到目标档案树,每棵所述目标档案树包括至少一个节点对;档案合并模块,用于基于每棵所述目标档案树进行档案合并,得到对应的目标档案。可选的,所述相似度检测模块包括:档案特征提取单元,用于提取每个待合并档案的档案特征;相似度计算单元,用于计算每两个档案特征之间的相似度;相似度确定单元,用于基于所述每两个档案特征之间的相似度,得到多个待合并档案中每两个待合并档案的相似度。可选的,所述档案树构建模块包括:节点去重单元,用于对所述多个节点对进行去重,得到多个去重节点对;基础档案树确定单元,用于任意选取一个去重节点对作为基础档案树;目标档案树构建单元,用于在剩余的去重节点对中选取与所述基础档案树有共同节点的去重节点对与所述基础档案树进行结合,每次与所述基础档案树结合后,更新一次所述基础档案树,直到所述剩余的去重节点对不包含与更新后的基础档案树中存在相同节点的去重节点对,以得到目标档案树。第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的档案合并方法中的步骤。第四方面,一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的档案合并方法中的步骤。本专利技术实施例中,通过检测多个待合并档案中每两个待合并档案的相似度,所述待合并档案包括档案ID以及用于计算相似度的档案特征;当检测到所述多个待合并档案中存在两个待合并档案之间的相似度达到预设相似度阈值时,以两个相似待合并档案分别为节点进行连接,得到多个节点对,所述节点包含对应的待合并档案的档案ID;基于所述多个节点对构建得到目标档案树,每棵所述目标档案树包括至少一个节点对;基于每棵所述目标档案树进行档案合并,得到目标档案。这样,可以将多个待合并档案中同一个人的档案进行合并,使得每个人有且只有唯一一个档案,从而减少个人档案数量,便于档案管理,进而提高档案的管理效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种档案合并方法的流程图;图2是图1实施例中步骤103提供的一种方法的流程图;图3是图1实施中步骤103提供的另一种方法的流程图;图4是本专利技术实施例提供的一种档案树的构建示意图;图5是本专利技术实施例提供的另一种档案树的构建示意图;图6是图1实施例中步骤101提供的一种方法流程图;图7是图1实施例中步骤104提供的一种方法的流程图;图8是本专利技术实施例提供的一种档案合并装置的结构示意图;图9是图8实施例中相似度检测模块提供的一种结构示意图;图10是图8实施例中档案树构建模块提供的一种结构示意图;图11是图8实施例中档案树构建模块提供的另一种结构示意图;图12是图8中档案本文档来自技高网...

【技术保护点】
1.一种档案合并方法,其特征在于,包括以下步骤:/n检测多个待合并档案中每两个待合并档案的相似度,所述待合并档案包括档案ID以及用于计算相似度的档案特征;/n当检测到所述多个待合并档案中存在两个待合并档案之间的相似度达到预设相似度阈值时,以两个相似待合并档案分别为节点进行连接,得到多个节点对,所述节点包含对应的待合并档案的档案ID;/n基于所述多个节点对构建得到目标档案树,每棵所述目标档案树包括至少一个节点对;/n基于每棵所述目标档案树进行档案合并,得到对应的目标档案。/n

【技术特征摘要】
1.一种档案合并方法,其特征在于,包括以下步骤:
检测多个待合并档案中每两个待合并档案的相似度,所述待合并档案包括档案ID以及用于计算相似度的档案特征;
当检测到所述多个待合并档案中存在两个待合并档案之间的相似度达到预设相似度阈值时,以两个相似待合并档案分别为节点进行连接,得到多个节点对,所述节点包含对应的待合并档案的档案ID;
基于所述多个节点对构建得到目标档案树,每棵所述目标档案树包括至少一个节点对;
基于每棵所述目标档案树进行档案合并,得到对应的目标档案。


2.如权利要求1所述的档案合并方法,其特征在于,所述检测多个待合并档案中每两个待合并档案的相似度的步骤包括:
提取每个待合并档案的档案特征;
计算每两个档案特征之间的相似度;
基于所述每两个档案特征之间的相似度,得到多个待合并档案中每两个待合并档案的相似度。


3.如权利要求1所述的档案合并方法,其特征在于,所述基于所述多个节点对构建得到目标档案树的步骤包括:
对所述多个节点对进行去重,得到多个去重节点对;
任意选取一个去重节点对作为基础档案树;
在剩余的去重节点对中选取与所述基础档案树有共同节点的去重节点对与所述基础档案树进行结合,每次与所述基础档案树结合后,更新一次所述基础档案树,直到所述剩余的去重节点对不包含与更新后的基础档案树中存在相同节点的去重节点对,以得到目标档案树。


4.如权利要求3所述的档案合并方法,其特征在于,所述基于所述多个节点对构建得到目标档案树的步骤还包括:
判断所述剩余的去重节点中是否存在与所述基础档案树没有共同节点的去重节点对;
若所述剩余的去重节点中存在与所述基础档案没有共同节点对的去重节点对,则在所述与所述基础档案树没有共同节点的去重节点对中任意选取一个去重节点对作为新的基础档案树;
基于所述新的基础档案树,得到新的目标档案树。


5.如权利要求1所述的档案合并方法,其特征在于,所述基于每棵所述目标档案树进行档案合并,得到对应的目标档案的步骤包括:
将每棵所述目标档案树中的子节点合并到根节点上,得到目标档案;

【专利技术属性】
技术研发人员:戴世稳
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1