档案归类方法及系统、计算机可读存储介质技术方案

技术编号:24758026 阅读:45 留言:0更新日期:2020-07-04 09:34
本发明专利技术公开了一种档案归类方法及系统、计算机可读存储介质,属于数据分析领域。该方法包括:获取多个档案中的多个图像信息;对多个图像信息进行特征值提取处理,得到与多个图像信息对应的多个图像特征值;对于每个档案,将档案对应的第一图像特征值与其他档案对应的第二图像特征值进行比对;当存在与第一图像特征值匹配的第二图像特征值时,将匹配的第二图像特征值对应的档案和第一图像特征值对应的档案进行关联处理。本发明专利技术通过对图像特征值进行比对来形成档案集合,无需人工进行档案归类,有效的提高了对档案进行归类的效率,所形成具有关联性的档案的档案集合的准确性较高。

File classification method and system, computer-readable storage medium

【技术实现步骤摘要】
档案归类方法及系统、计算机可读存储介质
本专利技术涉及数据分析领域,特别涉及一种档案归类方法及系统、计算机可读存储介质。
技术介绍
在一些场景中,需要对档案进行归类,将一个档案分配到一个或者多个类别中,得到多个不同类别的档案集合。举例而言,可以根据档案的主题来进行归类,也可以根据档案的属性信息来进行归类,其中,档案的属性信息可以包括档案的类型、作者、出版、时间等信息。通过对档案的归类,可以从得到的档案集合中获取更多具有系列性、连续性、关联性的信息。传统方法中通常需要人工对档案数据库中的档案进行归类。然而,由于档案数据库里存储的档案数量极其庞大,人工从档案数据库中查找相关档案的效率较低,导致对档案进行归类的效率较低,并且还可能会遗漏一些相关档案,导致后续形成的档案集合的准确性较低。
技术实现思路
本申请提供了一种档案归类方法及系统、计算机可读存储介质,可以解决现有的对档案进行归类的效率较低,且后续形成的档案集合的准确性较低的问题。所述技术方案如下:第一方面,提供了一种档案归类方法,所述方法包括:获取多个本文档来自技高网...

【技术保护点】
1.一种档案归类方法,其特征在于,所述方法包括:/n获取多个档案中的多个图像信息,每个所述档案包括至少一个图像信息;/n对所述多个图像信息进行特征值提取处理,得到与所述多个图像信息对应的多个图像特征值;/n基于所述多个图像信息对应的多个图像特征值,以及所述多个档案与所述多个图像信息的对应关系,确定每个所述档案对应的图像特征值;/n对于每个所述档案,将所述档案对应的第一图像特征值与其他档案对应的第二图像特征值进行比对;/n当存在与所述第一图像特征值匹配的第二图像特征值时,将匹配的第二图像特征值对应的档案和所述第一图像特征值对应的档案进行关联处理。/n

【技术特征摘要】
1.一种档案归类方法,其特征在于,所述方法包括:
获取多个档案中的多个图像信息,每个所述档案包括至少一个图像信息;
对所述多个图像信息进行特征值提取处理,得到与所述多个图像信息对应的多个图像特征值;
基于所述多个图像信息对应的多个图像特征值,以及所述多个档案与所述多个图像信息的对应关系,确定每个所述档案对应的图像特征值;
对于每个所述档案,将所述档案对应的第一图像特征值与其他档案对应的第二图像特征值进行比对;
当存在与所述第一图像特征值匹配的第二图像特征值时,将匹配的第二图像特征值对应的档案和所述第一图像特征值对应的档案进行关联处理。


2.根据权利要求1所述的方法,其特征在于,将所述档案对应的第一图像特征值与其他档案对应的第二图像特征值进行比对,包括:
对于每个所述第一图像特征值,确定所述第一图像特征值与所述其他档案对应的每个第二图像特征值的相似度值;
检测每个相似度值是否大于相似度阈值;
当某一相似度值大于所述相似度阈值时,确定存在与所述第一图像特征值匹配的第二图像特征值。


3.根据权利要求2所述的方法,其特征在于,所述图像特征值为数组或向量,
所述确定所述第一图像特征值与所述其他档案对应的每个第二图像特征值的相似度值,包括:
当所述图像特征值为数组时,基于相似度公式,确定所述第一图像特征值a与每个第二图像特征值b的相似度值q,所述相似度公式为:
q=m1/m,其中,m1为所述第一图像特征值a与所述第二图像特征值b数值相同位的个数,m为所述第一图像特征值a与所述第二图像特征值b中长度最长的数组的长度;
当所述图像特征值为向量时,计算所述第一图像特征值与其他档案对应的每个第二图像特征值的距离,基于计算得到的距离确定所述第一图像特征值与其他档案对应的每个第二图像特征值的相似度值。


4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
对每个所述图像特征值进行评分处理,得到与每个所述图像特征值对应的评分值;
当任一图像特征值对应的评分值低于评分阈值时,删除所述任一图像特征值。


5.根据权利要求1所述的方法,其特征在于,每个所述图像特征值配置有特征值类型,
所述将所述档案对应的第一图像特征值与其他档案对应的第二图像特征值进行比对,包括:
对所述档案对应的每个所述第一图像特征值执行比对过程,所述比对过程包括:
获取所述其他档案对应的第二图像特征值中与所述第一图像特征值的特征值类型一致的备选图像特征值;
将所述第一图像特征值依次与每个所述备选图像特征值进行比对,得到所述第一图像特征值与每个备选图像特征值的相似度值;
检测每个相似度值是否大于相似度阈值;
当某一相似度值大于所述相似度阈值时,确定存在与所述第一图像特征值匹配的第二图像特征值。


6.一种档案归类系统,其特征在于,所述系统包括:
获取模...

【专利技术属性】
技术研发人员:梁晨华
申请(专利权)人:杭州海康威视系统技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1