一种基于AI的档案检索方法与系统技术方案

技术编号:36534144 阅读:18 留言:0更新日期:2023-02-01 16:18
本发明专利技术提供一种基于AI的档案检索方法与系统,属于计算机技术领域,具体包括:采用基于机器学习算法的人脸识别模型确认检索人员的身份信息,确认检索人员的权限,并根据检索人员的权限以及档案的密级,确定检索人员的检索范围;基于所述检索人员的检索词的解析结果以及所述检索人员的检索范围,得到检索结果;将检索结果中的档案作为检索档案,确定检索档案是否存在检索人员借阅过的档案,若是,则将借阅过的档案放置于检索结果的最前列;将除去借阅过的档案的检索档案作为后续档案,并基于后续档案的借阅次数、检索次数、页数、密级构建档案分数,基于档案分数的大小进行后续档案的排序,从而进一步提升了档案检索以及排序的效率。率。率。

【技术实现步骤摘要】
一种基于AI的档案检索方法与系统


[0001]本专利技术属于计算机
,具体涉及一种基于AI的档案检索方法与系统。

技术介绍

[0002]档案检索是一项复杂的系统工程,它的实践性与科学性皆强,并且涉及多个领域知识。档案数量之巨大,增长速度之惊人使得我们要从中迅速、准确、完整地查找出所需信息内容犹如大海捞针、沙里淘金般艰难,必须依靠科学的理论、方法和手段才能实现。档案检索是档案资源开发利用中不可缺少的一部分。如若档案信息不能被社会使用,它将失去其生存价值。如何在海量的档案数据中快速检索到准确的档案资源,一直是档案检索的关键问题。
[0003]为了实现对档案的快速准确的检索,在中国专利技术专利授权公告号CN114201658B《一种基于人脸识别的档案快速检索方法》中通过建立人物信息库和建立档案关联库,完成所有个人档案的人物信息库和档案关联库建立;再对个人档案对应的目标人物,进行人脸识别,以及人脸信息分析与提取,进而获取目标人物的人脸信息;通过人物信息库的信息读取和人脸比对检索,实现检索结果档案查阅和关联档案查阅,但是却存在以下技术问题:
[0004]1)忽略了不同的人员的权限信息,没有首先根据人员的权限信息以及档案的密级,首先对档案的检索范围进行缩减,从而提升检索的效率以及准确性。
[0005]2)没有首先根据人员的实际情况对检索结果进行首先的排序筛选,在此基础上再于档案的借阅次数、检索次数、页数、密级等进行档案分数的构建,从而基于档案分数进行检索结果的排序,特别是在检索结果较多时,进一步降低了检索的效率。
[0006]基于上述技术问题,需要设计及一种基于AI的档案检索方法与系统。

技术实现思路

[0007]本专利技术的目的是提供一种基于AI的档案检索方法与系统。
[0008]为了解决上述技术问题,本专利技术第一方面提供了一种基于AI的档案检索方法,包括:
[0009]S11采用基于机器学习算法的人脸识别模型,通过对检索人员的人脸识别结果,确认所述检索人员的身份信息;
[0010]S12基于所述检索人员的身份信息,确认所述检索人员的权限,并根据所述检索人员的权限以及档案的密级,确定所述检索人员的检索范围;
[0011]S13基于所述检索人员的检索词的解析结果以及所述检索人员的检索范围,得到检索结果;
[0012]S14将所述检索结果中的档案作为检索档案,确定所述检索档案是否存在所述检索人员借阅过的档案,若是,则将所述借阅过的档案放置于检索结果的最前列;
[0013]S15将除去所述借阅过的档案的检索档案作为后续档案,并基于所述后续档案的借阅次数、检索次数、页数、密级构建档案分数,基于所述档案分数的大小进行所述后续档
案的排序。
[0014]通过首先采用人脸识别算法识别得到检索人员的身份信息,并基于身份信息确定检索人员的权限,基于权限和密级,确定检索人员的检索档案的范围,从而解决了原来的没有首先根据检索人员的权限缩小检索档案的范围,使得检索的效率和准确性都得到了进一步的提升,在此基础上,通过对检索词的解析结果以及档案的检索范围,从而可以得到检索结果,根据检索人员借阅过的档案,首先将借阅过的档案放置于检索结果的最前列,将上述检索档案排除后的检索档案作为后续档案,并根据后续档案的借阅次数、检索次数、页数、密级构建档案分数,并根据档案分数的大小进行所述后续档案的排序,从而解决了原来没有通过构建档案分数进行排序的技术问题,从而极大的提升了检索的效率和准确性,并在第一时间为检索人员提供最有效的检索档案,提升了检索人员的检索体验。
[0015]通过首先基于检索人员的权限信息实现检索档案的范围的缩减,从而使得在不影响最终的检索准确度和全面性的基础上,进一步缩小了需要进行检索的档案的范围,提升了检索的效率。
[0016]通过首先根据检索人员的借阅过的档案进行筛选排序,然后再通过续档案的借阅次数、检索次数、页数、密级构建档案分数,基于所述档案分数的大小进行所述后续档案的排序,从而不仅仅使得检索档案的排序结果具有较好的准确性和全面性,同时也具有较高的检索效率。
[0017]进一步的技术方案在于,确定所述检索人员的身份信息的具体步骤为:
[0018]S21基于所述检索人员的人脸图像,对所述人脸图像的特征进行提取得到所述人脸特征,将所述人脸特征送入到基于SVM算法的预测模型之中,得到SVM身份信息;
[0019]S22将所述人脸图像送入到基于CNN算法的图像模型之中,得到CNN身份信息;
[0020]S23当且仅当所述SVM身份信息与所述CNN身份信息均为同一个人时,则确定所述检索人员的身份信息。
[0021]通过分别基于图像特征的SVM算法的预测模型以及基于CNN算法的图像模型,从而实现从两个角度实现对检索人员的身份信息的确认,进一步提升了身份信息确认的准确性,并为进一步实现对检索人员的权限的确认奠定了基础。
[0022]进一步的技术方案在于,所述人脸图像的特征为HOG图像特征以及SURF图像特征。
[0023]进一步的技术方案在于,确定所述检索人员的检索范围的具体步骤为:
[0024]S31根据所述检索人员的身份信息,基于设定好的人员权限数据库,确定所述检索人员的权限;
[0025]S32基于所述检索人员的权限,确定所任检索人员所能接触到的档案;
[0026]S33根据所述检索人员所能接触到的档案,确定所述检索人员的检索范围。
[0027]进一步的技术方案在于,当存在多个借阅过的档案,则需要对所述多个借阅过的档案进行二次排序,其中对所述多个借阅过的档案进行二次排序的具体步骤为:
[0028]S41确定所述多个借阅过的档案的借阅次数,根据所述多个借阅过的档案的借阅次数,确定所述多个借阅过的档案的顺序,当存在借阅次数相同的多个借阅过的档案时,则进入步骤S42;
[0029]S42基于所述借阅次数相同的多个借阅过的档案的页数对所述借阅次数相同的多个借阅过的档案进行排序,并当所述借阅次数相同的多个借阅过的档案的页数也相同时,
则将其作为最终借阅档案,并进入步骤S43;
[0030]S43基于所述最终借阅档案的档案分数进行排序,当所述最终借阅档案的档案分数相同时,则采取随机的方式对所述档案分数相同的最终借阅档案进行排序。
[0031]通过分步骤通过借阅次数、页数首先实现对档案的排序,从而在不需要进行较多的计算基础上,实现对档案的排序,提升了排序的效率,在此基础上,再依据最终借阅档案的档案分数进行排序,从而极大的提升了排序的准确性,并且减少了需要进行档案分数计算的档案的数量,提升了效率。
[0032]进一步的技术方案在于,采用关键词数据库的方式对所述检索词进行匹配,并根据匹配结果进行检索词的同义词的扩充,基于所述同义词以及所述检索词与所述档案的题目的匹配结果得到所述检索人员的检索词的解析结果。
[0033]进一步的技术方案在于,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于AI的档案检索方法,其特征在于,具体包括:S11采用基于机器学习算法的人脸识别模型,通过对检索人员的人脸识别结果,确认所述检索人员的身份信息;S12基于所述检索人员的身份信息,确认所述检索人员的权限,并根据所述检索人员的权限以及档案的密级,确定所述检索人员的检索范围;S13基于所述检索人员的检索词的解析结果以及所述检索人员的检索范围,得到检索结果;S14将所述检索结果中的档案作为检索档案,确定所述检索档案是否存在所述检索人员借阅过的档案,若是,则将所述借阅过的档案放置于检索结果的最前列;S15将除去所述借阅过的档案的检索档案作为后续档案,并基于所述后续档案的借阅次数、检索次数、页数、密级构建档案分数,基于所述档案分数的大小进行所述后续档案的排序。2.如权利要求1所述的基于AI的档案检索方法,其特征在于,确定所述检索人员的身份信息的具体步骤为:S21基于所述检索人员的人脸图像,对所述人脸图像的特征进行提取得到所述人脸特征,将所述人脸特征送入到基于SVM算法的预测模型之中,得到SVM身份信息;S22将所述人脸图像送入到基于CNN算法的图像模型之中,得到CNN身份信息;S23当且仅当所述SVM身份信息与所述CNN身份信息均为同一个人时,则确定所述检索人员的身份信息。3.如权利要求2所述的基于AI的档案检索方法,其特征在于,所述人脸图像的特征为HOG图像特征以及SURF图像特征。4.如权利要求1所述的基于AI的档案检索方法,其特征在于,确定所述检索人员的检索范围的具体步骤为:S31根据所述检索人员的身份信息,基于设定好的人员权限数据库,确定所述检索人员的权限;S32基于所述检索人员的权限,确定所任检索人员所能接触到的档案;S33根据所述检索人员所能接触到的档案,确定所述检索人员的检索范围。5.如权利要求1所述的基于AI的档案检索方法,其特征在于,当存在多个借阅过的档案,则需要对所述多个借阅过的档案进行二次排序,其中对所述多个借阅过的档案进行二次排序的具体步骤为:S41确定所述多个借阅过的档案的借阅次数,根据所述多个借阅过的档案的借阅次数,确定所述多个借阅过的档案的顺序,当存在借阅次数相同的多个借阅过的档案时,则进入步骤S42;S42基于所述借阅次数相同的多个借阅过的档案的页数对所述借阅次数相同的多个借阅过的档案进行排序,并当所述借阅次数相同的多个借阅过的档案的页数也相同时,则将其作为最终借阅档案,并进入步骤S43;S43基于所述最终借阅...

【专利技术属性】
技术研发人员:梁尔真周蕾郑望献吴存锋曹军杨海波
申请(专利权)人:浙江星汉信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1