档案智能著录方法、设备及存储介质技术

技术编号:46398420 阅读:6 留言:0更新日期:2025-09-16 19:49
本申请公开了档案档案智能著录方法、设备及存储介质,应用于边缘节点,所述方法包括:通过预先部署的轻量化双模型对预先采集的档案信息进行分层特征提取与融合,生成带有置信度标注的著录项集合;将所述著录项集合中的低置信度著录项上传至云端服务器;获取所述云端服务器输送的著录修正数据,所述著录修正数据基于所述云端服务器对所述低置信度著录项进行多模态对比分析生成;将未被标记为低置信度著录项的著录项与所述著录修正数据进行整合,按标准著录规则生成标准著录文件。实现了复杂场景下标准著录文件的高质量生成。

【技术实现步骤摘要】

本申请涉及档案信息化领域,尤其涉及档案档案智能著录方法、设备及存储介质


技术介绍

1、随着档案数字化进程的加速,智能著录技术逐渐成为提升档案管理效率的核心手段。当前行业普遍采用云端大模型结合光学字符(ocr,optical character recognition)识别技术实现档案信息自动化提取,并依赖预设规则模板完成著录项结构化处理。然而,现有技术架构中,海量档案数据需依赖公有或企业私有云服务器进行集中处理,导致实时响应能力受网络延迟制约,且敏感档案信息在传输过程中存在数据泄露隐患

2、同时,传统ocr识别技术对印刷体文本的识别依赖规则模板的精准匹配,在面对手写体字迹潦草、扫描件图像模糊或非标准版式档案时,易出现关键字段漏检或语义误判问题,严重制约复杂场景下的著录准确率与系统泛化能力,难以满足高保密性、高实时性及多模态档案处理的实际需求。


技术实现思路

1、本申请的主要目的在于提供档案档案智能著录方法、设备及存储介质,旨在解决基于公有云的档案智能著录服务存在响应延迟、隐私泄露风险和泛化能力差本文档来自技高网...

【技术保护点】

1.一种档案智能著录方法,其特征在于,应用于边缘节点,所述档案智能著录方法包括:

2.如权利要求1所述的档案智能著录方法,其特征在于,所述通过预先部署的轻量化双模型对预先采集的档案信息进行分层特征提取与融合,生成带有置信度标注的著录项集合的步骤包括:

3.如权利要求2所述的档案智能著录方法,其特征在于,所述将所述文字识别结果和所述结构化视觉特征向量输入所述文字理解模型,通过所述文字理解模型生成带有置信度标注的著录项集合的步骤包括:

4.如权利要求3所述的档案智能著录方法,其特征在于,所述通过所述文字理解模型对所述视觉增强文本进行实体抽取、语义补全和置信...

【技术特征摘要】

1.一种档案智能著录方法,其特征在于,应用于边缘节点,所述档案智能著录方法包括:

2.如权利要求1所述的档案智能著录方法,其特征在于,所述通过预先部署的轻量化双模型对预先采集的档案信息进行分层特征提取与融合,生成带有置信度标注的著录项集合的步骤包括:

3.如权利要求2所述的档案智能著录方法,其特征在于,所述将所述文字识别结果和所述结构化视觉特征向量输入所述文字理解模型,通过所述文字理解模型生成带有置信度标注的著录项集合的步骤包括:

4.如权利要求3所述的档案智能著录方法,其特征在于,所述通过所述文字理解模型对所述视觉增强文本进行实体抽取、语义补全和置信度计算,生成带有置信度标注的著录项集合的步骤包括:

5.如权利要求1所述的档案智能著录方法,其特征在于,所述档案智能著录方法还包括:

6.一种...

【专利技术属性】
技术研发人员:张明吉
申请(专利权)人:北京众优科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1