基于自然语言处理的建设征地移民档案管理方法及系统技术方案

技术编号:40949819 阅读:14 留言:0更新日期:2024-04-18 20:24
本发明专利技术涉及文本档案处理技术领域,提供了一种基于自然语言处理的建设征地移民档案管理方法及系统,通过自然语言处理和机器学习的方法对待归档存储的原始建设征地移民档案进行深度挖掘和分析,有效地提取出档案中的关键信息,并将这些信息转化为可计算的语义向量。进一步,它能够发现并修正可能存在的错误,优化文本表述,使得档案信息更加清晰、准确。最后,根据复述后的语义向量与原始语义向量之间的差异,该方案可以提出合理的档案存储策略,从而极大地提高了档案管理的效率和质量。

【技术实现步骤摘要】

本专利技术涉及文本档案处理,具体而言,涉及一种基于自然语言处理的建设征地移民档案管理方法及系统


技术介绍

1、自然语言处理(natural language processing,nlp)是人工智能和计算机科学的一个重要分支,主要研究如何让计算机理解和生成人类语言。近年来,随着深度学习等技术的快速发展,自然语言处理在文本挖掘、情感分析、机器翻译等领域取得了显著成果。

2、建设征地移民档案管理是公共行政管理中的一项重要任务,涉及大量的文本信息处理和分析。然而,传统的文本处理方式多依赖于人工操作,不仅效率低下,而且易出错,无法满足大规模档案管理的需求。此外,由于档案信息内容复杂,存在大量的非结构化数据,如何有效提取关键信息,并根据这些信息制定合理的档案存储策略,是当前档案管理面临的重大挑战。


技术实现思路

1、为了改善上述问题,本专利技术提供了一种基于自然语言处理的建设征地移民档案管理方法及系统。

2、本专利技术实施例的第一方面,提供了一种基于自然语言处理的建设征地移民档案管理方法,应用本文档来自技高网...

【技术保护点】

1.一种基于自然语言处理的建设征地移民档案管理方法,其特征在于,应用于自然语言处理系统,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述将所述档案文本语义向量集拆解成第一局部文本语义向量组与第二局部文本语义向量组,包括:

3.如权利要求2所述的方法,其特征在于,所述第一局部文本语义向量组和所述第二局部文本语义向量组之间的文本语义共性指数包括:第一局部文本语义向量组中档案文本语义向量所表示的文本单元和所述第二局部文本语义向量组中档案文本语义向量所表示的文本单元间的相对分布联系;

4.如权利要求3所述的方法,其特征在于,所述方法还包括:

...

【技术特征摘要】

1.一种基于自然语言处理的建设征地移民档案管理方法,其特征在于,应用于自然语言处理系统,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述将所述档案文本语义向量集拆解成第一局部文本语义向量组与第二局部文本语义向量组,包括:

3.如权利要求2所述的方法,其特征在于,所述第一局部文本语义向量组和所述第二局部文本语义向量组之间的文本语义共性指数包括:第一局部文本语义向量组中档案文本语义向量所表示的文本单元和所述第二局部文本语义向量组中档案文本语义向量所表示的文本单元间的相对分布联系;

4.如权利要求3所述的方法,其特征在于,所述方法还包括:

5.如权利要求1-4任一项所述的方法,其特征在于,所述依据所述文本复述语义向量集与所述档案文本语义向量集之间的区别,获得相应的档案存储建议策略,包括:

6.如权利要求5所述的方法,其特征在于,所述依据所述待进行归档存储的原始建设征地移民档...

【专利技术属性】
技术研发人员:江进辉李浩王鄂豫李鹏王玉着黄刘芳钟磊龙章胡涛谭哲武
申请(专利权)人:长江勘测规划设计研究有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1