一种标准文本数字化转换与管理方法及系统技术方案

技术编号:41241256 阅读:23 留言:0更新日期:2024-05-09 23:53
本发明专利技术公开了一种标准文本数字化转换与管理方法及系统,涉及数字化技术领域,包括认证管理端和数字化管理系统,数字化管理系统通过对待录入标准文本进行段落识别,并进行文本数据化转换认证管理端与数字化管理系统对接,数字化管理系统包括文字提取单元、文字比对单元、数据分类单元以及信息存储单元。本发明专利技术通过处理标准文本,先进行段落识别,后转换成数字形式,确保数据转换后的段落有序,为标准文本提供有序的数据化转换,结合文字长度比例和标点符号识别,调整排布和字体大小,实现对标准文本的智能整理和高效数据化处理;设置标签和关键词支持有效分类,通过关键词数量排序确保文本数据可以按分类标签云端存储,方便查找和挖掘后续数据。

【技术实现步骤摘要】

本专利技术涉及数字化,特别是一种标准文本数字化转换与管理方法及系统


技术介绍

1、电网运行和维护过程中产生的文本资料,往往具有一定的离散型,整合与标准化工作相关的作业指导书、技术规范、典型设计文件等资源,形成标准规范统一数据来源,方便资源管理的同时,为通过大数据和人工智能技术挖掘和揭示数据内在的关联关系,释放蕴涵在其中的大数据价值提供便利,为电网的智能化管理提供方便。

2、现有的文本资料进行数据化转换时,通常只能够单纯进行文字的转换,该种方式在文本资料转换为数据资料时,容易出现分段不清晰的问题,并且需要人工进行辅助分类,数据化处理进程缓慢。


技术实现思路

1、鉴于现有的文本资料转换为数据资料时,容易出现分段不清晰和数据化处理进程缓慢问题,提出了本专利技术。

2、因此,本专利技术所要解决的问题在于如何提高数据化处理进程速度和消除出现不清晰的分段。

3、为解决上述技术问题,本专利技术提供如下技术方案:

4、第一方面,本专利技术实施例提供了一种标准文本数字化转换与管本文档来自技高网...

【技术保护点】

1.一种标准文本数字化转换与管理方法,其特征在于:包括,

2.如权利要求1所述的标准文本数字化转换与管理方法,其特征在于:所述通过文字比对单元(102)将配合文字长度比例的测量和标点符号的关联识别包括以下步骤:

3.一种标准文本数字化转换与管理系统,其特征在于:包括数字化管理系统(100)和认证管理端(200),其中,

4.如权利要求3所述的标准文本数字化转换与管理系统,其特征在于:所述文字提取单元(101)用于对待录入的标准文本进行段落识别,提取文本中的文字信息;所述文字比对单元(102)用于对提取出来的文字信息进行比对,以识别关键词或标点符号信息;...

【技术特征摘要】

1.一种标准文本数字化转换与管理方法,其特征在于:包括,

2.如权利要求1所述的标准文本数字化转换与管理方法,其特征在于:所述通过文字比对单元(102)将配合文字长度比例的测量和标点符号的关联识别包括以下步骤:

3.一种标准文本数字化转换与管理系统,其特征在于:包括数字化管理系统(100)和认证管理端(200),其中,

4.如权利要求3所述的标准文本数字化转换与管理系统,其特征在于:所述文字提取单元(101)用于对待录入的标准文本进行段落识别,提取文本中的文字信息;所述文字比对单元(102)用于对提取出来的文字信息进行比对,以识别关键词或标点符号信息;所述数据分类单元(103)用于将提取出来的文字信息进行分类,以便后续的处理和存储;所述信息存储单元(104)用于将转换后的数据进行存储,以实现对这些数据的管理和利用。

5.如权利要求4所述的标准文本数字化转换与管理系统,其特征在于:所述文字提取单元(101)包括分段识别模块(101a)、文字提取模块(101b)和转化...

【专利技术属性】
技术研发人员:蒋圣超覃剑周育忠王飞风王斌林正平黎大健卓浩泽裴云庆田树军凌颖吕泽承
申请(专利权)人:广西电网有限责任公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1