【技术实现步骤摘要】
本专利技术涉及数字化,特别是一种标准文本数字化转换与管理方法及系统。
技术介绍
1、电网运行和维护过程中产生的文本资料,往往具有一定的离散型,整合与标准化工作相关的作业指导书、技术规范、典型设计文件等资源,形成标准规范统一数据来源,方便资源管理的同时,为通过大数据和人工智能技术挖掘和揭示数据内在的关联关系,释放蕴涵在其中的大数据价值提供便利,为电网的智能化管理提供方便。
2、现有的文本资料进行数据化转换时,通常只能够单纯进行文字的转换,该种方式在文本资料转换为数据资料时,容易出现分段不清晰的问题,并且需要人工进行辅助分类,数据化处理进程缓慢。
技术实现思路
1、鉴于现有的文本资料转换为数据资料时,容易出现分段不清晰和数据化处理进程缓慢问题,提出了本专利技术。
2、因此,本专利技术所要解决的问题在于如何提高数据化处理进程速度和消除出现不清晰的分段。
3、为解决上述技术问题,本专利技术提供如下技术方案:
4、第一方面,本专利技术实施例提供了一种标
...【技术保护点】
1.一种标准文本数字化转换与管理方法,其特征在于:包括,
2.如权利要求1所述的标准文本数字化转换与管理方法,其特征在于:所述通过文字比对单元(102)将配合文字长度比例的测量和标点符号的关联识别包括以下步骤:
3.一种标准文本数字化转换与管理系统,其特征在于:包括数字化管理系统(100)和认证管理端(200),其中,
4.如权利要求3所述的标准文本数字化转换与管理系统,其特征在于:所述文字提取单元(101)用于对待录入的标准文本进行段落识别,提取文本中的文字信息;所述文字比对单元(102)用于对提取出来的文字信息进行比对,以识别关
...【技术特征摘要】
1.一种标准文本数字化转换与管理方法,其特征在于:包括,
2.如权利要求1所述的标准文本数字化转换与管理方法,其特征在于:所述通过文字比对单元(102)将配合文字长度比例的测量和标点符号的关联识别包括以下步骤:
3.一种标准文本数字化转换与管理系统,其特征在于:包括数字化管理系统(100)和认证管理端(200),其中,
4.如权利要求3所述的标准文本数字化转换与管理系统,其特征在于:所述文字提取单元(101)用于对待录入的标准文本进行段落识别,提取文本中的文字信息;所述文字比对单元(102)用于对提取出来的文字信息进行比对,以识别关键词或标点符号信息;所述数据分类单元(103)用于将提取出来的文字信息进行分类,以便后续的处理和存储;所述信息存储单元(104)用于将转换后的数据进行存储,以实现对这些数据的管理和利用。
5.如权利要求4所述的标准文本数字化转换与管理系统,其特征在于:所述文字提取单元(101)包括分段识别模块(101a)、文字提取模块(101b)和转化...
【专利技术属性】
技术研发人员:蒋圣超,覃剑,周育忠,王飞风,王斌,林正平,黎大健,卓浩泽,裴云庆,田树军,凌颖,吕泽承,
申请(专利权)人:广西电网有限责任公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。