【技术实现步骤摘要】
文本结构化处理方法、装置、计算机设备、介质和产品
[0001]本申请涉及自然语言处理
,特别是涉及一种文本结构化处理方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着我国经济水平的不断提高,国民用电量也逐步增大,因此电力系统规模不断扩大,随之而来的电力系统运作相关的工艺规程也不断增多。在电力系统运行过程中,需要对大量的工艺规程的执行情况进行实时追踪记录,以保证电力系统的正常运行。
[0003]传统方法,采用纸质版的工艺规程,对电力系统运行过程所产生的数据进行实时追踪记录生成记录结果。然而,所生成的纸质版的记录结果不便于保存。
[0004]随之出现了采用普通电子版本的工艺规程,对电力系统运行过程所产生的数据进行实时追踪记录的方式。但是,在采用普通电子版本的工艺规程,对电力系统运行过程所产生的数据进行实时追踪记录的过程中,针对电力系统中不同细分领域的工艺规程,需要分别采用不同的文本处理方法进行处理。因此,文本处理过程中的的工作量大、成本较高。
技术实现思路
[00 ...
【技术保护点】
【技术特征摘要】
1.一种文本结构化处理方法,其特征在于,所述方法包括:获取电力系统中的非结构化文本,对所述非结构化文本进行文本分割,生成文本分割结果;针对各所述文本分割结果,提取所述文本分割结果的属性信息;基于所述属性信息对所述文本分割结果进行结构化转换,生成与所述非结构化文本对应的结构化文本。2.根据权利要求1所述的方法,其特征在于,所述基于所述属性信息对所述文本分割结果进行结构化转换,生成与所述非结构化文本对应的结构化文本,包括:基于所述文本分割结果的属性信息对所述文本分割结果进行分类,生成所述文本分割结果的分类结果;根据所述分类结果,将所述文本分割结果填充至与所述分类结果对应的结构化模板;基于填充了所述文本分割结果的结构化模板,生成与所述非结构化文本对应的结构化文本。3.根据权利要求1或2所述的方法,其特征在于,所述针对各所述文本分割结果,提取所述文本分割结果的属性信息,包括:针对各所述文本分割结果,基于预设文本编写规则提取所述文本分割结果的属性信息;所述预设文本编写规则为编写所述非结构化文本所采用的编写规则,且所述预设文本编写规则中包括所述文本分割结果的文本排版格式及文本内容信息与属性信息之间的编写规则。4.根据权利要求3所述的方法,其特征在于,所述针对各所述文本分割结果,基于预设文本编写规则提取所述文本分割结果的属性信息,包括:针对各所述文本分割结果,从所述文本分割结果中提取文本内容信息,并识别所述文本分割结果的文本排版格式;根据所述文本分割结果的文本内容信息及文本排版格式,基于所述编写规则确定所述文本分割结果的属性信息;所述属性信息包括文本属性及指令属性。5.根据权...
【专利技术属性】
技术研发人员:张晓峰,陈增兴,
申请(专利权)人:中国广核集团有限公司中国广核电力股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。