一种天然气客户用气非结构化的数据抽取方法及装置制造方法及图纸

技术编号:45699137 阅读:17 留言:0更新日期:2025-07-01 20:13
本发明专利技术实施例提供了一种天然气客户用气非结构化的数据抽取方法,包括:获取客户用气数据的文本,将客户用气数据的文本转换成字符串;从转换后得到的字符串中提取出客户用气粗粒度数据;根据提取内容的类型,将客户用气粗粒度数据划分为多个类别,分别对各类别下的客户用气粗粒度数据进行处理,得到各类别下的结构化的数据;多个类别包括:描述类文本、表格类文本和阅读理解类文本。本发明专利技术实施例通过先获取客户用气数据的文本,后根据具体场景采用不同数据结构化方式,快速高效精准的获取了天然气客户用气数据,为后续进行天然气客户特性分析及知识图谱创建提供了高质量数据。

【技术实现步骤摘要】

本专利技术涉及辐射,特别涉及一种天然气客户用气非结构化的数据抽取方法及装置


技术介绍

1、为实现天然气价值最大化,深入理解客户用气特性、创建知识图谱变得至关重要,不仅有助于销售公司优化供应链,还能增强服务质量,提升用户满意度,增强天然气销售公司的竞争优势。信息采集及抽取是客户特性分析及创建知识图谱的第一步且是关键的技术基础,结构化的数据采集清洗技术已非常成熟,非结构化的数据抽取及转换与文档内容及目标数据格式高度相关,抽取过程存在一定复杂性,通用性较差,如果抽取质量较差将极大降低后续客户特性分析及知识图谱创建的效果。因此如何针对天然气客户的非结构化数据进行自动抽取及转换为结构化的数据成为亟待解决的问题。


技术实现思路

1、鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种天然气客户用气非结构化的数据抽取方法及装置。

2、第一方面,本专利技术实施例提供了一种天然气客户用气非结构化的数据抽取方法,包括:

3、获取客户用气数据的文本,将所述客户用气数据的文本文档来自技高网...

【技术保护点】

1.一种天然气客户用气非结构化的数据抽取方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述从转换后得到的字符串中提取出客户用气粗粒度数据,包括:

3.如权利要求1所述的方法,其特征在于,所述类别为描述类文本,对描述类文本类别下的所述客户用气粗粒度数据进行处理,得到描述类文本类别下的结构化的数据,包括:

4.如权利要求1所述的方法,其特征在于,所述类别为表格类文本,对表格类文本类别下的所述客户用气粗粒度数据进行处理,得到表格类文本类别下的结构化的数据,包括:

5.如权利要求1所述的方法,其特征在于,所述类别为阅读理解类文本...

【技术特征摘要】

1.一种天然气客户用气非结构化的数据抽取方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述从转换后得到的字符串中提取出客户用气粗粒度数据,包括:

3.如权利要求1所述的方法,其特征在于,所述类别为描述类文本,对描述类文本类别下的所述客户用气粗粒度数据进行处理,得到描述类文本类别下的结构化的数据,包括:

4.如权利要求1所述的方法,其特征在于,所述类别为表格类文本,对表格类文本类别下的所述客户用气粗粒度数据进行处理,得到表格类文本类别下的结构化的数据,包括:

5.如权利要求1所述的方法,其特征在于,所述类别为阅读理解类文本,对阅读理解类文本下的所述客户用气粗粒度数据进行处理,得到阅读理解...

【专利技术属性】
技术研发人员:张曦潘凯陈进殿韩克江刘定智闵俊豪夏希品李峥嵘
申请(专利权)人:中国石油天然气股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1