【技术实现步骤摘要】
本专利技术涉及辐射,特别涉及一种天然气客户用气非结构化的数据抽取方法及装置。
技术介绍
1、为实现天然气价值最大化,深入理解客户用气特性、创建知识图谱变得至关重要,不仅有助于销售公司优化供应链,还能增强服务质量,提升用户满意度,增强天然气销售公司的竞争优势。信息采集及抽取是客户特性分析及创建知识图谱的第一步且是关键的技术基础,结构化的数据采集清洗技术已非常成熟,非结构化的数据抽取及转换与文档内容及目标数据格式高度相关,抽取过程存在一定复杂性,通用性较差,如果抽取质量较差将极大降低后续客户特性分析及知识图谱创建的效果。因此如何针对天然气客户的非结构化数据进行自动抽取及转换为结构化的数据成为亟待解决的问题。
技术实现思路
1、鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种天然气客户用气非结构化的数据抽取方法及装置。
2、第一方面,本专利技术实施例提供了一种天然气客户用气非结构化的数据抽取方法,包括:
3、获取客户用气数据的文本,将
...【技术保护点】
1.一种天然气客户用气非结构化的数据抽取方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述从转换后得到的字符串中提取出客户用气粗粒度数据,包括:
3.如权利要求1所述的方法,其特征在于,所述类别为描述类文本,对描述类文本类别下的所述客户用气粗粒度数据进行处理,得到描述类文本类别下的结构化的数据,包括:
4.如权利要求1所述的方法,其特征在于,所述类别为表格类文本,对表格类文本类别下的所述客户用气粗粒度数据进行处理,得到表格类文本类别下的结构化的数据,包括:
5.如权利要求1所述的方法,其特征在于,所述
...【技术特征摘要】
1.一种天然气客户用气非结构化的数据抽取方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述从转换后得到的字符串中提取出客户用气粗粒度数据,包括:
3.如权利要求1所述的方法,其特征在于,所述类别为描述类文本,对描述类文本类别下的所述客户用气粗粒度数据进行处理,得到描述类文本类别下的结构化的数据,包括:
4.如权利要求1所述的方法,其特征在于,所述类别为表格类文本,对表格类文本类别下的所述客户用气粗粒度数据进行处理,得到表格类文本类别下的结构化的数据,包括:
5.如权利要求1所述的方法,其特征在于,所述类别为阅读理解类文本,对阅读理解类文本下的所述客户用气粗粒度数据进行处理,得到阅读理解...
【专利技术属性】
技术研发人员:张曦,潘凯,陈进殿,韩克江,刘定智,闵俊豪,夏希品,李峥嵘,
申请(专利权)人:中国石油天然气股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。