文本提取方法、装置、计算机、存储介质及程序产品制造方法及图纸

技术编号:43972203 阅读:26 留言:0更新日期:2025-01-10 20:00
本申请公开了一种文本提取方法、装置、计算机、存储介质及程序产品,方法包括:对基础样本数据进行特征提取,得到多个样本特征数据;对所述多个样本特征数据中不同类别的样本特征数据进行标签处理,得到多个样本特征数据标签;根据双向长短期记忆网络‑条件随机场模型确定所述多个样本特征数据标签中不同样本特征数据标签的输出概率;提取所述基础样本数据中与所述输出概率最大的样本特征数据标签对应的文本。通过对基础文本数据进行特征提取和标签处理,然后输入双向长短期记忆网络‑条件随机场模型,提取模型输出概率最高的文本数据,有利于提高对大量文本数据进行关键数据提取的效率。

【技术实现步骤摘要】

本申请涉及数据提取,尤其涉及一种文本提取方法、装置、计算机、存储介质及程序产品


技术介绍

1、随着电网业务量的不断增加,电力设备、施工人员、文本记录数量也不断加大,给现场施工作业安全管理带来很大的难题。如何有效的对大量文本数据进行关键数据提取,是当下电力现场作业亟待解决的问题。


技术实现思路

1、本申请实施例提供一种文本提取方法、装置、计算机、存储介质及程序产品,通过对基础文本数据进行特征提取和标签处理,然后输入双向长短期记忆网络-条件随机场模型,提取模型输出概率最高的文本数据,有利于提高对大量文本数据进行关键数据提取的效率。

2、第一方面,本申请实施例提供了一种文本提取方法,所述方法包括:

3、对基础样本数据进行特征提取,得到多个样本特征数据;

4、对所述多个样本特征数据中不同类别的样本特征数据进行标签处理,得到多个样本特征数据标签;

5、根据双向长短期记忆网络-条件随机场模型确定所述多个样本特征数据标签中不同样本特征数据标签的输出概率;

6、提本文档来自技高网...

【技术保护点】

1.一种文本提取方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述对所述多个样本特征数据中不同类别的样本特征数据进行标签处理,得到多个样本特征数据标签,包括:

3.如权利要求1所述的方法,其特征在于,在所述根据双向长短期记忆网络-条件随机场模型确定所述多个样本特征数据标签中不同样本特征数据标签的输出概率之前,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,所述根据双向长短期记忆网络-条件随机场模型确定所述多个样本特征数据标签中不同样本特征数据标签的输出概率,包括:

5.如权利要求4所述的方法,其特征在于...

【技术特征摘要】

1.一种文本提取方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述对所述多个样本特征数据中不同类别的样本特征数据进行标签处理,得到多个样本特征数据标签,包括:

3.如权利要求1所述的方法,其特征在于,在所述根据双向长短期记忆网络-条件随机场模型确定所述多个样本特征数据标签中不同样本特征数据标签的输出概率之前,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,所述根据双向长短期记忆网络-条件随机场模型确定所述多个样本特征数据标签中不同样本特征数据标签的输出概率,包括:

5.如权利要求4所述的方法,其特征在于,所述双向长短期记忆网络层包括词嵌入层、前向长短期记忆网络层、后向长短期记忆网络层以及全连接线性层,所述根据所述多个样本特征数据标...

【专利技术属性】
技术研发人员:高超宋鑫古宇军宋岩蒋远东任浩袁智源孙蓉蓉
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1