【技术实现步骤摘要】
文本信息抽取方法、装置、设备及可读存储介质
本专利技术涉及智能决策领域,尤其涉及一种文本信息抽取方法、装置、电子设备及可读存储介质。
技术介绍
文本信息抽取是自然语言处理领域极为重要的技术,主要功能是用于抽取文本中所需要信息,并对特定信息进行划分归类。但是,目前的文本信息抽取方法只能抽取特定的信息或对信息进行划分归类,无法直接得到需要的信息,例如:需要抽取文本中的每种水果和对应的单价,但是目前的文本抽取只能将水果抽取出来及单价抽取出来或者将不同的水果和对应的单价进行归类划分,无法直接抽取每种水果和对应的单价,信息抽取的效率较低。
技术实现思路
本专利技术提供一种文本信息抽取方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高文本信息抽取的效率。为实现上述目的,本专利技术提供的一种文本信息抽取方法,包括:接收待抽取文本,对所述待抽取文本进行位置信息标记,得到标准文本序列;利用信息抽取模型中的特征提取层对所述标准文本序列进行特征抽取,得到文本特征矩阵;利用所述信 ...
【技术保护点】
1.一种文本信息抽取方法,其特征在于,所述方法包括:/n接收待抽取文本,对所述待抽取文本进行位置信息标记,得到标准文本序列;/n利用信息抽取模型中的特征提取层对所述标准文本序列进行特征抽取,得到文本特征矩阵;/n利用所述信息抽取模型中的文本分类层对所述文本特征矩阵进行分类,得到文本信息分类结果;/n利用所述信息抽取模型中的文本匹配层对所述文本特征矩阵进行元素分类,得到文本特征图矩阵;/n根据所述文本特征图矩阵进行关联映射,得到文本信息关联结果;/n根据所述文本信息分类结果及所述文本信息关联结果进行无向图构建及极大团筛选关联,得到目标信息文本。/n
【技术特征摘要】
1.一种文本信息抽取方法,其特征在于,所述方法包括:
接收待抽取文本,对所述待抽取文本进行位置信息标记,得到标准文本序列;
利用信息抽取模型中的特征提取层对所述标准文本序列进行特征抽取,得到文本特征矩阵;
利用所述信息抽取模型中的文本分类层对所述文本特征矩阵进行分类,得到文本信息分类结果;
利用所述信息抽取模型中的文本匹配层对所述文本特征矩阵进行元素分类,得到文本特征图矩阵;
根据所述文本特征图矩阵进行关联映射,得到文本信息关联结果;
根据所述文本信息分类结果及所述文本信息关联结果进行无向图构建及极大团筛选关联,得到目标信息文本。
2.如权利要求1所述的文本信息抽取方法,其特征在于,所述利用信息抽取模型对所述标准文本序列进行信息抽取,得到文本信息分类结果及文本信息关联结果之前,还包括:
获取历史文本集,对所述历史文本集进行多标签标记,得到训练样本集;
利用所述训练样本集对预构建的深度学习模型进行训练,得到所述信息抽取模型。
3.如权利要求2所述的文本信息抽取方法,其特征在于,所述获取历史文本集,对所述历史文本集进行多标签标记,得到训练样本集,包括:
对所述历史文本集中的每个历史文本进行信息类别标签标记、字符坐标标签标记及信息类别关联标签标记,得到对应的训练样本;
对所述训练样本进行分词处理,得到分词序列样本;
汇总所有的所述分词序列样本,得到所述训练样本集。
4.如权利要求1所述的文本信息抽取方法,其特征在于,所述利用信息抽取模型中的特征提取层对所述标准文本序列进行信息特征抽取,得到文本特征矩阵,包括:
利用信息抽取模型的特征提取层将所述标准文本序列中的的每个词语转化为词向量;
将转化的所有词向量按照所述标准文本序列中对应的词语的先后顺序进行组合,得到所述文本特征矩阵。
5.如权利要求4所述的文本信息抽取方法,其特征在于,所述利用所述信息抽取模型中的文本匹配层对所述文本特征矩阵进行元素分类,得到文本特征图矩阵,包括:
将所述文本特征矩阵进行矩阵转置,得到文本特征行矩阵;
将所述文本特征行矩阵及所述文本特征矩阵进行矩阵乘法计算,得到初始文本特征图矩阵;
利用预设的分类函数对所述文本...
【专利技术属性】
技术研发人员:黄一鸣,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。