【技术实现步骤摘要】
摘要生成模型的训练方法、装置、设备及存储介质
[0001]本申请涉及人工智能领域,尤其涉及一种摘要生成模型的训练方法、装置、设备及存储介质。
技术介绍
[0002]随着人工智能的发展,通过深度学习结合NLP技术能够实现对长文本进行总结、归纳和摘要。目前来说,大部分的摘要生成模型可以通过对一段文字进行分析,从而在这段文字中提取关键词,将提取出的关键词合并构成该段文字所对应的摘要。但通过这种方式得到的摘要对文字本身的要求较高,需要文字中的关键词能够准确概括该段文字,当文字中的关键词无法准确概括文章内容时,采用这种方式生成的摘要的准确性和可读性都较差。
技术实现思路
[0003]本申请提供了一种摘要生成模型方法、装置、设备及存储介质,以提高摘要提取训练出的摘要生成模型的性能,进一步提高的摘要生成模型所生成摘要的准确度。
[0004]第一方面,本申请提供了一种摘要生成模型方法,所述方法包括:
[0005]获取训练数据,所述训练数据包括文字数据和与所述文字数据对应的评价数据;
[0006]对所述 ...
【技术保护点】
【技术特征摘要】
1.一种摘要生成模型的训练方法,其特征在于,所述方法包括:获取训练数据,所述训练数据包括文字数据和与所述文字数据对应的评价数据;对所述文字数据进行编码,得到所述文字数据所对应的编码向量;对所述文字数据进行特征提取,得到所述文字数据对应的语言特征;基于所述编码向量和所述语言特征进行信息筛选,从所述编码向量中确定关键向量;根据所述关键向量和所述评价数据对卷积神经网络进行迭代训练,并在训练完成时得到摘要生成模型。2.根据权利要求1所述的摘要生成模型的训练方法,其特征在于,在所述对所述文字数据进行编码之后,所述根据所述关键向量和所述文字评价数据对卷积神经网络进行迭代训练之前,所述方法包括:对所述文字数据进行线性变换,得到所述文字数据对应的初始向量;获取所述初始向量对应的权重,并根据所述初始向量和所述初始向量对应的权重计算注意力权重矩阵;根据所述注意力权重矩阵得到所述文字数据对应的注意力向量。3.根据权利要求1所述的摘要生成模型的训练方法,其特征在于,所述基于所述编码向量和所述语言特征进行信息筛选,从所述编码向量中确定关键向量,包括:按照门向量计算公式,基于所述编码向量和所述语言特征计算门向量;根据所述门向量对所述编码向量进行过滤,以从所述编码向量中确定关键向量。4.根据权利要求3所述的摘要生成模型的训练方法,其特征在于,所述门向量计算公式包括:gatet=δ(h
t
*W
g
+c
t
*U
g
+b
g
)其中,gatet为门向量,h
t
为编码向量,W
g
为编码向量对应的权重矩阵,c
t
为语言特征,U
g
为语言特征对应的权重矩阵,b
g
为偏置向量,δ为乙状...
【专利技术属性】
技术研发人员:古家昌,李炜,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。