【技术实现步骤摘要】
一种摘要的生成方法、装置、设备及存储介质
[0001]本申请涉及人工智能
,尤其涉及一种摘要的生成方法、装置、设备及存储介质。
技术介绍
[0002]目前摘要的生成方式主要包括抽取式摘要和生成式摘要。抽取式摘要通常是将文本中的所有句子按照重要性进行排序,取出排序在阈值之前的句子重新组合成一段文字作为原文本的摘要。但是,抽取式摘要通常会由于缺乏对整个文档内容更高语义层面的概括,而存在生成的文本摘要语义不连贯的问题。生成式摘要则是由计算机结合神经网络模型,仿照人的思维阅读并提取文本概要作为原文本的摘要。但是,生成式摘要在实际应用过程中存在信息损失较大,甚至篡改关键信息的现象。因此,由当前的文本摘要生成方式生成的文本摘要的质量较差。
技术实现思路
[0003]本申请实施例的目的在于提出一种摘要的生成方法、装置、设备及存储介质,以解决生成的文本摘要的质量较差的问题。
[0004]为了解决上述技术问题,本申请实施例提供一种摘要的生成方法,采用了如下所述的技术方案:
[0005]获取文本的文本数据; ...
【技术保护点】
【技术特征摘要】
1.一种摘要的生成方法,其特征在于,包括下述步骤:获取文本的文本数据;所述文本数据包括段落数据和段落摘要数据,一个段落数据对应一个段落摘要数据;将所述段落数据和所述段落摘要数据分别进行编码处理,得到段落向量和段落摘要向量;提取所述段落数据中的主干信息和实体信息,得到主干向量和实体向量;所述主干信息至少包括所述段落数据对应的段落中,主谓宾结构或者主谓宾定状补结构对应的数据;所述实体信息至少包括所述段落数据对应的段落中的量词和名词;融合所述段落向量和所述主干向量,得到第一融合向量;根据所述第一融合向量和所述段落摘要向量计算得到交叉注意力向量;融合所述交叉注意力向量和所述实体向量,得到第二融合向量;对所述第二融合向量进行解码处理,得到文本的摘要。2.根据权利要求1所述的生成方法,其特征在于,所述融合所述段落向量和所述主干向量,得到第一融合向量,包括:对所述段落向量和所述主干向量分别进行维度转换处理,得到段落转换向量和主干转换向量;所述段落转换向量为所述段落数据的转换向量;所述主干转换向量为所述主干信息的转换向量;根据所述段落转换向量,计算得到所述段落数据的自注意力向量;融合所述自注意力向量和所述主干转换向量,得到第一融合向量。3.根据权利要求2所述的生成方法,其特征在于,所述融合所述自注意力向量和所述主干转换向量,得到第一融合向量,包括:根据公式融合所述自注意力向量和所述主干转换向量,得到第一融合向量;其中,V
′
用于表示所述第一融合向量,用于表示所述自注意力向量,Z
′
用于表示所述主干转换向量,用于表示所述第一融合向量的参数矩阵,用于表示所述第一融合向量的偏置项。4.根据权利要求1所述的生成方法,其特征在于,所述根据所述第一融合向量和所述段落摘要向量计算得到交叉注意力向量,包括:通过transformer的译码器对所述第一融合向量和所述段落摘要向量进行维度转换处理,得到交叉转换向量;根据所述交叉转换向量,计算得到所述交叉注意力向量。5.根据权利要求1所述的生成方法,其特征在于,所述融合所述交叉注意力向量和所述实体向量,得到第二融合向量,包括:根据公式对所述实体向量进行维度转换处理,得到实体转换向量,其中,C
′
用于表示所述实体转换向量,i表示实体信息中第i个字,在i为偶数时,pos(i)=sin(i/100002),在i为奇数时,pos(i)=cos(i/100002...
【专利技术属性】
技术研发人员:黄勇其,王伟,张黔,于翠翠,
申请(专利权)人:润联软件系统深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。