【技术实现步骤摘要】
摘要生成方法、装置、计算机设备和存储介质
[0001]本申请涉及人工智能、文字处理领域,尤其涉及一种摘要生成方法、装置、计算机设备和存储介质。
技术介绍
[0002]由于长文本的篇幅比较长,为了便于用户阅读,通常需要对长文本进行摘要概括。随着信息的爆炸式增长,长文本的数量不断增加而且需要实时更新,人工编写摘要无法做到实时更新,因此如何自动生成长文本的摘要尤为重要。
[0003]在现有技术中,通常是通过神经网络模型抽取长文本中重要的句子作为一篇摘要。但是神经网络模型对输入文本的长度有要求,神经网络模型无法很好地处理超过最大处理长度的文本,无法准确地生成摘要。若扩充了神经网络模型的最大处理长度,但会存在长距离依赖关系的问题,导致神经网络模型生成摘要的准确性较低。
[0004]因此,如何提高摘要生成的准确性成为亟需解决的问题。
技术实现思路
[0005]本申请提供了一种摘要生成方法、装置、计算机设备和存储介质,通过根据标题文本与正文语句集合进行语句提取获得关键语句,并根据关键语句与标题文本输入摘要生 ...
【技术保护点】
【技术特征摘要】
1.一种摘要生成方法,其特征在于,包括:获取待生成摘要的目标文本,所述目标文本包括标题文本与包含至少一个语句的正文语句集合;根据所述标题文本与所述正文语句集合进行语句提取,获得所述正文语句集合对应的关键语句;基于摘要生成模型,根据所述关键语句与所述标题文本进行摘要生成,获得所述目标文本对应的目标摘要信息。2.根据权利要求1所述的摘要生成方法,其特征在于,所述根据所述标题文本与所述正文语句集合进行语句提取,获得所述正文语句集合对应的关键语句,包括:确定所述正文语句集合中的每个语句对应的第一重要性得分,所述第一重要性得分为每个所述语句与所述标题文本之间的重要性得分;确定每个所述语句对应的第二重要性得分,所述第二重要性得分为每个所述语句在所述正文语句集合中的重要性得分;根据每个所述语句的第一重要性得分与第二重要性得分,确定所述关键语句。3.根据权利要求2所述的摘要生成方法,其特征在于,所述确定所述正文语句集合中的每个语句对应的第一重要性得分,包括:将每个所述语句输入向量化模型进行向量化,获得每个所述语句对应的语句向量;将所述标题文本输入所述向量化模型进行向量化,获得所述标题文本对应的标题文本向量;计算每个所述语句对应的语句向量与所述标题文本向量之间的相似度,并将得到的相似度确定为每个所述语句对应的第一重要性得分。4.根据权利要求2所述的摘要生成方法,其特征在于,所述确定每个所述语句对应的第二重要性得分,包括:确定每个所述语句对应的语句向量;根据不同语句对应的语句向量,计算每个所述语句与其它语句之间的相似度,获得每个所述语句对应的相似度矩阵;根据每个所述语句对应的相似度矩阵,确定每个所述语句对应的第二重要性得分。5.根据权利要求4所述的摘要生成方法,其特征在于,所述根据每个所述语句对应的相似度矩阵,确定每个所述语句对应的第二重要性得分,包括:构建所述正文语句集合的句子图,所述句子图中的每个节点对应所述正文语句集合中的一个语句,不同节点之间具有边;根据每个所述语句对应的相似度矩阵,确定所述句子图中的边的权重值;基于文本排序算法,根据所述句子图中的边的权重值对所述句...
【专利技术属性】
技术研发人员:杜江楠,李剑锋,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。