【技术实现步骤摘要】
摘要生成方法、装置、电子设备和可读存储介质
[0001]本申请涉及计算机
,特别是涉及一种摘要生成方法、装置、电子设备和可读存储介质。
技术介绍
[0002]目前,人们在互联网阅读文本时,通常会先阅读文本对应摘要以快速了解对应文本的核心内容。
[0003]在相关技术中,可以通过提取关键词、关键词组、关键句的方式来生成文本的摘要,然而,由于相关技术是根据关键词、关键词组、关键句出现的次数来确定关键词、关键词组、关键句的重要程度,因此,通过现有的摘要生成方法得到的摘要会出现无意义的字段,使得摘要不能体现文本的核心内容。因此,如何准确的提取文本的摘要是目前亟需解决的问题。
技术实现思路
[0004]有鉴于此,本申请实施例提供一种摘要生成方法、装置、电子设备和可读存储介质,以实现准确提取目标文本的摘要。
[0005]第一方面,提供了一种摘要生成方法,所述方法应用于电子设备,所述方法包括:
[0006]获取目标文本;
[0007]确定所述目标文本中的多个候选词的候选词向量; >[0008]基于各本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种摘要生成方法,其特征在于,所述方法包括:获取目标文本;确定所述目标文本中的多个候选词的候选词向量;基于各所述候选词向量构建所述目标文本对应的第一有向图;根据所述第一有向图,确定所述目标文本中的关键句;以及基于所述目标文本中的关键句,生成所述目标文本对应的摘要。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标文本中的多个候选词的候选词向量,包括:对所述目标文本进行分词,确定多个候选词;以及根据预先设置的词向量模型确定各所述候选词对应的候选词向量。3.根据权利要求1所述的方法,其特征在于,所述确定所述目标文本中的多个候选词的候选词向量,包括:对所述目标文本进行预处理,确定预筛选文本,所述预处理包括分词、数据清洗、关键句筛选中的至少一种;对所述预筛选文本进行分词,确定多个候选词;以及根据预先设置的词向量模型确定各所述候选词对应的候选词向量。4.根据权利要求3所述的方法,其特征在于,所述对所述目标文本进行预处理,确定预筛选文本,包括:对所述目标文本进行分词,确定所述目标文本中的第一备选词;去除各所述第一备选词中无意义的词,以确定第二备选词;根据预定词表和各第二备选词,确定所述目标文本中各语句的表示向量;根据各所述表示向量构建所述目标文本对应的第二有向图;以及根据所述第二有向图确定所述目标文本的预筛选文本。5.根据权利要求4所述的方法,其特征在于,所述根据所述第二有向图确定所述目标文本的预筛选文本,包括:基于预先设置的语句重要性排序算法和所述第二有向图,确定所述目标文本的各预筛选语句;以及基于各所述预筛选语句生成所述目标文本的预筛选文本。6.根据权利要求1所述的方法,其特征在于,所述基于各所述候选词向量构建所述目标文本对应的第一有向图,包括:对同一语句对应的各所述候选词向量进行合并,确定所述目标文本中...
【专利技术属性】
技术研发人员:唐毅,常诚,吴俊,刘昱彤,李勇,岳峰,刘璨,李济缘,
申请(专利权)人:北京印象笔记科技有限公司印象笔记成都科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。