【技术实现步骤摘要】
文本的摘要生成方法、装置、电子设备及可读介质
[0001]本专利技术涉及文本处理
,特别是涉及一种文本的摘要生成方法、一种文本的摘要生成装置、一种电子设备以及一种计算机可读介质。
技术介绍
[0002]随着文本信息的爆炸式增长,人们每天能接触到海量的文本信息,如新闻、会议记录、博客、聊天、报告、论文、微博等。其中,对于长文本摘要等总结性工作如工作会议记录和总结等,大多数都由人工完成,这一工作无疑大大损耗了劳动者的时间和人力。因此,从大量文本信息提取重要的内容变得越来越重要,自动文本摘要这门可以使用户更快速、准确地获取信息的技术也因此应运而生。从大量文本信息中提取重要的内容,已成为我们的一个迫切需求,而自动文本摘要(Automatic Text Summarization)则提供了一个高效的解决方案。自动文本摘要技术对文档信息进行有效的压缩提炼,帮助用户从海量信息中检索出所需的相关信息,避免通过搜索引擎来检索可能产生过多冗余片面信息的问题,有效地解决了信息过载的问题。然而,在相关技术对文本进行摘要生成的过程中,一方面为了保证内容完整性则容易存在摘要内容多且杂以及概括性弱等问题,另一方面为了摘要足够简洁则容易忽略重要信息导致内容不连贯,以及无法保证文本的中心思想,导致偏离文本表达的真正含义等问题。
技术实现思路
[0003]本专利技术实施例是提供一种文本的摘要生成方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决相关技术中在对文本进行摘要生成的过程中,存在摘要的连贯性、概括性弱以及与原文不 ...
【技术保护点】
【技术特征摘要】
1.一种文本的摘要生成方法,其特征在于,包括:获取预设文本,所述预设文本包括若干个第一文本分段;确定各个所述第一文本分段对应的第一分段摘要;根据相邻的至少两个所述第一文本分段的第一分段摘要之间的相似度,对所述第一文本分段进行处理,获得若干个第二文本分段;确定各个所述第二文本分段对应的第二分段摘要;根据所述第二分段摘要,生成针对所述预设文本的全文摘要。2.根据权利要求1所述的方法,其特征在于,所述获取预设文本之后,所述方法还包括:获取预设文本对应的全文关键词,并确定所述全文关键词对应的词汇链;依次从所述预设文本中确定文本长度相同的两个相邻语句,获得所述预设文本对应的多个语句对;根据所述词汇链,确定同一语句对中两个相邻语句之间的差异信息;若所述差异信息大于或等于预设差异阈值,则从所述同一语句对中两个相邻语句之间的连接处进行分段;生成与所述预设文本对应的若干个第一文本分段。3.根据权利要求1所述的方法,其特征在于,所述确定各个所述第一文本分段对应的第一分段摘要,包括:分别将各个所述第一文本分段输入摘要生成模型,获得所述第一文本分段对应的第一分段摘要。4.根据权利要求1所述的方法,其特征在于,所述根据相邻的至少两个所述第一文本分段的第一分段摘要之间的相似度,对所述第一文本分段进行处理,获得若干个第二文本分段,包括:获取所述第一文本分段的数量;确定相邻两个第一文本分段的第一分段摘要之间的相似度;若所述数量大于预设数量阈值,则采用所述第一文本分段的数量与所述预设数量阈值,从所有所述第一文本分段对应的相似度中提取目标相似度;采用所述目标相似度与预设相似度阈值,生成文本合并阈值;将相似度大于所述文本合并阈值的第一文本分段进行合并,获得若干个第二文本分段。5.根据权利要求4所述的方法,其特征在于,所述根据相邻的至少两个所述第一文本分段的第一分段摘要之间的相似度,对所述第一文本分段进行处理,获得若干个第二文本分段,还包括:若所述数量小于或等于预设数量阈值,则不进行文本合并。6.根据权利要求1所述的方法,其特征在于,所述根据相邻的至少两个所述第一文本分段的第一分段摘要之间的相似度,对所述第一文本分段进行处理,获得若干个第二文本分段,包括:确定相邻两个第一文本分段的第一分段摘要之间的相似度;采用所述第一文本分段的数量与所述预设数量阈值,从所有所述第一文本分段对应的相似度中提取目标相似度;
采用所述目标相似度与预设相似度阈值,生成文本合并阈值;将相似度大于所述文本合并阈值的第一文本分段进行合并,获得若干个第二文本分段。7.根据权利要求4或5或6所述的方法,其特征在于,所述确定相邻两个第一文本分段的第一分段摘要之间的相似度,包括:对所述第一分段摘要进行向量化,获得所述第一分段摘要的摘要向量;将相邻两个第一文本分段对应的摘要向量进行比对,获得所述相邻两个第一文本分段的第一分段摘要之间的相似度。8.根据权利要求7所述的方法,其特征在于,所述对所述第一分段摘要进行向量化,获得所述第一分段摘要的摘要向量,包括:将所述第一分段摘要输入相似度判断模型进行...
【专利技术属性】
技术研发人员:杨鹏,涂曼姝,龚能,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。