文本摘要生成方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:39290656 阅读:6 留言:0更新日期:2023-11-07 10:59
本发明专利技术涉及文本处理技术领域,具体为文本摘要生成方法、装置、电子设备及可读存储介质,电子设备、应用程序和可读存储介质,所述应用程序包括文本输入模块、分句模块、分词模块、关键句提取模块、关键词提取模块、句子排序模块、摘要生成模块和摘要展示模块,所述文本摘要生成方法包括:文本预处理,关键词提取,重点句子提取,句子重要性评估,句子排序,摘要生成,摘要评估和输出结果。本发明专利技术通过文本预处理,关键词提取,重点句子提取,句子重要性评估,句子排序,摘要生成,摘要评估和输出结果这些步骤可以快速、准确地生成高质量的文本摘要,提高文本处理的效率和质量。文本处理的效率和质量。文本处理的效率和质量。

【技术实现步骤摘要】
文本摘要生成方法、装置、电子设备及可读存储介质


[0001]本专利技术涉及文本处理
,具体为文本摘要生成方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着互联网的发展,人们需要处理的文本越来越多,其中大部分是冗长的文章,需要花费大量时间阅读。因此,自动生成文本摘要成为了一种有效的方式,可以帮助人们快速了解文章的主旨和重点内容。
[0003]目前,已经有一些文本摘要生成的方法和装置,如基于统计模型的方法和基于深度学习的方法。但是,这些方法存在一些问题,如摘要质量不高、生成时间长等,需要进一步优化和改进。

技术实现思路

[0004]本专利技术的目的在于提供文本摘要生成方法、装置、电子设备及可读存储介质,以解决上述
技术介绍
中提出现有的一些文本摘要生成的方法和装置,如基于统计模型的方法和基于深度学习的方法,但是,这些方法存在一些问题,如摘要质量不高、生成时间长等,需要进一步优化和改进的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:文本摘要生成方法、装置、电子设备及可读存储介质,包括:电子设备、应用程序和可读存储介质,所述应用程序包括文本输入模块、分句模块、分词模块、关键句提取模块、关键词提取模块、句子排序模块、摘要生成模块和摘要展示模块,所述文本摘要生成方法包括:文本预处理,关键词提取,重点句子提取,句子重要性评估,句子排序,摘要生成,摘要评估和输出结果。
[0006]优选的,所述文本预处理对输入文本进行分句、分词、去除停用词进行预处理操作,以便于后续处理。
[0007]优选的,所述关键词提取使用TF

IDF算法提取文本中的关键词,作为摘要生成的基础。
[0008]优选的,所述重点句子提取根据关键词和句子的位置信息,提取文章中的重点句子。
[0009]优选的,所述句子重要性评估针对每个句子进行重要性评估,可以使用一些机器学习算法或者深度学习模型,如文本分类模型、序列模型,以确定每个句子的重要性得分。
[0010]优选的,所述句子排序按照句子的重要性得分进行排序,将得分高的句子放在前面。
[0011]优选的,所述摘要生成根据排序后的句子,按照一定的长度或者字数,选取前几个句子组成文本摘要。
[0012]优选的,所述摘要评估通过计算生成的摘要与原文的相似度指标,评估摘要的质量。
[0013]优选的,所述输出结果将生成的摘要输出给用户或者存储到电子设备中。
[0014]与现有技术相比,本专利技术的有益效果是:
[0015]1、该文本摘要生成方法、装置、电子设备及可读存储介质通过文本预处理,关键词提取,重点句子提取,句子重要性评估,句子排序,摘要生成,摘要评估和输出结果这些步骤可以快速、准确地生成高质量的文本摘要,提高文本处理的效率和质量。
[0016]2、该文本摘要生成方法、装置、电子设备及可读存储介质通过文本输入模块、分句模块、分词模块、关键句提取模块、关键词提取模块、句子排序模块、摘要生成模块和摘要展示模块可以在硬件或软件中实现,例如可以使用计算机来实现这些模块,在计算机中实现时,每个模块可以是一个独立的程序或函数,也可以是一个库或插件,方便维护和升级。
附图说明
[0017]图1为本专利技术的方法步骤流程示意图;
[0018]图2为本专利技术的应用程序操作流程示意图;
[0019]图3为本专利技术的文本摘要生成装置结构设备示意图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]请参阅图1

3,本专利技术提供的一种实施例:文本摘要生成方法、装置、电子设备及可读存储介质,包括:电子设备、应用程序和可读存储介质,所述应用程序包括文本输入模块、分句模块、分词模块、关键句提取模块、关键词提取模块、句子排序模块、摘要生成模块和摘要展示模块,所述文本摘要生成方法包括:文本预处理,关键词提取,重点句子提取,句子重要性评估,句子排序,摘要生成,摘要评估和输出结果,用户输入待摘要的文本数据,可以是单篇文章、多篇文章或一段话。
[0022]进一步的,所述文本预处理对输入文本进行分句、分词、去除停用词进行预处理操作,以便于后续处理,具体为对输入的原始文本进行清洗和分词,去除无用信息,保留关键词和短语,可以采用常见的自然语言处理技术,如分词算法、停用词过滤,对输入的文本进行预处理,包括去除停用词、分词、词性标注等处理,以便后续处理能够更加精准,具体地,可以使用自然语言处理技术,如中文分词算法、停用词过滤等技术,将文本数据处理为可以进行后续计算的形式。
[0023]进一步的,所述关键词提取使用TF

IDF算法提取文本中的关键词,作为摘要生成的基础,将每个单词或短语映射为一个向量,对预处理后的文本数据进行分析,计算词语的权重,在计算时,可以考虑一些特殊的权重调整规则,如对标题、关键字等进行加权处理,对常用词语进行惩罚。
[0024]进一步的,所述重点句子提取根据关键词和句子的位置信息,提取文章中的重点句子。
[0025]进一步的,所述句子重要性评估针对每个句子进行重要性评估,可以使用一些机
器学习算法或者深度学习模型,如文本分类模型、序列模型,以确定每个句子的重要性得分。
[0026]进一步的,所述句子排序按照句子的重要性得分进行排序,将得分高的句子放在前面,根据计算出的词语权重,生成文本摘要,采用多种方法生成文本摘要,如按权重排序选择关键句、按句子位置选择关键句。
[0027]进一步的,所述摘要生成根据排序后的句子,按照一定的长度或者字数,选取前几个句子组成文本摘要,将摘要生成算法生成的结果转换为一段简短的文本,并输出为最终的文本摘要。
[0028]进一步的,所述摘要评估通过计算生成的摘要与原文的相似度指标,评估摘要的质量。
[0029]进一步的,所述输出结果将生成的摘要输出给用户或者存储到电子设备中。
[0030]进一步的,所述文本输入模块用于输入待摘要的文本,可以是手动输入或导入外部文本文件。
[0031]进一步的,所述分句模块对输入的文本进行分句处理,以句子为单位进行后续处理。
[0032]进一步的,所述分词模块对每个句子进行分词处理,将每个句子分成若干个词汇,用于后续的文本处理。
[0033]进一步的,所述关键句提取模块对分好的句子进行关键句提取,选择最能表达文章主旨的关键句。
[0034]进一步的,所述关键词提取模块对分好的词汇进行关键词提取,选择最能表达文章主旨的关键词。
[0035]进一步的,所述句子排序模块将提取出的关键句按照文章的逻辑顺序进行排序。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.文本摘要生成方法、装置、电子设备及可读存储介质,包括:电子设备、应用程序和可读存储介质,其特征在于:所述应用程序包括文本输入模块、分句模块、分词模块、关键句提取模块、关键词提取模块、句子排序模块、摘要生成模块和摘要展示模块,所述文本摘要生成方法包括:文本预处理,关键词提取,重点句子提取,句子重要性评估,句子排序,摘要生成,摘要评估和输出结果。2.根据权利要求1所述的文本摘要生成方法、装置、电子设备及可读存储介质,其特征在于:所述文本预处理对输入文本进行分句、分词、去除停用词进行预处理操作,以便于后续处理。3.根据权利要求1所述的文本摘要生成方法、装置、电子设备及可读存储介质,其特征在于:所述关键词提取使用TF

IDF算法提取文本中的关键词,作为摘要生成的基础。4.根据权利要求1所述的文本摘要生成方法、装置、电子设备及可读存储介质,其特征在于:所述重点句子提取根据关键词和句子的位置信息,提取文章中的重点句子...

【专利技术属性】
技术研发人员:符甜
申请(专利权)人:深圳火星语盟科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1