一种新闻自动文摘生成方法及装置制造方法及图纸

技术编号：34719527 阅读：12 留言：0更新日期：2022-08-31 18:04

本发明专利技术公开了一种新闻自动文摘生成方法及装置。其中，该方法包括：获取原始新闻数据；根据所述原始新闻数据，生成段落标签和关联标签；通过所述段落标签和所述关联标签，将所述原始新闻数据进行拆分，得到新闻数据特征向量；将所述新闻数据特征向量输入至文摘生成模型中，得到新闻文摘数据。本发明专利技术解决了现有技术中的新闻文摘生成方法，无法根据新闻内容的数据量来进行智能化的拆分和分层递进生成，因此在新闻文摘生成的时候，由于是大量的数据整合生成，会导致数据生成效率低下、数据生成不精准的技术问题。精准的技术问题。精准的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种新闻自动文摘生成方法及装置

[0001]本专利技术涉及智能化文本处理领域，具体而言，涉及一种新闻自动文摘生成方法及装置。

技术介绍

[0002]随着智能化科技的不断发展，人们的生活、工作、学习之中越来越多地用到了智能化设备，使用智能化科技手段，提高了人们生活的质量，增加了人们学习和工作的效率。
[0003]目前，针对新闻自动文摘的生成，通常采用针对新闻数据进行采集，并根据整段的新闻数据来进行关键词搜索，或者根据预设的词组集合来进行遍历查询操作，从而得到新闻文摘的输入信息，通过神经网络模型或者通过预设的规则矩阵来对新闻文摘进行逐步构成和逐步完善，最终得到成熟可用的新闻文摘。但是现有技术中的新闻文摘生成方法，无法根据新闻内容的数据量来进行智能化的拆分和分层递进生成，因此在新闻文摘生成的时候，由于是大量的数据整合生成，会导致数据生成效率低下、数据生成不精准等技术问题。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种新闻自动文摘生成方法及装置，以至少解决现有技术中的新闻文摘生成方法，无法根据新闻内容的数据量来进行智能化的拆分和分层递进生成，因此在新闻文摘生成的时候，由于是大量的数据整合生成，会导致数据生成效率低下、数据生成不精准的技术问题。
[0006]根据本专利技术实施例的一个方面，提供了一种新闻自动文摘生成方法，包括：获取原始新闻数据；根据所述原始新闻数据，生成段落标签和关联标签；通过所述段落标签和所述关联标签，将...

【技术保护点】

【技术特征摘要】
1.一种新闻自动文摘生成方法，其特征在于，包括：获取原始新闻数据；根据所述原始新闻数据，生成段落标签和关联标签；通过所述段落标签和所述关联标签，将所述原始新闻数据进行拆分，得到新闻数据特征向量；将所述新闻数据特征向量输入至文摘生成模型中，得到新闻文摘数据。2.根据权利要求1所述的方法，其特征在于，所述根据所述原始新闻数据，生成段落标签和关联标签包括：将所述原始新闻数据通过标识模型进行识别，得到识别结果，其中，所述识别结果包括：结构识别结果、语义识别结果；根据所述识别结果，生成所述段落标签和所述关联标签。3.根据权利要求1所述的方法，其特征在于，所述通过所述段落标签和所述关联标签，将所述原始新闻数据进行拆分，得到新闻数据特征向量包括：通过所述段落标签将所述原始新闻数据进行分区，得到第一新闻数据特征；通过所述关联标签和拉格朗日算子对所述原始新闻数据进行拉格朗日参数混差计算，得到用于表征关联性的第二新闻数据特征；将所述第一新闻数据特征和所述第二新闻数据特征进行融合汇总，得到所述新闻数据特征向量。4.根据权利要求1所述的方法，其特征在于，在所述将所述新闻数据特征向量输入至文摘生成模型中，得到新闻文摘数据之前，所述方法还包括：根据历史新闻数据和历史新闻文摘数据训练所述文摘生成模型。5.一种新闻自动文摘生成装置，其特征在于，包括：获取模块，用于获取原始新闻数据；生成模块，用于根据所述原始新闻数据，生成段落标签和关联标签；拆分模块，用于通过所述段落...

【专利技术属性】
技术研发人员：高强，
申请(专利权)人：北京鼎泰智源科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人