一种强化学习文本摘要生成方法及系统技术方案

技术编号:37407553 阅读:33 留言:0更新日期:2023-04-30 09:33
本发明专利技术涉及模型训练领域,具体提供了一种强化学习文本摘要生成方法,具有如下步骤:S1、输入一个文本,对于Actor网络,使用的Bert模型,模型每一个step为输入当前状态S,然后预测当前状态下生成的单词W;S2、重复步骤S1中所描述的step;S3、利用语义模型预测语义相似性;S4、利用语言模型预测语言流畅度;S5、利用策略梯度的优化方式进行Bert策略模型的优化。与现有技术相比,本发明专利技术可以利用强化学习的奖励函数的方式对模型生成摘要的好坏进行评价,具有良好的推广价值。良好的推广价值。良好的推广价值。

【技术实现步骤摘要】
一种强化学习文本摘要生成方法及系统


[0001]本专利技术涉及模型训练领域,具体提供一种强化学习文本摘要生成方法及系统。

技术介绍

[0002]文本摘要的主要任务就是给定一段文本,用简短的话术把这段文本的核心思想表达出来。
[0003]本文摘要生成的方法有抽取式和生成式,抽取式就是从文本中抽取出来部门文本进行摘要的生成,生成式就是通过生成模型进行摘要的生成。如果利用有监督深度学习方法解决文本摘要问题,需要大量的有标签的数据,这种数据需要大量的人力和物力。

技术实现思路

[0004]本专利技术是针对上述现有技术的不足,提供一种实用性强的强化学习文本摘要生成方法。
[0005]本专利技术进一步的技术任务是提供一种设计合理,安全适用的强化学习文本摘要生成系统。
[0006]本专利技术解决其技术问题所采用的技术方案是:
[0007]一种强化学习文本摘要生成方法,具有如下步骤:
[0008]S1、输入一个文本,对于Actor网络,使用的Bert模型,模型每一个step为输入当前状态S,然后预测当前状本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种强化学习文本摘要生成方法,其特征在于,具有如下步骤:S1、输入一个文本,对于Actor网络,使用的Bert模型,模型每一个step为输入当前状态S,然后预测当前状态下生成的单词W;S2、重复步骤S1中所描述的step;S3、利用语义模型预测语义相似性;S4、利用语言模型预测语言流畅度;S5、利用策略梯度的优化方式进行Bert策略模型的优化。2.根据权利要求1所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S2中,重复步骤S1中所描述的step,预测结果为eos也就是结束标志,说明当前摘要生成完毕。3.根据权利要求2所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S3中,利用语义模型预测语义相似性,相似性越高,分数越大,标记为R1。4.根据权利要求3所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S4中,语言模型预测语言流畅度,也就是PPL困惑度,困惑度越小,分数越高,标记为R2。5.根据权利要求4所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S5中,利用策略梯度的优化方式进行Bert策略模型的优化,优化收...

【专利技术属性】
技术研发人员:冯落落李沛李晓瑜
申请(专利权)人:山东新一代信息产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1