【技术实现步骤摘要】
一种强化学习文本摘要生成方法及系统
[0001]本专利技术涉及模型训练领域,具体提供一种强化学习文本摘要生成方法及系统。
技术介绍
[0002]文本摘要的主要任务就是给定一段文本,用简短的话术把这段文本的核心思想表达出来。
[0003]本文摘要生成的方法有抽取式和生成式,抽取式就是从文本中抽取出来部门文本进行摘要的生成,生成式就是通过生成模型进行摘要的生成。如果利用有监督深度学习方法解决文本摘要问题,需要大量的有标签的数据,这种数据需要大量的人力和物力。
技术实现思路
[0004]本专利技术是针对上述现有技术的不足,提供一种实用性强的强化学习文本摘要生成方法。
[0005]本专利技术进一步的技术任务是提供一种设计合理,安全适用的强化学习文本摘要生成系统。
[0006]本专利技术解决其技术问题所采用的技术方案是:
[0007]一种强化学习文本摘要生成方法,具有如下步骤:
[0008]S1、输入一个文本,对于Actor网络,使用的Bert模型,模型每一个step为输入当前状 ...
【技术保护点】
【技术特征摘要】
1.一种强化学习文本摘要生成方法,其特征在于,具有如下步骤:S1、输入一个文本,对于Actor网络,使用的Bert模型,模型每一个step为输入当前状态S,然后预测当前状态下生成的单词W;S2、重复步骤S1中所描述的step;S3、利用语义模型预测语义相似性;S4、利用语言模型预测语言流畅度;S5、利用策略梯度的优化方式进行Bert策略模型的优化。2.根据权利要求1所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S2中,重复步骤S1中所描述的step,预测结果为eos也就是结束标志,说明当前摘要生成完毕。3.根据权利要求2所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S3中,利用语义模型预测语义相似性,相似性越高,分数越大,标记为R1。4.根据权利要求3所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S4中,语言模型预测语言流畅度,也就是PPL困惑度,困惑度越小,分数越高,标记为R2。5.根据权利要求4所述的一种强化学习文本摘要生成方法,其特征在于,在步骤S5中,利用策略梯度的优化方式进行Bert策略模型的优化,优化收...
【专利技术属性】
技术研发人员:冯落落,李沛,李晓瑜,
申请(专利权)人:山东新一代信息产业技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。