【技术实现步骤摘要】
【国外来华专利技术】自动生成多样化文本
技术介绍
[0001]本实施例涉及人工智能平台和优化方法,以自动生成与所接收的输入段落和输入答案相对应的多样化文本。更具体地,本实施例旨在相对于质量(特别是多样性和准确性)来评估所生成的文本,以选择性地调整强化学习算法的一个或多个参数,以支持所生成的文本的多样性和质量特性。
技术实现思路
[0002]实施例包括用于强化学习的计算机系统、计算机程序产品和方法。
[0003]在一个方面,提供了具有处理器和存储器的计算机系统,用于与人工智能(AI)平台和相应的AI工具一起使用。处理器可操作地耦合到存储器,并且与AI平台通信。AI平台工具包括问题管理器、答案管理器、评估管理器和指导器。问题管理器用于利用问题生成器来生成与基础事实段落(ground truth passage)和基础事实答案相对应的第一合成问题。答案管理器用于将合成问题呈现给训练的神经网络,并从基础事实段落获得第一答案。第一答案在语义上与第一合成问题和基础事实段落相关。评估管理器用于针对第一答案自动地评估第一合成问题,其中评估结合了采集第一合成问题的 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种计算机系统,包括:处理器,其操作地耦合到存储器;人工智能(AI)平台,与所述处理器通信,以支持强化学习,所述AI平台具有工具,所述工具包括:问题管理器,用于向经训练的神经网络输入基础事实第一段落和基础事实第一答案,并且获得由所述经训练的神经网络中的问题生成器生成的第一合成问题,所生成的第一合成问题具有与所述基础事实第一段落和第一答案的语义对应;答案管理器,用于将所述第一合成问题输入到所述经训练的神经网络,并且从所述基础事实段落获得由所述经训练的神经网络生成的第一答案,所述第一答案与所生成的第一合成问题和所述基础事实段落语义相关;评估管理器,用于针对所生成的第一答案自动地评估所生成的第一合成问题,所述评估结合了采集所生成的第一合成问题的多样性和准确性的奖励函数;以及指导器,其可操作地耦合到所述评估管理器,以采用强化学习来响应于所述评估选择性地修改所述问题生成器,其中,经修改的问题生成器产生具有比所述修改之前增加的文本多样性的一个或多个合成问题。2.根据权利要求1所述的系统,其中,所述问题生成器的所述选择性修改采用核采样来生成与所述第一合成问题不同的所述一个或多个合成问题。3.根据权利要求2所述的系统,其中,对所生成的第一合成问题的变型的优化包括所述指导器采用多样性得分表示所生成的第一合成问题并且基于所述多样性得分修改所述经训练的神经网络的一个或多个参数,并且其中,所述优化减轻作为来自所述经训练的神经网络的输出的具有与所述第一问题类似的上下文的第二合成问题的产生。4.根据权利要求3所述的系统,还包括所述评估管理器,所述评估管理器用于通过比较所生成的第一答案与所述基础事实答案来评估所述生成的第一合成问题的准确度并且用于采用准确度得分来量化所述准确度评估,并且所述问题管理器用于响应于所述准确度得分来选择性地修改一个或多个问题生成参数。5.根据权利要求4所述的系统,还包括所述评估管理器将所述奖励函数计算为所述准确度得分和所述多样性得分的凸组合,所述问题管理器响应于所计算的奖励函数来选择性地修改一个或多个问题生成参数,所述修改减轻与所生成的第一合成问题语义类似的第二合成问题的产生。6.根据权利要求5所述的系统,还包括所述评估管理器调整所述凸组合以选择性地对所述奖励函数的一个或多个组分确定优先级。7.一种计算机程序产品,其支持强化学习,所述计算机程序产品包括具有与其一起体现的程序代码的计算机可读存储介质,所述程序代码可由处理器执行以:向经训练的神经网络输入基础事实第一段落和基础事实第一答案,并且获得由所述经训练的神经网络中的问题生成器生成的第一合成问题,所生成的第一合成问题具有与所述基础事实第一段落和第一答案的语义对应;将所述第一合成问题输入到所述经训练的神经网络,并且从所述基础事实段落获得由所述经训练的神经网络生成的第一答案,所述第一答案与所生成的第一合成问题和所述基础事实段落语义相关;
针对所生成的第一答案自动地评估所生成的第一合成问题,所述评估结合了采集所生成的第一合成问题的多样性和准确性的奖励函数;以及采用强化学习来响应于所述评估选择性地修改所述问题生成器,其中,经修改的问题生成器产生具有比所述修改之前增加的文本多样性的一个或多个合成问题。8.根据权利要求7所述的计算机程序产品,其中,所述问题生成器的所述选择性修改包括所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。