【技术实现步骤摘要】
语句生成方法、装置以及计算机可读存储介质
[0001]本申请涉及人工智能
,尤其涉及一种语句生成方法、装置以及计算机可读存储介质。
技术介绍
[0002]随着人工智能(Artificial Intelligence,AI)技术的发展以及各类人机对话产品(比如对话机器人)的出现极大地丰富了人们的日常生活。本申请的专利技术人在研究和实践过程中发现,现有技术中,在各类人机对话产品的使用过程中,人机对话的上下文内容关联性弱,人机对话的上下文内容逻辑性差,上下文内容的回复中通常存在重复或者矛盾的内容。
[0003]举例来说,在现有技术中,在各类人机对话产品的使用过程中,常有前文人机对话内容中出现了“今天天气十分晴朗”的回复,而在当前人机对话内容中针对类似问题的回复是“今日有雨,不适合外出”,人机对话的前后内容互相矛盾,人机对话的用户体验效果差,适用性低。
技术实现思路
[0004]本申请实施例提供一种语句生成方法、装置以及计算机可读存储介质,可以提高目标问答语句的目标响应语句的生成准确性,提高目标响应语句 ...
【技术保护点】
【技术特征摘要】
1.一种语句生成方法,其特征在于,所述方法包括:当获取到目标问答语句时,获取所述目标问答语句的历史语句,其中,所述历史语句为在获取到所述目标问答语句之前获取和/或生成的多个问答语句;将所述目标问答语句和所述历史语句输入对话模型,并获取所述对话模型输出的所述目标问答语句的多个候选响应语句;将所述多个候选响应语句输入语句连贯性分类模型,基于所述语句连贯性分类模型获取各个候选响应语句与所述历史语句的连贯性分值;基于所述各个候选响应语句的连贯性分值从所述多个候选响应语句中确定出所述目标问答语句的目标响应语句。2.根据权利要求1所述的方法,其特征在于,所述将所述目标问答语句和所述历史语句输入对话模型之前,所述方法还包括:获取多个样本问答语句以及各个样本问答语句的历史语句;确定基线对话模型,所述基线对话模型具有基于输入的任一语句以及所述任一语句的历史语句输出所述任一语句的响应语句的能力;确定集束搜索算法的搜索空间大小,并基于所述多个样本问答语句、所述各样本问答语句的历史语句以及所述基线对话模型,采用具有所述搜索空间大小的目标集束搜索算法训练得到所述对话模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述多个样本问答语句、所述各样本问答语句的历史语句以及所述基线对话模型,采用具有所述搜索空间大小的目标集束搜索算法训练得到所述对话模型,包括:基于所述基线对话模型确定初始对话模型,所述初始对话模型与所述基线对话模型具有相同的网络结构和网络参数;将所述各样本问答语句及其历史语句输入所述初始对话模型,基于所述初始对话模型采用所述目标集束搜索算法进行集束搜索,以得到所述各样本问答语句的响应语句,其中任一样本问答语句的响应语句的数量与所述搜索空间大小相同;将所述各样本问答语句的响应语句输入所述语句连贯性分类模型,基于所述语句连贯性分类模型获取所述各样本问答语句的响应语句的连贯性分值;基于所述各样本问答语句的响应语句及其连贯性分值,和/或所述基线对话模型对所述初始对话模型进行强化学习训练以得到强化后的所述对话模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述各样本问答语句的响应语句及其连贯性分值对所述初始对话模型进行强化学习训练以得到强化后的所述对话模型,包括:将所述各样本问答语句的响应语句的连贯性分值作为强化学习的奖励参量,通过所述初始对话模型基于所述奖励参量以及所述各样本问答语句的响应语句进行强化学习以调整所述对话模型的网络参数,以得到强化后的所述对话模型。5.根据权利要求3所述的方法,其特征在于,所述基于所述各样本问答语句的响应语句及其所述连贯性分值,和所述基线对话模型对所述对话模型进行强化学习训练以得到强化后的所述对话模型,包括:将所述各样本问答语句及其历史语句输入所述基线对话模型,获取所述基线对话模型
输出的所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。