生成自然语言的方法、装置、设备及可读存储介质制造方法及图纸

技术编号:21799370 阅读:26 留言:0更新日期:2019-08-07 10:34
本申请公开了生成自然语言的方法、装置、设备及可读存储介质,属于人工智能领域。方法包括:获取目标指令的内容所包括的目标词汇,以及目标指令的环境图片中的环境元素所指示的描述词汇;基于目标词汇及描述词汇,调用自然语言模型按照参考语法生成一条或多条初始自然语句,自然语言模型是根据训练数据集训练过的语言模型;获取每条初始自然语句的分值,基于每条初始自然语句的分值选择满足条件的自然语句作为目标指令的自然语言。本申请通过根据训练数据集训练过的自然语言模型来生成初始自然语句,从初始自然语句中选择满足条件的自然语句作为目标指令的自然语言,不仅效率较高,而且生成的自然语言语义明确、易于理解,用户的使用体验好。

Methods, devices, devices and readable storage media for generating natural languages

【技术实现步骤摘要】
生成自然语言的方法、装置、设备及可读存储介质
本申请涉及人工智能领域,特别涉及一种生成自然语言的方法、装置、设备及可读存储介质。
技术介绍
随着人工智能技术的发展,人工智能装置被广泛应用于生活中,自然语言的生成装置便是其中一种。该生成装置在获取需要用户理解的目标指令后,生成自然语言(即人类沟通所使用的语言)来描述该目标指令,以便用户进行理解。因此,如何生成自然语言,使得生成的自然语言的语义明确,是保证用户快速、正确地理解目标指令的关键。相关技术提供一种生成自然语言的方法,该方法首先基于目标指令的内容获取目标词汇,然后将该目标指令的实施环境中的环境元素所对应的词汇作为描述词汇,并按照不同顺序对目标词汇和所有描述词汇进行排列,形成参考数量的语句。之后,计算每个语句被用户正确理解的概率,将被用户正确理解的概率最高的语句作为描述目标指令的自然语言,从而实现自然语言的生成。然而,复杂环境中包括的环境元素较多,因而描述词汇也较多。若在复杂环境中应用相关技术,则对目标词汇和所有描述词汇进行排列后形成的语句数量较多,从而使得计算量较大,进而导致生成自然语言的效率低。另外,描述词汇的数量较多也会使得生成的自然语言的语义混乱,导致目标指令被人类误解。可以看出,用户对相关技术的使用体验差。申请内容本申请实施例提供了一种生成自然语言的方法、装置、设备及可读存储介质,以解决相关技术的问题。所述技术方案如下:一方面,提供了一种生成自然语言的方法,所述方法包括:获取目标指令的内容所包括的目标词汇,以及所述目标指令的环境图片中的环境元素所指示的描述词汇;基于所述目标词汇及所述描述词汇,调用自然语言模型按照参考语法生成一条或多条初始自然语句,所述自然语言模型是根据训练数据集训练过的语言模型,所述训练数据集包括用户描述训练指令的自然语言;获取每条初始自然语句的分值,基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言,所述分值用于指示所述初始自然语句的准确程度。可选地,所述获取每条初始自然语句的分值,包括:对于任一初始自然语句,获取所述初始自然语句的第一分值,所述第一分值用于指示所述初始自然语句与所述训练数据集的匹配程度;根据公开数据集获取所述初始自然语句的第二分值,所述第二分值用于指示所述初始自然语句与所述环境图片的匹配程度,所述公开数据集包括标注了环境元素的多张图片;将所述第一分值与所述第二分值的乘积作为所述初始自然语句的分值。可选地,所述根据公开数据集获取所述初始自然语句的第二分值,包括:对所述初始自然语句进行编码,得到编码后的自然语句信息;根据分值模型中的卷积参数对所述编码后的自然语句信息和所述环境图片中的信息进行卷积计算,得到卷积结果;根据所述分值模型中的分类参数对所述卷积结果进行计算,得到所述初始自然语句的第二分值,所述卷积参数和所述分类参数是根据所述公开数据集训练得到的参数。可选地,所述基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言,包括:从初始自然语句中选择分值最大的初始自然语句,若所述分值最大的初始自然语句的分值不低于参考阈值,则将所述分值最大的初始自然语句作为所述目标指令的自然语言。可选地,所述方法还包括:若所述分值最大的初始自然语句的分值低于所述参考阀值,重新获取分值不低于所述参考阈值的目标自然语句,将所述目标自然语句作为所述目标指令的自然语言。可选地,所述重新获取分值不低于所述参考阈值的目标自然语句,包括:调用所述自然语言模型,基于所述目标词汇和所述描述词汇,按照第一语法生成一条或多条第一自然语句,所述第一语法为除所述参考语法外的任一语法;获取所述第一自然语句的分值的平均值和所述初始自然语句的分值的平均值;若所述第一自然语句的分值的平均值大于所述初始自然语句的分值的平均值,且分值最大的第一自然语句的分值大于所述分值最大的初始自然语句,将所述分值最大的第一自然语句作为所述目标自然语句。可选地,所述获取所述第一自然语句的分值的平均值和所述初始自然语句的分值的平均值之后,还包括:若所述第一自然语句的分值的平均值不大于所述初始自然语句的分值的平均值,或者,所述分值最大的第一自然语句的分值不大于所述分值最大的初始自然语句,调用所述自然语言模型,基于所述分值最大的初始自然语句和所述描述词汇,按照所述参考语法生成一条或多条第二自然语句,所述第二自然语句中的描述词汇的数量大于所述分值最大的初始自然语句中的描述词汇的数量;获取所述第二自然语句的分值,将分值最大的第二自然语句作为所述目标自然语句。可选地,所述基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言之后,所述方法还包括:获取预测数值,所述预测数值用于指示所述环境元素更新对所述满足条件的自然语句的影响程度;若所述预测数值大于参考数值,调用所述自然语言模型生成备选自然语句,将所述备选自然语句代替所述满足条件的自然语句作为所述目标指令的自然语言。可选地,所述获取预测数值,包括:获取第一预测数值,所述第一预测数值用于指示所述环境元素更新后,所述环境图片由当前状态更新为预测状态的概率,其中,所述当前状态是指所述环境元素更新之前的状态;获取第二预测数值,所述第二预测数值用于指示观测到所述当前状态及所述环境元素更新的概率;获取第三预测数值,所述第三预测数值用于指示若所述环境图片由当前状态更新为预测状态,对所述满足条件的自然语句的影响程度;将所述第一预测数值、所述第二预测数值与所述第三预测数值的乘积作为所述预测数值。一方面,提供了一种生成自然语言的装置,所述装置包括:第一获取模块,用于获取目标指令的内容所包括的目标词汇,以及所述目标指令的环境图片中的环境元素所指示的描述词汇;生成模块,用于基于所述目标词汇及所述描述词汇,调用自然语言模型按照参考语法生成一条或多条初始自然语句,所述自然语言模型是根据训练数据集训练过的语言模型,所述训练数据集包括用户描述训练指令的自然语言;第二获取模块,用于获取每条初始自然语句的分值;选择模块,用于基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言,所述分值用于指示所述初始自然语句的准确程度。可选地,所述第二获取模块,用于对于任一初始自然语句,获取所述初始自然语句的第一分值,所述第一分值用于指示所述初始自然语句与所述训练数据集的匹配程度;根据公开数据集获取所述初始自然语句的第二分值,所述第二分值用于指示所述初始自然语句与所述环境图片的匹配程度,所述公开数据集包括标注了环境元素的多张图片;将所述第一分值与所述第二分值的乘积作为所述初始自然语句的分值。可选地,所述第二获取模块,用于对所述初始自然语句进行编码,得到编码后的自然语句信息;根据分值模型中的卷积参数对所述编码后的自然语句信息和所述环境图片中的信息进行卷积计算,得到卷积结果;根据所述分值模型中的分类参数对所述卷积结果进行计算,得到所述初始自然语句的第二分值,所述卷积参数和所述分类参数是根据所述公开数据集训练得到的参数。可选地,所述选择模块,用于从初始自然语句中选择分值最大的初始自然语句,若所述分值最大的初始自然语句的分值不低于参考阈值,则将所述分值最大的初始自然语句作为所述目标指令的自然语言。本文档来自技高网...

【技术保护点】
1.一种生成自然语言的方法,其特征在于,所述方法包括:获取目标指令的内容所包括的目标词汇,以及所述目标指令的环境图片中的环境元素所指示的描述词汇;基于所述目标词汇及所述描述词汇,调用自然语言模型按照参考语法生成一条或多条初始自然语句,所述自然语言模型是根据训练数据集训练过的语言模型,所述训练数据集包括用户描述训练指令的自然语言;获取每条初始自然语句的分值,基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言,所述分值用于指示所述初始自然语句的准确程度。

【技术特征摘要】
1.一种生成自然语言的方法,其特征在于,所述方法包括:获取目标指令的内容所包括的目标词汇,以及所述目标指令的环境图片中的环境元素所指示的描述词汇;基于所述目标词汇及所述描述词汇,调用自然语言模型按照参考语法生成一条或多条初始自然语句,所述自然语言模型是根据训练数据集训练过的语言模型,所述训练数据集包括用户描述训练指令的自然语言;获取每条初始自然语句的分值,基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言,所述分值用于指示所述初始自然语句的准确程度。2.根据权利要求1所述的方法,其特征在于,所述获取每条初始自然语句的分值,包括:对于任一初始自然语句,获取所述初始自然语句的第一分值,所述第一分值用于指示所述初始自然语句与所述训练数据集的匹配程度;根据公开数据集获取所述初始自然语句的第二分值,所述第二分值用于指示所述初始自然语句与所述环境图片的匹配程度,所述公开数据集包括标注了环境元素的多张图片;将所述第一分值与所述第二分值的乘积作为所述初始自然语句的分值。3.根据权利要求2所述的方法,其特征在于,所述根据公开数据集获取所述初始自然语句的第二分值,包括:对所述初始自然语句进行编码,得到编码后的自然语句信息;根据分值模型中的卷积参数对所述编码后的自然语句信息和所述环境图片中的信息进行卷积计算,得到卷积结果;根据所述分值模型中的分类参数对所述卷积结果进行计算,得到所述初始自然语句的第二分值,所述卷积参数和所述分类参数是根据所述公开数据集训练得到的参数。4.根据权利要求1-3任一所述的方法,其特征在于,所述基于每条初始自然语句的分值选择满足条件的自然语句作为所述目标指令的自然语言,包括:从初始自然语句中选择分值最大的初始自然语句,若所述分值最大的初始自然语句的分值不低于参考阈值,则将所述分值最大的初始自然语句作为所述目标指令的自然语言。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述分值最大的初始自然语句的分值低于所述参考阀值,重新获取分值不低于所述参考阈值的目标自然语句,将所述目标自然语句作为所述目标指令的自然语言。6.根据权利要求5所述的方法,其特征在于,所述重新获取分值不低于所述参考阈值的目标自然语句,包括:调用所述自然语言模型,基于所述目标词汇和所述描述词汇,按照第一语法生成一条或多条第一自然语句,所述第一语法为除所述参考语法外的任一语法;获取所述第一自然语句的分值的平均值和所述初始自然语句的分值的平均值;若所述第一自然语句的分值的平均值大于所述初始自然语句的分值的平均值,且分值最大的第一自然语句的分值大于所述分值最大的初始自然语句,将所述分值最大的第一自然语句作为所述目标自然语句。7.根据权利要求6所述...

【专利技术属性】
技术研发人员:付圣任冬淳丁曙光钱德恒王志超朱炎亮
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1