语句改写方法、装置、电子设备以及计算机存储介质制造方法及图纸

技术编号：25803414 阅读：30 留言：0更新日期：2020-09-29 18:37

本申请提供了一种语句改写方法、装置、电子设备以及计算机存储介质，涉及计算机技术领域。该方法包括：确定待处理语句的句向量；获取位于预置采样范围内的扰动向量；基于扰动向量对句向量进行调整，得到改写语句向量；基于改写语句向量，生成改写语句。本申请可以实现待处理语句的改写，且保证待处理语句的语义不变。

全部详细技术资料下载

【技术实现步骤摘要】
语句改写方法、装置、电子设备以及计算机存储介质
本申请涉及计算机
，具体而言，本申请涉及一种语句改写方法、装置、电子设备以及计算机存储介质。
技术介绍
随着互联网技术的发展，用户对于语句表达的多样性需求不断提高，某一语句应用于不同的场景时，常常需要进行语句改写以改变语句的语言表达方式使其适用于对应场景。目前，一种语句改写方案是通过查找语句的相似语句从而改变语句的语言表达，但是，这种方式所确定的相似语句可能会改变原始语句的语义，另一种语句改写方案是通过将语句拆分为多个词语，通过相似词语的替换来改变语句的语言表达，但是这种方式只能针对词语进行操作，语句结构并没有发生变化，从而导致语句整体的变化有限。
技术实现思路
本申请提供了一种语句改写方法、装置、电子设备以及计算机存储介质，可以解决现有技术中存在的问题。本申请实施例提供的技术方案如下：本申请的第一方面提供了一种语句改写方法，包括：确定待处理语句的句向量；获取位于预置采样范围内的扰动向量；基于扰动向量对句向量进行调整，得到改写语句向量；基于改写语句向量，生成改写语句。可选的，确定待处理语句的句向量，包括：通过语句改写模型中的编码器，确定待处理语句的句向量；基于改写语句向量，生成改写语句，包括：通过语句改写模型中的解码器，基于改写语句向量，生成改写语句。可选的，确定待处理语句的句向量之前，该方法还包括：获取多个样本语句；将各样本语句输入至初始编...

【技术保护点】
1.一种语句改写方法，其特征在于，包括：/n确定待处理语句的句向量；/n获取位于预置采样范围内的扰动向量；/n基于所述扰动向量对所述句向量进行调整，得到改写语句向量；/n基于所述改写语句向量，生成改写语句。/n

【技术特征摘要】
1.一种语句改写方法，其特征在于，包括：
确定待处理语句的句向量；
获取位于预置采样范围内的扰动向量；
基于所述扰动向量对所述句向量进行调整，得到改写语句向量；
基于所述改写语句向量，生成改写语句。

2.根据权利要求1所述的方法，其特征在于，所述确定待处理语句的句向量，包括：
通过语句改写模型中的编码器，确定所述待处理语句的句向量；
所述基于所述改写语句向量，生成改写语句，包括：
通过所述语句改写模型中的解码器，基于所述改写语句向量，生成改写语句。

3.根据权利要求2所述的方法，其特征在于，所述确定待处理语句的句向量之前，所述方法还包括：
获取多个样本语句；
将各样本语句输入至初始编码器，得到所述各样本语句的句向量；
基于特定协方差获取高斯噪声向量，并基于所述高斯噪声向量调整所述样本语句的句向量，得到各样本语句的改写语句向量；
将各样本语句的改写语句向量输入至初始解码器，得到所述各样本语句分别对应的改写语句；
基于各样本语句的语义以及各样本语句对应的改写语句的语义，调整所述初始编码器和/或所述初始解码器中的参数，当基于参数调整后的初始编码器和初始解码器构建的模型生成的改写语句的语义、与相应的样本语句的语义之间的误差满足预置精确度条件时，将所述模型作为所述语句改写模型。

4.根据权利要求3所述的方法，其特征在于，所述基于特定的协方差获取高斯噪声向量包括：
确定所述特定的协方差对应的高斯噪声的高斯分布序列；
基于所述高斯分布序列，采样得到所述高斯噪声向量。

5.根据权利要求1或...

【专利技术属性】
技术研发人员：杨震，李彦，亓超，马宇驰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人