语句改写方法、装置、电子设备以及计算机存储介质制造方法及图纸

技术编号:25803414 阅读:30 留言:0更新日期:2020-09-29 18:37
本申请提供了一种语句改写方法、装置、电子设备以及计算机存储介质,涉及计算机技术领域。该方法包括:确定待处理语句的句向量;获取位于预置采样范围内的扰动向量;基于扰动向量对句向量进行调整,得到改写语句向量;基于改写语句向量,生成改写语句。本申请可以实现待处理语句的改写,且保证待处理语句的语义不变。

【技术实现步骤摘要】
语句改写方法、装置、电子设备以及计算机存储介质
本申请涉及计算机
,具体而言,本申请涉及一种语句改写方法、装置、电子设备以及计算机存储介质。
技术介绍
随着互联网技术的发展,用户对于语句表达的多样性需求不断提高,某一语句应用于不同的场景时,常常需要进行语句改写以改变语句的语言表达方式使其适用于对应场景。目前,一种语句改写方案是通过查找语句的相似语句从而改变语句的语言表达,但是,这种方式所确定的相似语句可能会改变原始语句的语义,另一种语句改写方案是通过将语句拆分为多个词语,通过相似词语的替换来改变语句的语言表达,但是这种方式只能针对词语进行操作,语句结构并没有发生变化,从而导致语句整体的变化有限。
技术实现思路
本申请提供了一种语句改写方法、装置、电子设备以及计算机存储介质,可以解决现有技术中存在的问题。本申请实施例提供的技术方案如下:本申请的第一方面提供了一种语句改写方法,包括:确定待处理语句的句向量;获取位于预置采样范围内的扰动向量;基于扰动向量对句向量进行调整,得到改写语句向量;基于改写语句向量,生成改写语句。可选的,确定待处理语句的句向量,包括:通过语句改写模型中的编码器,确定待处理语句的句向量;基于改写语句向量,生成改写语句,包括:通过语句改写模型中的解码器,基于改写语句向量,生成改写语句。可选的,确定待处理语句的句向量之前,该方法还包括:获取多个样本语句;将各样本语句输入至初始编码器,得到各样本语句的句向量;基于特定协方差获取高斯噪声向量,并基于高斯噪声向量调整样本语句的句向量,得到各样本语句的改写语句向量;将各样本语句的改写语句向量输入至初始解码器,得到各样本语句分别对应的改写语句;基于各样本语句的语义以及各样本语句对应的改写语句的语义,调整初始编码器和/或初始解码器中的参数,当基于参数调整后的初始编码器和初始解码器构建的模型生成的改写语句的语义、与相应的样本语句的语义之间的误差满足预置精确度条件时,将模型作为语句改写模型。可选的,基于特定的协方差获取高斯噪声向量包括:确定特定的协方差对应的高斯噪声的高斯分布序列;基于高斯分布序列,采样得到高斯噪声向量。可选的,基于改写语句向量,生成改写语句之后,该方法还包括:基于改写语句的语义以及待处理语句的语义,调整预置采样范围。可选的,扰动向量包括分别位于至少两个预置采样范围内的至少两个扰动向量,则至少两个扰动向量分别对应至少两个改写语句向量;基于改写语句向量,生成改写语句之后,该方法还包括:从至少两个改写语句向量分别对应的至少两个改写语句中,确定与待处理语句语义最接近的目标改写语句。本申请的第二方面提供了一种语句改写装置,包括:第一确定模块,用于确定待处理语句的句向量;第一获取模块,用于获取位于预置采样范围内的扰动向量;第二确定模块,用于基于扰动向量对句向量进行调整,得到改写语句向量;生成模块,用于基于改写语句向量,生成改写语句。可选的,第一确定模块,具体用于:通过语句改写模型中的编码器,确定待处理语句的句向量;生成模块,具体用于包括:通过语句改写模型中的解码器,基于改写语句向量,生成改写语句。可选的,该装置还包括第二获取模块、第三确定模块、第四确定欧快、第五确定模块以及第一调整模块;第一确定模块在确定待处理语句的句向量之前;第二获取模块,用于获取多个样本语句;第三确定模块,用于将各样本语句输入至初始编码器,得到各样本语句的句向量;第四确定模块,用于基于特定协方差获取高斯噪声向量,并基于高斯噪声向量调整样本语句的句向量,得到各样本语句的改写语句向量;第五确定模块,用于将各样本语句的改写语句向量输入至初始解码器,得到各样本语句分别对应的改写语句;第一调整模块,用于基于各样本语句的语义以及各样本语句对应的改写语句的语义,调整初始编码器和/或初始解码器中的参数,当基于参数调整后的初始编码器和初始解码器构建的模型生成的改写语句的语义、与相应的样本语句的语义之间的误差满足预置精确度条件时,将模型作为语句改写模型。可选的,第四确定模块在基于特定的协方差获取高斯噪声向量时,具体用于:确定特定的协方差对应的高斯噪声的高斯分布序列;基于高斯分布序列,采样得到高斯噪声向量。可选的,该装置还包括第二调整模块;生成模块在基于改写语句向量,生成改写语句之后;第二调整模块,用于基于改写语句的语义以及待处理语句的语义,调整预置采样范围。可选的,扰动向量包括分别位于至少两个预置采样范围内的至少两个扰动向量,则至少两个扰动向量分别对应至少两个改写语句向量;该装置还包括第六确定模块;生成模块基于改写语句向量,生成改写语句之后;第六确定模块,用于从至少两个改写语句向量分别对应的至少两个改写语句中,确定与待处理语句语义最接近的目标改写语句。本申请提供的技术方案带来的有益效果是:可以确定待处理语句的句向量,并获取位于预置采样范围内的扰动向量,可以基于扰动向量对句向量进行调整得到改写语句向量,这样可以使得句向量在以该句向量为中心的预置采样范围内移动,而以该句向量为中心的预置采样范围对应的向量空间中、各向量的语义与该句向量的语义是相类似的,这样句向量在预置采样范围内移动得到的改写语句向量对应语句的语义与句向量对应语句的语义类似,从而改写语句向量生成的改写语句与待处理语句的语义相类似,不会改变待处理语句的语义。同时本申请通过调整句向量得到改写语句向量后再重新生成改写语句,可以改变待处理语句的语句结构,而不是单纯的对待处理语句的词语进行操作,对语句整体有较大的改变。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。图1为本申请语句改写方法的一个实施例示意图;图2为本申请语句改写模型预测阶段的实施例示意图;图3为本申请训练得到预置采样范围的实施例示意图;图4为本申请语句改写模型模型训练阶段的实施例示意图;图5为本申请语句改写装置的结构示意图;图6为本申请电子设备的结构示意图。具体实施方式下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整本文档来自技高网
...

【技术保护点】
1.一种语句改写方法,其特征在于,包括:/n确定待处理语句的句向量;/n获取位于预置采样范围内的扰动向量;/n基于所述扰动向量对所述句向量进行调整,得到改写语句向量;/n基于所述改写语句向量,生成改写语句。/n

【技术特征摘要】
1.一种语句改写方法,其特征在于,包括:
确定待处理语句的句向量;
获取位于预置采样范围内的扰动向量;
基于所述扰动向量对所述句向量进行调整,得到改写语句向量;
基于所述改写语句向量,生成改写语句。


2.根据权利要求1所述的方法,其特征在于,所述确定待处理语句的句向量,包括:
通过语句改写模型中的编码器,确定所述待处理语句的句向量;
所述基于所述改写语句向量,生成改写语句,包括:
通过所述语句改写模型中的解码器,基于所述改写语句向量,生成改写语句。


3.根据权利要求2所述的方法,其特征在于,所述确定待处理语句的句向量之前,所述方法还包括:
获取多个样本语句;
将各样本语句输入至初始编码器,得到所述各样本语句的句向量;
基于特定协方差获取高斯噪声向量,并基于所述高斯噪声向量调整所述样本语句的句向量,得到各样本语句的改写语句向量;
将各样本语句的改写语句向量输入至初始解码器,得到所述各样本语句分别对应的改写语句;
基于各样本语句的语义以及各样本语句对应的改写语句的语义,调整所述初始编码器和/或所述初始解码器中的参数,当基于参数调整后的初始编码器和初始解码器构建的模型生成的改写语句的语义、与相应的样本语句的语义之间的误差满足预置精确度条件时,将所述模型作为所述语句改写模型。


4.根据权利要求3所述的方法,其特征在于,所述基于特定的协方差获取高斯噪声向量包括:
确定所述特定的协方差对应的高斯噪声的高斯分布序列;
基于所述高斯分布序列,采样得到所述高斯噪声向量。


5.根据权利要求1或...

【专利技术属性】
技术研发人员:杨震李彦亓超马宇驰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1