语句扩展方法、装置以及计算机可读存储介质制造方法及图纸

技术编号：33083175 阅读：23 留言：0更新日期：2022-04-15 10:40

本申请实施例公开了语句扩展方法、装置以及计算机可读存储介质，适用于人工智能，方法包括：获取目标语句，将该目标语句输入语义编码器，通过语义编码器输出目标语句的语义内容表示。获取语法结构互不相同的多个引导语句，多个引导语句中各个引导语句的语法结构均与目标语句的语法结构不同。将多个引导语句输入语法编码器，通过语法编码器输出各个引导语句的语法表示。将目标语句的语义内容表示与各个引导语句的语法表示输入解码器，通过解码器获取目标语句的多个语法结构互不相同的泛化语句，这里，多个泛化语句与目标语句具有相同的语义内容，且与目标语句的语法结构不同。采用本申请，可以提高语句扩展效率，扩展结果客观性强，适用性强。适用性强。适用性强。

全部详细技术资料下载

【技术实现步骤摘要】
语句扩展方法、装置以及计算机可读存储介质

[0001]本申请涉及人工智能
，尤其涉及一种语句扩展方法、装置以及计算机可读存储介质。

技术介绍

[0002]随着人工智能(Artificial Intelligence，AI)技术的发展，各类人机对话技术或产品(比如语音助手)极大地丰富了人们的日常生活。在各类人机对话产品开发过程中，通过语料样本库搭建各类人机对话产品中部署的人机对话模型之后，各类人机对话产品可以通过部署的人机对话模型实现人机对话，包括对用户提问问题的自动答复。其中，在各人机对话模型的部署过程中，语料样本库中包含了各类人机对话产品针对面向用户的需求所添加的问答语料，语料样本库中的问答语料越丰富，通过语料样本库中的问答语料训练得到人机对话模型的性能越好，人机交互的效果越佳。因此，如何丰富语料样本库的问答语料对人机对话产品的开发至关重要。
[0003]本申请的专利技术人在研究和实践过程中发现，现有技术中，语料样本库的问答语料主要是通过人工头脑风暴的方式进行补充，人工消耗量大，语料补充效率低，语料补充的主观

【技术保护点】

【技术特征摘要】
1.一种语句扩展方法，其特征在于，所述方法包括：获取目标语句，并将所述目标语句输入语义编码器，通过所述语义编码器输出所述目标语句的语义内容表示；获取语法结构互不相同的多个引导语句，所述多个引导语句中各个引导语句的语法结构均与所述目标语句的语法结构不同；将所述多个引导语句输入语法编码器，通过所述语法编码器输出所述各个引导语句的语法表示；将所述目标语句的语义内容表示与所述各个引导语句的语法表示输入解码器，通过所述解码器获取所述目标语句的多个语法结构互不相同的泛化语句，其中所述多个泛化语句与所述目标语句具有相同的语义内容，且与所述目标语句的语法结构不同。2.根据权利要求1所述的方法，其特征在于，所述将所述目标语句输入语义编码器之前，所述方法还包括：获取多个样本语句对，所述多个样本语句对中各个样本语句对中至少包括第一样本语句以及第二样本语句，所述第一样本语句与所述第二样本语句的语义内容相同、语法结构不同；基于所述各个样本语句对中的样本语句对语义编码器进行训练，以使所述语义编码器获取对输入的任一语句进行语义编码以得到所述任一语句的语义内容表示的能力。3.根据权利要求2所述的方法，其特征在于，所述基于所述多个样本语句对对语义编码器进行训练包括：将任一样本语句对中的所述第一样本语句与所述第二样本语句设置为所述任一样本语句对的第一训练样本，将所述任一样本语句对中的所述第一样本语句与所述多个样本语句对中的剩余样本语句两两配对以构成所述任一样本语句对的第二训练样本，所述剩余样本语句为所述多个样本语句对包括的样本语句中除所述任一样本语句对的所述第二样本语句之外的其他样本语句；基于所述多个样本语句对中各个样本语句对的所述第一训练样本和所述第二训练样本对语义编码器进行对比学习训练。4.根据权利要求2或3所述的方法，其特征在于，所述将所述多个引导语句输入语法编码器之前，所述方法还包括：基于所述各个样本语句对中的所述第一样本语句和所述第二样本语句引导生成所述各个样本语句对的第三样本语句，以得到多个扩展样本语句对，其中一个扩展样本语句对中至少包括一个样本语句对以及所述样本语句对的所述第三样本语句，所述扩展样本语句对中的所述第二样本语句与所述第三样本语句的语法结构相同、语义内容不同；基于所述多个扩展样本语句对中的样本语句对语法编码器进行训练，以使所述语法编码器获取对输入的任一语句进行语法编码以得到所述任一语句的语法表示的能力。5.根据权利要求4所述的方法，其特征在于，所述基于所述各个样本语句对中的所述第一样本语句和所述第二样本语句引导生成所述各个样本语句对的第三样本语句，包括：获取任一样本语句对中的所述第二样本语句的语句模板，并基于所述语句模板获取一个或多个具有相同语句模板类别的第一样本语句的语句模板；基于所述任一样本语句对中的所述第二样本语句的语句模板、所述一个或多个第一样
本...

【专利技术属性】
技术研发人员：周辉阳，闫昭，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人