【技术实现步骤摘要】
训练语句复述模型的方法、语句复述方法及其装置
本申请涉及人工智能领域,并且更具体地,涉及训练语句复述模型的方法、语句复述方法及其装置。
技术介绍
人工智能(artificialintelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。随着人工智能技术的不断发展,让人机之间能够通过自然语言进行交互的自然语言人机交互系统变的越来越重要。人机之间能够通过自然语言进行交互,就需要系统能够识别出人类自然语言的具体含义。通常,系统通过采用对自然语言的句子进行关键信息提取来识别句子的具体含义。复述(paraphrase)是指对于语句进行相同语义的不同表达,复述在自然语言中非常普遍,在自然语言处理(natural ...
【技术保护点】
1.一种训练语句复述模型的方法,其特征在于,包括:/n获取训练数据,所述训练数据包括多个语句,所述多个语句的语种不同,且所述多个语句具有相同含义;/n根据所述训练数据,训练语句复述模型,所述语句复述模型用于基于输入语句生成所述输入语句的复述语句,所述复述语句与所述输入语句具有相同含义,所述复述语句的语种与所述输入语句的语种相同或不同。/n
【技术特征摘要】
1.一种训练语句复述模型的方法,其特征在于,包括:
获取训练数据,所述训练数据包括多个语句,所述多个语句的语种不同,且所述多个语句具有相同含义;
根据所述训练数据,训练语句复述模型,所述语句复述模型用于基于输入语句生成所述输入语句的复述语句,所述复述语句与所述输入语句具有相同含义,所述复述语句的语种与所述输入语句的语种相同或不同。
2.根据权利要求1所述的方法,其特征在于,所述语句复述模型中包括语种指示参数,所述语种指示参数用于指示所述语句复述模型生成的复述语句的语种;
其中,所述根据所述训练数据,训练语句复述模型,包括:
根据所述训练数据及所述语种指示参数,训练所述语句复述模型。
3.根据权利要求2所述的方法,其特征在于,所述复述语句的语种是根据所述语种指示参数确定的,所述方法还包括:
获取语种指示信息;
根据所述语种指示信息确定所述语种指示参数。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述训练数据包括的多个语句中的至少一个语句为经过扰动处理的语句,所述扰动处理包括随机删除语句中的词、随机调换语句中词的词序以及随机向语句中插入词中的至少一项。
5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述获取训练数据之前,所述方法还包括:
获取预训练数据,所述预训练数据包括一个或多个语句,所述预训练数据包括的语句的语种为所述训练数据包括的语句的语种中的一个或多个;
根据所述预训练数据,训练所述语句复述模型。
6.一种语句复述方法,其特征在于,包括:
获取输入语句;
通过语句复述模型,对所述输入语句进行复述,生成所述输入语句的复述语句,所述复述语句的语种与所述输入语句的语种相同或不同;
其中,所述语句复述模型是使用训练数据训练后得到的,所述训练数据包括多个语句,所述多个语句的语种不同,且所述多个语句具有相同含义。
7.根据权利要求6所述的方法,其特征在于,所述语句复述模型中包括语种指示参数,所述语种指示参数用于指示所述语句复述模型生成的复述语句的语种,其中,所述语句复述模型是根据所述训练数据及所述语种指示参数训练后得到的。
8.根据权利要求7所述的方法,其特征在于,所述复述语句的语种是根据所述语种指示参数确定的,所述语种指示参数是根据获取到的语种指示信息确定的。
9.根据权利要求6至8中任一项所述的方法,其特征在于,所述训练数据包括的多个语句中的至少一个语句为经过扰动处理的语句,所述扰动处理包括随机删除语句中的词、随机调换语句中词的词序以及随机向语句中插入词中的至少一项。
10.根据权利要求6至9中任一项所述的方法,其特征在于,所述语句复述模型是使用预训练数据训练后、再使用所述训练数据训练后得到的,所述预训练数据包括一个或多个语句,所述预训练数据包括的语句的语种为所述训练数据包括的语句的语种中的一个或多个。
11.一种训练语句复述模型的装置,其特征在于,包括:
获取模块,用于获取训练数据,所述训练数据包括多个语句,所述多个语句的语种不同,且所述多个语句具有相同含义;
训练模块,用于根据所述训练数据,训练语句复述模型,所述语句复述模型用于基于输入语句生成所述输入语句的复述语句,所述复述语句与所述输入语句具有相同含义,所述复述语句的语种与所述输入语句的语种相同或不同。
12.根据...
【专利技术属性】
技术研发人员:郭寅鹏,廖亿,蒋欣,张晴,张轶博,刘群,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。