一种实例扩展方法、装置、设备和介质制造方法及图纸

技术编号:19647129 阅读:18 留言:0更新日期:2018-12-05 20:33
本发明专利技术实施例公开了一种实例扩展方法、装置、设备和介质,涉及自然语言处理技术领域。本发明专利技术实施例提供了一种实例扩展方法,该方法包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。本发明专利技术实施例提供了一种实例扩展方法、装置、设备和介质,从而生成比待扩展实例的句式更丰富的扩展实例。

An Example Extension Method, Device, Equipment and Media

The embodiment of the present invention discloses an example expansion method, device, device and medium, which relates to the technical field of natural language processing. The embodiment of the present invention provides an example expansion method, which includes: acquiring the rule of the extended instance including keyword information; inputting the rule of the extended instance into the extended model of the instance, and generating the extended instance. The embodiment of the present invention provides an example expansion method, device, device and medium, thereby generating a more abundant extended example than the sentence pattern of the case to be extended.

【技术实现步骤摘要】
一种实例扩展方法、装置、设备和介质
本专利技术实施例涉及自然语言处理
,尤其涉及一种实例扩展方法、装置、设备和介质。
技术介绍
针对于搜索项(query)理解任务,较普遍的方式是采用将query解析为意图和槽位的形式,即将query中的关键信息标注为槽位,将query的目的标注为意图。比如“明天天气怎么样”,意图为天气查询,槽位信息为明天。在机器学习中,通常基于序列标注模型对query进行理解和应答。然而,序列标注模型的训练需要大量的有标注意图和槽位信息的实例数据作为训练样本。目前,实例数据获取主要方法是:对人工标注的少量待扩展实例进行识别,对识别到的关键信息进行替换,以获取更多扩展实例。但是,因为仅是对待扩展实例中的关键信息的替换,所以生成的扩展实例的句式与待扩展实例的句式相同,从而导致生成的扩展实例的句式单一。然而单一句式的扩展实例对序列标注模型训练的提升有限。
技术实现思路
本专利技术实施例提供一种实例扩展方法、装置、设备和介质,以生成比待扩展实例的句式更丰富的扩展实例。第一方面,本专利技术实施例提供了一种实例扩展方法,该方法包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。进一步地,将获取的待扩展实例规则输入实例扩展模型,生成扩展实例包括:将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例。进一步地,在将获取的待扩展实例规则输入实例扩展模型,生成扩展实例之前,还包括:确定待扩展实例关联的待扩展实例规则;将所述待扩展实例和所述待扩展实例关联的待扩展实例规则作为样本,对初始模型进行训练得到所述实例扩展模型。进一步地,确定待扩展实例关联的待扩展实例规则包括:对待扩展实例进行文本分析,根据文本分析结果从待扩展实例中提取待扩展实例规则。进一步地,确定待扩展实例关联的待扩展实例规则包括:对获取的待扩展实例进行文本分析;将文本分析结果与获取的待扩展实例规则进行匹配,将匹配一致的待扩展实例规则作为所述待扩展实例关联的待扩展实例规则。第二方面,本专利技术实施例还提供了一种实例扩展装置,该装置包括:规则获取模块,用于获取包括关键词信息的待扩展实例规则;实例生成模块,用于将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。进一步地,实例生成模块包括:实例生成单元,用于将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例。进一步地,所述的装置还包括:样本规则确定模块,用于在将获取的待扩展实例规则输入实例扩展模型,生成扩展实例之前,确定待扩展实例关联的待扩展实例规则;模型训练模块,用于将所述待扩展实例和所述待扩展实例关联的待扩展实例规则作为样本,对初始模型进行训练得到所述实例扩展模型。进一步地,样本规则确定模块包括:规则提取单元,用于对待扩展实例进行文本分析,根据文本分析结果从待扩展实例中提取待扩展实例规则。进一步地,样本规则确定模块包括:文本分析单元,用于对获取的待扩展实例进行文本分析;规则匹配单元,用于将文本分析结果与获取的待扩展实例规则进行匹配,将匹配一致的待扩展实例规则作为所述待扩展实例关联的待扩展实例规则。第三方面,本专利技术实施例还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例中任一所述的实例扩展方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的实例扩展方法。本专利技术实施例通过将待扩展实例规则输入实例扩展模型,从而生成扩展实例。因为待扩展实例规则仅对扩展实例进行关键信息的限定,而并不对扩展实例的句式限定,所以生成的扩展实例的句式一般不同于待扩展实例,从而生成具有丰富句式的扩展实例。同时,因为待扩展实例规则对扩展实例进行关键信息的限定,所以可以基于关键信息对扩展实例语义进行控制,避免生成转义的扩展实例。附图说明图1为本专利技术实施例一提供的一种实例扩展方法的流程图;图2是本专利技术实施例二提供的一种实例扩展方法的流程图;图3a是本专利技术实施例三提供的一种实例扩展方法的流程图;图3b是本专利技术实施例三提供的一种实例扩展模型训练方法的流程图图4是本专利技术实施例四提供的一种实例扩展装置的结构示意图;图5为本专利技术实施例五提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种实例扩展方法的流程图。本实施例可适用于基于提供的少量实例进行实例扩展的情况。该方法可以由一种实例扩展装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的实例扩展方法包括:S110、获取包括关键词信息的待扩展实例规则。其中,关键词信息可以是描述扩展实例的任意信息。待扩展实例规则用于对扩展实例进行任意部分的限定。具体的,关键词信息可以是关键词或关键词间的关系。典型的,关键词信息可以是文本的意图、槽位以及槽位的顺序中的至少一种。示例性的,待扩展实例规则可以是:“从”后面是起始地(start)。待扩展实例规则也可以是:“到”后面是终止地(end)。待扩展实例规则还可以是:起始地(start)在终止地(end)前面。在此基础上,本领域技术人员还可以想到很多待扩展实例规则,本实施例对此并不进行任何限定。可选地,待扩展实例规则可以由用户输入,也可以从用户输入的一个示例性的句子中提取。具体地,从用户输入的一个示例性的句子中提取待扩展实例规则包括:识别句子中的意图、槽位和各槽位的顺序;将识别到的意图、槽位和各槽位的顺序中的至少一种作为待扩展实例规则。S120、将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。其中,实例扩展模型预先训练完成,用于根据输入的待扩展实例规则,生成符合待扩展实例规则的扩展实例。可选的,扩展实例可以是一个短语,也可以是包括多个句子的文本段落。典型的,扩展实例可以是一个句子。本专利技术实施例的技术方案,通过将待扩展实例规则输入实例扩展模型,从而生成扩展实例。因为待扩展实例规则仅对扩展实例进行关键信息的限定,而并不对扩展实例的句式限定,所以生成的扩展实例的句式一般不同于待扩展实例,从而生成具有丰富句式的扩展实例。同时,因为待扩展实例规则对扩展实例进行关键信息的限定,所以可以基于关键信息对扩展实例语义进行控制,避免生成转义的扩展实例。为依据一个待扩展实例规则获取多个扩展实例,以实现实例的扩展。将获取的待扩展实例规则输入实例扩展模型,生成扩展实例包括:将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例。具体的,为实现设定需求数量的扩展实例的生成,将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例包括:将获取的一个待扩展实例规则和一个随机种子输入实例扩展模型,生成一个扩展实例;若基于所述待扩展实例规则生成的扩展实例数量小于设定需求数量阈值,则调整随机种子,将调整后的随机种子和所述待扩展实例规则输入实例扩展模型生成扩展实例,直至基于本文档来自技高网...

【技术保护点】
1.一种实例扩展方法,其特征在于,包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。

【技术特征摘要】
1.一种实例扩展方法,其特征在于,包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。2.根据权利要求1所述的方法,其特征在于,将获取的待扩展实例规则输入实例扩展模型,生成扩展实例包括:将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例。3.根据权利要求1所述的方法,其特征在于,在将获取的待扩展实例规则输入实例扩展模型,生成扩展实例之前,还包括:确定待扩展实例关联的待扩展实例规则;将所述待扩展实例和所述待扩展实例关联的待扩展实例规则作为样本,对初始模型进行训练得到所述实例扩展模型。4.根据权利要求3所述的方法,其特征在于,确定待扩展实例关联的待扩展实例规则包括:对待扩展实例进行文本分析,根据文本分析结果从待扩展实例中提取待扩展实例规则。5.根据权利要求3所述的方法,其特征在于,确定待扩展实例关联的待扩展实例规则包括:对获取的待扩展实例进行文本分析;将文本分析结果与获取的待扩展实例规则进行匹配,将匹配一致的待扩展实例规则作为所述待扩展实例关联的待扩展实例规则。6.一种实例扩展装置,其特征在于,包括:规则获取模块,用于获取包括关键词信息的待扩展实例规则;实例生成模块,用于将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。7.根据权利要求6所述的装置,其特征在于...

【专利技术属性】
技术研发人员:王一鸣姜文斌孙珂
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1