The embodiment of the present invention discloses an example expansion method, device, device and medium, which relates to the technical field of natural language processing. The embodiment of the present invention provides an example expansion method, which includes: acquiring the rule of the extended instance including keyword information; inputting the rule of the extended instance into the extended model of the instance, and generating the extended instance. The embodiment of the present invention provides an example expansion method, device, device and medium, thereby generating a more abundant extended example than the sentence pattern of the case to be extended.
【技术实现步骤摘要】
一种实例扩展方法、装置、设备和介质
本专利技术实施例涉及自然语言处理
,尤其涉及一种实例扩展方法、装置、设备和介质。
技术介绍
针对于搜索项(query)理解任务,较普遍的方式是采用将query解析为意图和槽位的形式,即将query中的关键信息标注为槽位,将query的目的标注为意图。比如“明天天气怎么样”,意图为天气查询,槽位信息为明天。在机器学习中,通常基于序列标注模型对query进行理解和应答。然而,序列标注模型的训练需要大量的有标注意图和槽位信息的实例数据作为训练样本。目前,实例数据获取主要方法是:对人工标注的少量待扩展实例进行识别,对识别到的关键信息进行替换,以获取更多扩展实例。但是,因为仅是对待扩展实例中的关键信息的替换,所以生成的扩展实例的句式与待扩展实例的句式相同,从而导致生成的扩展实例的句式单一。然而单一句式的扩展实例对序列标注模型训练的提升有限。
技术实现思路
本专利技术实施例提供一种实例扩展方法、装置、设备和介质,以生成比待扩展实例的句式更丰富的扩展实例。第一方面,本专利技术实施例提供了一种实例扩展方法,该方法包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。进一步地,将获取的待扩展实例规则输入实例扩展模型,生成扩展实例包括:将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例。进一步地,在将获取的待扩展实例规则输入实例扩展模型,生成扩展实例之前,还包括:确定待扩展实例关联的待扩展实例规则;将所述待扩展实例和所述待扩展实例关联的待扩展实例规则作为样本,对初始模型进行训练得到所述 ...
【技术保护点】
1.一种实例扩展方法,其特征在于,包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。
【技术特征摘要】
1.一种实例扩展方法,其特征在于,包括:获取包括关键词信息的待扩展实例规则;将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。2.根据权利要求1所述的方法,其特征在于,将获取的待扩展实例规则输入实例扩展模型,生成扩展实例包括:将获取的待扩展实例规则和随机种子输入实例扩展模型,生成扩展实例。3.根据权利要求1所述的方法,其特征在于,在将获取的待扩展实例规则输入实例扩展模型,生成扩展实例之前,还包括:确定待扩展实例关联的待扩展实例规则;将所述待扩展实例和所述待扩展实例关联的待扩展实例规则作为样本,对初始模型进行训练得到所述实例扩展模型。4.根据权利要求3所述的方法,其特征在于,确定待扩展实例关联的待扩展实例规则包括:对待扩展实例进行文本分析,根据文本分析结果从待扩展实例中提取待扩展实例规则。5.根据权利要求3所述的方法,其特征在于,确定待扩展实例关联的待扩展实例规则包括:对获取的待扩展实例进行文本分析;将文本分析结果与获取的待扩展实例规则进行匹配,将匹配一致的待扩展实例规则作为所述待扩展实例关联的待扩展实例规则。6.一种实例扩展装置,其特征在于,包括:规则获取模块,用于获取包括关键词信息的待扩展实例规则;实例生成模块,用于将获取的待扩展实例规则输入实例扩展模型,生成扩展实例。7.根据权利要求6所述的装置,其特征在于...
【专利技术属性】
技术研发人员:王一鸣,姜文斌,孙珂,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。