实体识别模型的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26066610 阅读:15 留言:0更新日期:2020-10-28 16:39
本申请公开了实体识别模型的生成方法、装置、电子设备及存储介质,涉及自然语言处理、深度学习和语音交互技术领域。具体方案为:通过获取针对目标实体类别的第二标准数据对实体识别目标模型进行训练,使得实体识别目标模型仅具备识别目标实体类别的能力,实现了实体识别目标模型的实体识别能力最小化,从而能够有效地防止从实体识别目标模型中窃取其他实体识别能力,提高了安全性。由于实体识别目标模型仅具备识别目标实体类别的能力,复杂度低,占用的存储空间小,从而实体识别目标模型可以在智能设备本地运行以提供对话实体识别服务。因此本申请不仅能够节约云端服务器的资源,还能在无法请求云端服务器的情况下仍能实现智能交互,可用性强。

【技术实现步骤摘要】
实体识别模型的生成方法、装置、电子设备及存储介质
本申请的实施例总体上涉及计算机
,并且更具体地,涉及自然语言处理、深度学习和语音交互

技术介绍
随着人工智能和物联网技术的快速发展,越来越多的智能设备具备了智能语音交互能力,比如智能穿戴设备、智能音箱、智能机器人等。智能设备的智能交互能力依赖于云端对话实体识别服务,其中自然语言理解(NaturalLanguageUnderstanding,NLU)对云端对话实体识别服务的依赖尤其严重,当智能设备无法请求云端对话实体识别服务时,NLU技术也不可用,导致智能设备无法实现智能交互。然而,目前尚没有解决方案来解决上述问题。
技术实现思路
本申请提供了一种实体识别模型的生成方法、装置、电子设备及存储介质。根据第一方面,提供了一种实体识别模型的生成方法,包括:获取实体识别母模型和第一标注数据,其中,所述实体识别母模型和所述第一标注数据对应多个实体类别;根据所述实体识别母模型生成实体识别源模型;根据所述第一标注数据生成针对目标实体类别的第二标注数据;根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型;以及根据所述第二标注数据对所述实体识别目标模型进行训练。根据第二方面,提供了一种实体识别模型的生成装置,包括:获取模块,用于获取实体识别母模型和第一标注数据,其中,所述实体识别母模型和所述第一标注数据对应多个实体类别;第一生成模块,用于根据所述实体识别母模型生成实体识别源模型;第二生成模块,用于根据所述第一标注数据生成针对目标实体类别的第二标注数据;第三生成模块,用于根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型;以及训练模块,用于根据所述第二标注数据对所述实体识别目标模型进行训练。根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的实体识别模型的生成方法。根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的实体识别模型的生成方法。本申请提供的实体识别模型的生成方法、装置、电子设备及存储介质,存在如下有益效果:通过获取对应多个类别的实体识别母模型和第一标注数据,并根据实体识别母模型生成实体识别源模型,以及根据第一标注数据生成针对目标实体类别的第二标注数据,进而根据实体识别源模型生成实体识别目标模型,并利用第二标注数据对实体识别目标模型进行训练,由此,实现了对话实体识别模型的迁移,并且,通过获取针对目标实体类别的第二标准数据对实体识别目标模型进行训练,使得实体识别目标模型仅具备识别目标实体类别的能力,实现了实体识别目标模型的实体识别能力最小化,从而能够有效地防止从实体识别目标模型中窃取其他实体识别能力,提高了安全性。此外,也由于实体识别目标模型仅具备识别目标实体类别的能力,复杂度低,占用的存储空间小,从而实体识别目标模型可以在智能设备本地运行以提供对话实体识别服务。因此本申请不仅能够节约云端服务器的资源,还能够在无法请求云端服务器的情况下仍能实现智能交互,提高了智能设备的可用性。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的实体识别模型的生成方法的流程示意图;图2是根据本申请第二实施例的实体识别模型的生成方法的流程示意图;图3是根据本申请第三实施例的实体识别模型的生成方法的流程示意图;图4是根据本申请第四实施例的实体识别模型的生成方法的流程示意图;图5是根据本申请第五实施例的实体识别模型的生成方法的流程示意图;图6是实现本申请实施例的实体识别模型的生成方法的过程示例图;图7是源模型迁移至目标模型的示例图;图8是根据本申请第六实施例的实体识别模型的生成装置的结构示意图;图9是根据本申请第七实施例的实体识别模型的生成装置的结构示意图;图10是根据本申请第八实施例的实体识别模型的生成装置的结构示意图;图11是根据本申请第九实施例的实体识别模型的生成装置的结构示意图;图12是根据本申请第十实施例的实体识别模型的生成装置的结构示意图;图13是用来实现本申请实施例的实体识别模型的生成方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。下面参考附图描述本申请的实体识别模型的生成方法、装置、电子设备及存储介质。随着人工智能和物联网技术的快速发展,越来越多的智能设备具备了智能语音交互能力,比如智能穿戴设备、智能音箱、智能机器人等。智能设备的智能交互能力依赖于云端对话实体识别服务,其中自然语言理解对云端对话实体识别服务的依赖尤其严重。对话实体识别技术作为自然语言理解的一个重要基础服务,由于问题的复杂性和服务的高要求,需要一台甚至多台性能高的服务器来运行复杂庞大的模型,作为远端服务被外部智能设备以http请求的方式来调用,以提供对话实体识别服务。智能设备的网络情况相对比较复杂,比如智能车载设备可能进入隧道或者偏远地区,网络出现不可用的情况,此时无法正常调用云端对话实体识别服务,使得智能车载设备的功能受很大影响。目前,针对智能设备无法请求云端对话实体识别服务的情况,主要通过预设的规则,比如正则表达式、关键字匹配等规则,来满足常用的关键需求。然而,基于特定规则来满足关键需求的方式,一条规则只能应付一种情况,灵活性差,并且,规则能够覆盖的需求有限,无法满足自然语言理解的需求,需求满足度低。此外,随着智能设备的迭代更新,规则会越积越多,规则之间可能出现重复或者冲突,导致维护成本越来越高,可维护性差。针对上述问题,本申请公开了一种实体识别模型的生成方法,通过获取针对目标实体类别的第二标准数据对实体识别目标模型进行训练,使得实体识别目标模型仅具备识别目标实体类别的能力,实现了实体识别目标模型的实体识别能力最小化,从而能够有效地防止从实体识别目标模型中窃取其他实体识别能力,提高了安全性。此外,也由于实体识别目标模型仅具备识别目标实体类别的能力,复杂度低,占用的存储空间小,从而实体识别目标模型可以在智能设备本地运行以提供对话实体识别本文档来自技高网...

【技术保护点】
1.一种实体识别模型的生成方法,其中,包括:/n获取实体识别母模型和第一标注数据,其中,所述实体识别母模型和所述第一标注数据对应多个实体类别;/n根据所述实体识别母模型生成实体识别源模型;/n根据所述第一标注数据生成针对目标实体类别的第二标注数据;/n根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型;以及/n根据所述第二标注数据对所述实体识别目标模型进行训练。/n

【技术特征摘要】
1.一种实体识别模型的生成方法,其中,包括:
获取实体识别母模型和第一标注数据,其中,所述实体识别母模型和所述第一标注数据对应多个实体类别;
根据所述实体识别母模型生成实体识别源模型;
根据所述第一标注数据生成针对目标实体类别的第二标注数据;
根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型;以及
根据所述第二标注数据对所述实体识别目标模型进行训练。


2.如权利要求1所述的实体识别模型的生成方法,其中,所述根据所述实体识别母模型生成实体识别源模型,包括:
获取多个语料样本;
根据所述实体识别母模型对所述多个语料样本进行识别以生成多个实体识别结果;
将所述多个实体识别结果和所述多个语料样本作为所述第一标注数据;以及
使用知识蒸馏方式通过所述第一标注数据生成所述实体识别源模型,其中,所述实体识别源模型针对所述多个实体类别。


3.如权利要求1所述的实体识别模型的生成方法,其中,所述根据所述第一标注数据生成针对目标实体类别的第二标注数据,包括:
获取运行场景需求信息;
根据所述运行场景需求信息生成所述目标实体类别;以及
根据所述目标实体类别对所述第一标注数据进行筛选以生成所述第二标注数据。


4.如权利要求1所述的实体识别模型的生成方法,其中,所述根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型,包括:
获取所述实体识别源模型的模型结构;
根据所述实体识别源模型的模型结构生成所述实体识别目标模型的模型结构;
获取所述实体识别源模型的模型参数;
根据所述实体识别源模型的模型参数生成表征层参数;以及
将所述表征层参数迁移至所述实体识别目标模型的模型结构之中以生成所述实体识别目标模型。


5.如权利要求1所述的实体识别模型的生成方法,其中,在所述根据所述第二标注数据对所述实体识别目标模型进行训练之前,还包括:
对所述实体识别目标模型的输出层参数进行随机初始化。


6.一种实体识别模型的生成装置,其中,包括:
获取模块,用于获取实体识别母模型和第一标注数据,其中,所述实体识别母模型和所述第一标注数据对应多个实体类别;
第一生成模块,用于根据所述实体识别母模型生成实体识别源模型;
第二生成模块,用于根据所述第一标注数据生成针对目...

【专利技术属性】
技术研发人员:黄炼楷林英展叶路黄世维
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1