实体识别模型的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26066610 阅读：15 留言：0更新日期：2020-10-28 16:39

本申请公开了实体识别模型的生成方法、装置、电子设备及存储介质，涉及自然语言处理、深度学习和语音交互技术领域。具体方案为：通过获取针对目标实体类别的第二标准数据对实体识别目标模型进行训练，使得实体识别目标模型仅具备识别目标实体类别的能力，实现了实体识别目标模型的实体识别能力最小化，从而能够有效地防止从实体识别目标模型中窃取其他实体识别能力，提高了安全性。由于实体识别目标模型仅具备识别目标实体类别的能力，复杂度低，占用的存储空间小，从而实体识别目标模型可以在智能设备本地运行以提供对话实体识别服务。因此本申请不仅能够节约云端服务器的资源，还能在无法请求云端服务器的情况下仍能实现智能交互，可用性强。

全部详细技术资料下载

【技术实现步骤摘要】
实体识别模型的生成方法、装置、电子设备及存储介质
本申请的实施例总体上涉及计算机
，并且更具体地，涉及自然语言处理、深度学习和语音交互

技术介绍
随着人工智能和物联网技术的快速发展，越来越多的智能设备具备了智能语音交互能力，比如智能穿戴设备、智能音箱、智能机器人等。智能设备的智能交互能力依赖于云端对话实体识别服务，其中自然语言理解(NaturalLanguageUnderstanding，NLU)对云端对话实体识别服务的依赖尤其严重，当智能设备无法请求云端对话实体识别服务时，NLU技术也不可用，导致智能设备无法实现智能交互。然而，目前尚没有解决方案来解决上述问题。
技术实现思路
本申请提供了一种实体识别模型的生成方法、装置、电子设备及存储介质。根据第一方面，提供了一种实体识别模型的生成方法，包括：获取实体识别母模型和第一标注数据，其中，所述实体识别母模型和所述第一标注数据对应多个实体类别；根据所述实体识别母模型生成实体识别源模型；根据所述第一标注数据生成针对目标实体类别的第二标注数据；根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型；以及根据所述第二标注数据对所述实体识别目标模型进行训练。根据第二方面，提供了一种实体识别模型的生成装置，包括：获取模块，用于获取实体识别母模型和第一标注数据，其中，所述实体识别母模型和所述第一标注数据对应多个实体类别；第一生成模块，用于根据所述实体识别母模型...

【技术保护点】
1.一种实体识别模型的生成方法，其中，包括：/n获取实体识别母模型和第一标注数据，其中，所述实体识别母模型和所述第一标注数据对应多个实体类别；/n根据所述实体识别母模型生成实体识别源模型；/n根据所述第一标注数据生成针对目标实体类别的第二标注数据；/n根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型；以及/n根据所述第二标注数据对所述实体识别目标模型进行训练。/n

【技术特征摘要】
1.一种实体识别模型的生成方法，其中，包括：
获取实体识别母模型和第一标注数据，其中，所述实体识别母模型和所述第一标注数据对应多个实体类别；
根据所述实体识别母模型生成实体识别源模型；
根据所述第一标注数据生成针对目标实体类别的第二标注数据；
根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型；以及
根据所述第二标注数据对所述实体识别目标模型进行训练。

2.如权利要求1所述的实体识别模型的生成方法，其中，所述根据所述实体识别母模型生成实体识别源模型，包括：
获取多个语料样本；
根据所述实体识别母模型对所述多个语料样本进行识别以生成多个实体识别结果；
将所述多个实体识别结果和所述多个语料样本作为所述第一标注数据；以及
使用知识蒸馏方式通过所述第一标注数据生成所述实体识别源模型，其中，所述实体识别源模型针对所述多个实体类别。

3.如权利要求1所述的实体识别模型的生成方法，其中，所述根据所述第一标注数据生成针对目标实体类别的第二标注数据，包括：
获取运行场景需求信息；
根据所述运行场景需求信息生成所述目标实体类别；以及
根据所述目标实体类别对所述第一标注数据进行筛选以生成所述第二标注数据。

4.如权利要求1所述的实体识别模型的生成方法，其中，所述根据所述实体识别源模型生成针对所述目标实体类别的实体识别目标模型，包括：
获取所述实体识别源模型的模型结构；
根据所述实体识别源模型的模型结构生成所述实体识别目标模型的模型结构；
获取所述实体识别源模型的模型参数；
根据所述实体识别源模型的模型参数生成表征层参数；以及
将所述表征层参数迁移至所述实体识别目标模型的模型结构之中以生成所述实体识别目标模型。

5.如权利要求1所述的实体识别模型的生成方法，其中，在所述根据所述第二标注数据对所述实体识别目标模型进行训练之前，还包括：
对所述实体识别目标模型的输出层参数进行随机初始化。

6.一种实体识别模型的生成装置，其中，包括：
获取模块，用于获取实体识别母模型和第一标注数据，其中，所述实体识别母模型和所述第一标注数据对应多个实体类别；
第一生成模块，用于根据所述实体识别母模型生成实体识别源模型；
第二生成模块，用于根据所述第一标注数据生成针对目...

【专利技术属性】
技术研发人员：黄炼楷，林英展，叶路，黄世维，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人