自然语言识别模型生成、自然语言处理方法及设备技术

技术编号：29255286 阅读：17 留言：0更新日期：2021-07-13 17:26

本说明书一个或多个实施例提供一种自然语言识别模型生成、自然语言处理方法及设备，方法包括：获取训练模型的训练后的权重参数、以及训练训练模型使用的字典；训练模型为基于第一编程语言构建的神经网络模型；将权重参数转化为第一预设格式的数据；将字典转化为第二预设格式的数据；将第一预设格式的数据和第二预设格式的数据载入基于第二编程语言编写的推理模型中，得到自然语言识别模型；可见，本方案中，自然语言识别模型是由推理模型载入权重参数和字典得到的，由于推理模型不涉及训练过程，推理模型的数据量小于训练模型，进而减少了自然语言识别模型的数据量。

全部详细技术资料下载

【技术实现步骤摘要】
自然语言识别模型生成、自然语言处理方法及设备
本说明书一个或多个实施例涉及自然语言
，尤其涉及一种自然语言识别模型生成、自然语言处理方法及设备。
技术介绍
自然语言处理(NLP，NaturalLanguageProcessing)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。目前，各种电子设备，比如，手机、电脑、车载设备、智能家居等等，都需要与用户进行交互，交互过程通常都涉及自然语言处理。一些相关方案中，通常基于编程语言(如BASIC、JAVA、C、C++、python等)构建神经网络，然后通过语料数据对该神经网络进行训练得到识别模型，将该识别模型配置到电子设备中，该识别模型可以对用户的语言进行解析处理。但是，识别模型数据量较大，占用电子设备的内存量较大，进而会降低电子设备的响应速度。
技术实现思路
有鉴于此，本说明书一个或多个实施例的目的在于提出一种自然语言识别模型生成、自然语言处理方法及设备，以减少自然语言识别模型的数据量。基于上述目的，本说明书一个或多个实施例提供了一种自然语言识别模型生成方法，包括：获取训练模型的训练后的权重参数、以及训练所述训练模型使用的字典；所述训练模型为基于第一编程语言构建的神经网络模型；将所述权重参数转化为第一预设格式的数据；将所述字典转化为第二预设格式的数据；将所述第一预设格式的数据和所述第二预设格式的数据载入基于第二编程语言编写的推理...

【技术保护点】
1.一种自然语言识别模型生成方法，其特征在于，包括：/n获取训练模型的训练后的权重参数、以及训练所述训练模型使用的字典；所述训练模型为基于第一编程语言构建的神经网络模型；/n将所述权重参数转化为第一预设格式的数据；/n将所述字典转化为第二预设格式的数据；/n将所述第一预设格式的数据和所述第二预设格式的数据载入基于第二编程语言编写的推理模型中，得到自然语言识别模型。/n

【技术特征摘要】
1.一种自然语言识别模型生成方法，其特征在于，包括：
获取训练模型的训练后的权重参数、以及训练所述训练模型使用的字典；所述训练模型为基于第一编程语言构建的神经网络模型；
将所述权重参数转化为第一预设格式的数据；
将所述字典转化为第二预设格式的数据；
将所述第一预设格式的数据和所述第二预设格式的数据载入基于第二编程语言编写的推理模型中，得到自然语言识别模型。

2.根据权利要求1所述的方法，其特征在于，所述将所述权重参数转化为第一预设格式的数据，包括：
将所述权重参数转化为PB模型文件；
将所述PB模型文件转化为.lite格式的文件，作为第一预设格式的数据。

3.根据权利要求2所述的方法，其特征在于，所述第二预设格式的数据为.pkl格式的字典；
所述将所述第一预设格式的数据和所述第二预设格式的数据载入基于第二编程语言编写的推理模型中，得到自然语言识别模型，包括：
基于BERT模型，通过CUDA配置NAIDIA程序，作为推理模型；
将所述.lite格式的文件和所述.pkl格式的字典载入所述推理模型，得到自然语言识别模型。

4.根据权利要求1所述的方法，其特征在于，所述获取训练模型的训练后的权重参数、以及训练所述训练模型使用的字典，包括：
获取语料数据以及所述语料数据对应的字典；
对所述语料数据进行增强处理，得到增强处理后的语料数据；
基于所述增强处理后的语料数据及所述字典，对训练模型进行训练，得到训练完成的权重参数。

5.根据权利要求4所述的方法，其特征在于，所述对所述语料数据进行增强处理，得到增强处理...

【专利技术属性】
技术研发人员：梁天新，
申请(专利权)人：京东方科技集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人