NLP模型优化方法、装置以及计算机设备制造方法及图纸

技术编号：26172155 阅读：26 留言：0更新日期：2020-10-31 13:48

本申请提供了一种NLP模型优化方法、装置以及计算机设备，涉及神经网络模型技术领域，缓解了目前的NLP模型的预测速度较慢的技术问题。该方法包括：获取待优化NLP模型；通过对所述待优化NLP模型进行剪枝处理，建立所述待优化NLP模型的稀疏化模型；对所述稀疏化模型进行量化处理，得到所述稀疏化模型的压缩后模型；对所述压缩后模型的部分代码转换为预设语言代码，并基于代码转换后的模型进行编译，得到编译后模型；所述预设语言代码的运行速度大于所述部分代码的运行速度；通过异步处理方式对所述编译后模型部署FastAPI，得到优化后的NLP模型。

全部详细技术资料下载

【技术实现步骤摘要】
NLP模型优化方法、装置以及计算机设备
本申请涉及神经网络模型
，尤其是涉及一种NLP模型优化方法、装置以及计算机设备。
技术介绍
目前，深度学习模型需要大量算力、内存和电量，尤其以自然语言处理(NaturalLanguageProcessing，简称NLP)领域的模型更为突出，前期需要加入大量预处理成分，例如，遍历、正则和分词等。再者，NLP领域的新兴模型越来越来多，例如，BERT、XLNET等，NLP模型的前期预测过程便更为繁琐，耗时较长。因此，目前的NLP模型的预测过程速度较慢。
技术实现思路
本专利技术的目的在于提供一种NLP模型优化方法、装置以及计算机设备，以缓解目前的NLP模型的预测速度较慢的技术问题。第一方面，本申请实施例提供了一种NLP模型优化方法，所述方法包括：获取待优化NLP模型；通过对所述待优化NLP模型进行剪枝处理，建立所述待优化NLP模型的稀疏化模型；对所述稀疏化模型进行量化处理，得到所述稀疏化模型的压缩后模型；对所述压缩后模型的部分代码转换为预设语言代码，并基于代码转换后的模型进行编译，得到编译后模型；所述预设语言代码的运行速度大于所述部分代码的运行速度；通过异步处理方式对所述编译后模型部署FastAPI，得到优化后的NLP模型。在一个可能的实现中，所述待优化NLP模型包括下述任意一项或多项：TextCNN模型、BERT模型、fasttext模型。在一个可能的实现中，获取待优化NLP模...

【技术保护点】
1.一种NLP模型优化方法，其特征在于，所述方法包括：/n获取待优化NLP模型；/n通过对所述待优化NLP模型进行剪枝处理，建立所述待优化NLP模型的稀疏化模型；/n对所述稀疏化模型进行量化处理，得到所述稀疏化模型的压缩后模型；/n对所述压缩后模型的部分代码转换为预设语言代码，并基于代码转换后的模型进行编译，得到编译后模型；所述预设语言代码的运行速度大于所述部分代码的运行速度；/n通过异步处理方式对所述编译后模型部署FastAPI，得到优化后的NLP模型。/n

【技术特征摘要】
1.一种NLP模型优化方法，其特征在于，所述方法包括：
获取待优化NLP模型；
通过对所述待优化NLP模型进行剪枝处理，建立所述待优化NLP模型的稀疏化模型；
对所述稀疏化模型进行量化处理，得到所述稀疏化模型的压缩后模型；
对所述压缩后模型的部分代码转换为预设语言代码，并基于代码转换后的模型进行编译，得到编译后模型；所述预设语言代码的运行速度大于所述部分代码的运行速度；
通过异步处理方式对所述编译后模型部署FastAPI，得到优化后的NLP模型。

2.根据权利要求1所述的方法，其特征在于，所述待优化NLP模型包括下述任意一项或多项：
TextCNN模型、BERT模型、fasttext模型。

3.根据权利要求1所述的方法，其特征在于，获取待优化NLP模型的步骤，包括：
对初始NLP模型进行预处理，得到待优化NLP模型；其中，预处理的过程包括正则、循环遍历以及分词中的任意一项或多项。

4.根据权利要求1所述的方法，其特征在于，通过对所述待优化NLP模型进行剪枝处理，建立所述待优化NLP模型的稀疏化模型的步骤，包括：
根据所述待优化NLP模型中神经元的作用数据对所述神经元进行排序，将排序结果中处于预设排名之后的神经元移除，基于移除后保留的神经元建立所述待优化NLP模型的稀疏化模型。

5.根据权利要求1所述的方法，其特征在于，对所述稀疏化模型进行量化处理，得到所述稀疏化模型的压缩后模型的步...

【专利技术属性】
技术研发人员：陈喜旺，章水鑫，
申请(专利权)人：南京三百云信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人