文本分类服务部署方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:28035540 阅读:35 留言:0更新日期:2021-04-09 23:17
本发明专利技术实施例涉及业务支撑技术领域,公开了一种文本分类服务部署方法、装置、设备及计算机存储介质,其中方法包括:获取训练文本数据;根据所述训练文本数据,得到微调预训练模型;获取各场景类型的标记文本数据;根据所述各场景类型的标记文本数据和所述微调预训练模型,得到各场景类型的语义向量数据;根据所述各场景类型的语义向量数据分别训练一分类神经网络模型,得到各场景类型的分类模型;根据所述各场景类型的分类模型和所述微调预训练模型分别对各场景类型的文本进行分类。通过上述方式,本发明专利技术实施例能够加快分类模型的部署。

【技术实现步骤摘要】
文本分类服务部署方法、装置、设备及计算机存储介质
本专利技术实施例涉及业务支撑
,具体涉及一种文本分类服务部署方法、装置、设备及计算机存储介质。
技术介绍
文本分类是指根据文本的应用场景,选择合适文本分类方法及辅助算法,为文本选取特征值,然后通过分类模型对待分类文本与特征词进行训练,实现目标文本分类识别。在实现本专利技术实施例的过程中,专利技术人发现:目前的分类模型通常是对于特定业务场景定制化建立,例如对客户投诉内容进行分类、对网页评论进行分类等。每个场景都需要建立一套自己的模型,包括中文分词、词嵌入、模型数据训练和在线服务部署等多个环节,即每一个新业务,都需要完整走完所有环节才能建立使用于该业务的分类模型,效率较低。
技术实现思路
鉴于上述问题,本专利技术实施例提供了一种文本分类服务部署方法、装置、设备及计算机存储介质,克服了上述问题或者至少部分地解决了上述问题。根据本专利技术实施例的一个方面,提供了一种文本分类服务部署方法,所述方法包括:获取训练文本数据;根据所述训练文本数据,得到微调预训练模型;获本文档来自技高网...

【技术保护点】
1.一种文本分类服务部署方法,其特征在于,包括:/n获取训练文本数据;/n根据所述训练文本数据,得到微调预训练模型;/n获取各场景类型的标记文本数据;/n根据所述各场景类型的标记文本数据和所述微调预训练模型,得到各场景类型的语义向量数据;/n根据所述各场景类型的语义向量数据分别训练一分类神经网络模型,得到各场景类型的分类模型;/n根据所述各场景类型的分类模型和所述微调预训练模型分别对各场景类型的文本进行分类。/n

【技术特征摘要】
1.一种文本分类服务部署方法,其特征在于,包括:
获取训练文本数据;
根据所述训练文本数据,得到微调预训练模型;
获取各场景类型的标记文本数据;
根据所述各场景类型的标记文本数据和所述微调预训练模型,得到各场景类型的语义向量数据;
根据所述各场景类型的语义向量数据分别训练一分类神经网络模型,得到各场景类型的分类模型;
根据所述各场景类型的分类模型和所述微调预训练模型分别对各场景类型的文本进行分类。


2.如权利要求1所述的方法,其特征在于,所述根据所述训练文本数据,得到微调预训练模型具体为:
根据所述训练文本数据训练预训练神经网络模型,得到预训练模型;
将所述预训练模型与预设语料库结合,得到所述微调预训练模型。


3.如权利要求1所述的方法,其特征在于,所述根据所述训练文本数据,得到微调预训练模型具体为:
根据所述训练文本数据训练预训练神经网络模型,得到预训练模型;
根据所述训练文本数据和预训练模型,得到训练语义向量数据;
根据训练语义向量数据训练降维神经网络模型,得到降维模型;
结合所述预训练模型和所述降维模型,得到所述微调预训练模型。


4.如权利要求1-3任一项所述的方法,其特征在于,所述根据所述各场景类型的分类模型和所述微调预训练模型分别对各场景类型的文本进行分类,具体为:
将所述各场景类型的分类模型和所述微调预训练模型分别封装于一Docker容器,得到各场景类型的Docker容器;
将所述各场景类型的Docker容器分别关联不同场景类型的应用程序,以分别获取各场景类型的应用程序的文本数据,并对所述文本数据进行分类。


5.一种文本分类服务部署装置,其特征在于,包括:预训练层和服务层,所述服务层包括多个Docker容器,每一所述Docker容器皆封装有分类模型和微调预训练模型;
其中,所述预训练层用于获取训练...

【专利技术属性】
技术研发人员:储晶星齐希施文驰朱骏傅一平
申请(专利权)人:中国移动通信集团浙江有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1