一种分类模型训练方法及系统技术方案

技术编号:28675449 阅读:39 留言:0更新日期:2021-06-02 02:52
本发明专利技术涉及深度学习领域,尤其涉及一种分类模型训练方法及系统。其中,该方法包括:获取多个客户咨询数据,每个所述客户咨询数据均标注有类别标签;将标注有类别标签的所述多个客户咨询数据分别转换为词向量数据;将所述词向量数据输入第一深度模型以对所述第一深度模型进行迭代训练,其中,在迭代训练过程中所述第一深度模型学习所述词向量数据的数据特征,并根据所述数据特征输出对应词向量数据的分类;当所述训练模型输出的词向量数据的分类结果的准确率达到预设值时,停止对所述第一深度模型的迭代训练。

【技术实现步骤摘要】
一种分类模型训练方法及系统
本专利技术涉及深度学习领域,尤其涉及一种分类模型训练方法及系统。
技术介绍
自动回复是一种目前随处可见的功能,常被用于客服领域,以减少对人力资源的使用。这种方法往往通过预设一些关键词,并对每个关键词设定一个回复内容。当接收到客户发送的咨询内容后,确定客户发送的咨询内容中是否存在预设的关键词,如果有,则对客户推送该关键词对应的回复内容。但此种方法只能应用于关键词较少的情况。对于专业技术要求较高,咨询内容分类比较详细的情况,则可能出现客户咨询内容中出现多个预设关键词的情况,对于这种情况,此种方法无法给客户推送正确的回复内容。
技术实现思路
本专利技术实施例提供了一种分类模型训练方法及系统,能够使训练后的分类模型具有对输入的客户咨询数据进行分类的功能。第一方面,本专利技术实施例提供一种分类模型训练方法,包括:获取多个客户咨询数据,每个所述客户咨询数据均标注有类别标签;将标注有类别标签的所述多个客户咨询数据分别转换为词向量数据;将所述词向量数据输入第一深度模型以本文档来自技高网...

【技术保护点】
1.一种分类模型训练方法,其特征在于,包括:/n获取多个客户咨询数据,每个所述客户咨询数据均标注有类别标签;/n将标注有类别标签的所述多个客户咨询数据分别转换为词向量数据;/n将所述词向量数据输入第一深度模型以对所述第一深度模型进行迭代训练,其中,在迭代训练过程中所述第一深度模型学习所述词向量数据的数据特征,并根据所述数据特征输出对应词向量数据的分类;/n当所述训练模型输出的词向量数据的分类结果的准确率达到预设值时,停止对所述第一深度模型的迭代训练。/n

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,包括:
获取多个客户咨询数据,每个所述客户咨询数据均标注有类别标签;
将标注有类别标签的所述多个客户咨询数据分别转换为词向量数据;
将所述词向量数据输入第一深度模型以对所述第一深度模型进行迭代训练,其中,在迭代训练过程中所述第一深度模型学习所述词向量数据的数据特征,并根据所述数据特征输出对应词向量数据的分类;
当所述训练模型输出的词向量数据的分类结果的准确率达到预设值时,停止对所述第一深度模型的迭代训练。


2.根据权利要求1所述的方法,其特征在于,获取多个客户咨询数据,每个所述客户咨询数据均标注有类别标签,包括:
采用网络爬虫从咨询平台服务器抓取客户咨询数据;
对抓取的客户咨询数据进行预处理,得到有效客户咨询数据;
对有效客户咨询数据标注类别标签。


3.根据权利要求2所述的方法,其特征在于,对抓取的客户咨询数据进行预处理,得到有效客户咨询数据,包括:
确定每个所述客户咨询数据的缺失项;
使用预设数据对每个所述客户咨询数据的缺失项进行填补,得到有效客户咨询数据。


4.根据权利要求2或3所述的方法,其特征在于,对抓取的客户咨询数据进行预处理,得到有效客户咨询数据,包括:
确定每个所述客户咨询数据的噪声项;
对所述客户咨询数据的噪声项进行删除,得到有效客户咨询数据。


5.根据权利要求2所述的方法,其特征在于,将标注有类别标签的所述多个客户咨询数据分别转换为词向量数据,包括:
对所述有效客户咨询数据进行分词处理;
根据分词处理后有效客户咨询数据中的每个词与所述有效客户咨询数据被标注的类别标签的关联性,确定每个有效客户咨询数据中的特征词数据;
根据特征词数据在所述有效客户咨询数据中的分布情况,确定所述特征词数据在该类别有效客户咨询数据中的权重值;
根据各个特征词数据权重值,将分词处理后的有效客户咨询数据转换为对应的词向量数据。<...

【专利技术属性】
技术研发人员:霍小倩
申请(专利权)人:北京紫光展锐通信技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1