会话分类模型的训练方法及装置、会话分类方法及装置制造方法及图纸

技术编号：34292957 阅读：12 留言：0更新日期：2022-07-27 09:56

本发明专利技术公开了一种会话分类模型的训练方法及装置、会话分类方法及装置，该模型训练方法包括：获取训练样本；利用行业词库对样本会话进行切割，得到目标分词；获取与目标分词对应的词向量特征；查询与样本会话对应的订单信息和/或用户信息；采集订单特征和/或用户特征；以词向量特征、订单特征和/或用户特征为输入，类别标签为输出，训练机器学习网络得到会话分类模型。本发明专利技术通过将OTA场景相关的行业词加入词库中，确保了分词的准确性，简化模型的学习难度。同时在文本特征的基础上结合用户特征和订单特征，能对会话内容给予更准确的分类。另外，对不同类型的类别使用不同的网络相比于使用单一网络同时预测多种类型的准确率更高。更高。更高。

全部详细技术资料下载

【技术实现步骤摘要】
会话分类模型的训练方法及装置、会话分类方法及装置

[0001]本专利技术设计自然语言处理
，特别涉及一种会话分类模型的训练方法及装置、会话分类方法及装置。

技术介绍

[0002]用户访问客服页面后，会首先与智能客服进行对话，当智能客服给出的回答无法解决用户问题时便会接入人工客服，再由人工客服给出专业的解答。用户意图的预测以及充足的人工客服资源将直接影响用户解决问题的效率，从而影响用户的服务体验。
[0003]目前主流的会话分类方法大多只根据会话的文本抽取特征，然后对会话的类别进行预测，由于与OTA(在线旅游社)客服场景相关的文本较少，导致在OTA场景下的客服会话分类结果的准确性较低，从而导致人工客服资源的分配不合理，影响人工客服的工作效率。

技术实现思路

[0004]本专利技术要解决的技术问题是为了克服现有技术中会话分类准确率低的缺陷，提供一种会话分类模型的训练方法及装置、会话分类方法及装置。
[0005]本专利技术是通过下述技术方案来解决上述技术问题：
[0006]根据本专利技术的第一方面，提供一种会话分类模型的训练方法，包括以下步骤：
[0007]获取训练样本，所述训练样本包括样本会话和对应的类别标签；
[0008]利用行业词库对所述样本会话进行切割，得到目标分词，所述行业词库包括若干个与OTA领域对应的分词；
[0009]基于Embedding(词嵌入)方法获取与所述目标分词对应的词向量特征；
[0010]查询与所述样本会话对应的订单...

【技术保护点】

【技术特征摘要】
1.一种会话分类模型的训练方法，其特征在于，包括以下步骤：获取训练样本，所述训练样本包括样本会话和对应的类别标签；利用行业词库对所述样本会话进行切割，得到目标分词，所述行业词库包括若干个与OTA领域对应的分词；基于Embedding方法获取与所述目标分词对应的词向量特征；查询与所述样本会话对应的订单信息和/或用户信息；从所述订单信息和/或用户信息中采集订单特征和/或用户特征；以所述词向量特征、所述订单特征和/或所述用户特征为输入，所述类别标签为输出，训练机器学习网络得到所述会话分类模型。2.根据权利要求1所述的会话分类模型的训练方法，其特征在于，所述机器学习网络包括循环神经网络和全连接网络，所述以所述词向量特征、所述订单特征和/或所述用户特征为输入，所述类别标签为输出，训练机器学习网络得到所述会话分类模型的步骤包括：将所述词向量特征输入所述循环神经网络，得到中间输出；将所述中间输出、所述订单特征和/或所述用户特征输入所述全连接网络，得到会话分类结果；根据所述会话分类结果和所述类别标签训练所述机器学习网络得到所述会话分类模型。3.根据权利要求1所述的会话分类模型的训练方法，其特征在于，在所述利用行业词典对所述样本会话进行切割的步骤和所述基于Embedding方法获取与所述目标分词对应的词向量特征的步骤之间还包括：获取与OTA领域对应的同义词替换库，所述同义词替换库包括若干个标准词和与所述标准词对应的多个同义词；分别判断所述同义词替换库中是否存在与所述目标分词对应的同义词，若存在，则采用对应于所述同义词的标准词去替换所述目标分词；过滤掉所述样本会话的特殊字符；调整过滤之后的所述样本会话的长度来统一所述样本会话的长度。4.根据权利要求1所述的会话分类模型的训练方法，其特征在于，所述类别标签包括至少两种不同类型的标签，所述以所述词向量特征、所述订单特征和/或所述用户特征为输入，所述类别标签为输出，训练机器学习网络得到所述会话分类模型的步骤还包括：对于每种类型的标签，分别以所述词向量特征、所述订单特征和/或所述用户特征为输入，以所述标签为输出训练得到对应的会话分类模型；其中，所述类...

【专利技术属性】
技术研发人员：王颢，张振华，聂强强，曹喆岫，
申请(专利权)人：携程旅游网络技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人