会话分类模型的训练方法及装置、会话分类方法及装置制造方法及图纸

技术编号:34292957 阅读:12 留言:0更新日期:2022-07-27 09:56
本发明专利技术公开了一种会话分类模型的训练方法及装置、会话分类方法及装置,该模型训练方法包括:获取训练样本;利用行业词库对样本会话进行切割,得到目标分词;获取与目标分词对应的词向量特征;查询与样本会话对应的订单信息和/或用户信息;采集订单特征和/或用户特征;以词向量特征、订单特征和/或用户特征为输入,类别标签为输出,训练机器学习网络得到会话分类模型。本发明专利技术通过将OTA场景相关的行业词加入词库中,确保了分词的准确性,简化模型的学习难度。同时在文本特征的基础上结合用户特征和订单特征,能对会话内容给予更准确的分类。另外,对不同类型的类别使用不同的网络相比于使用单一网络同时预测多种类型的准确率更高。更高。更高。

【技术实现步骤摘要】
会话分类模型的训练方法及装置、会话分类方法及装置


[0001]本专利技术设计自然语言处理
,特别涉及一种会话分类模型的训练方法及装置、会话分类方法及装置。

技术介绍

[0002]用户访问客服页面后,会首先与智能客服进行对话,当智能客服给出的回答无法解决用户问题时便会接入人工客服,再由人工客服给出专业的解答。用户意图的预测以及充足的人工客服资源将直接影响用户解决问题的效率,从而影响用户的服务体验。
[0003]目前主流的会话分类方法大多只根据会话的文本抽取特征,然后对会话的类别进行预测,由于与OTA(在线旅游社)客服场景相关的文本较少,导致在OTA场景下的客服会话分类结果的准确性较低,从而导致人工客服资源的分配不合理,影响人工客服的工作效率。

技术实现思路

[0004]本专利技术要解决的技术问题是为了克服现有技术中会话分类准确率低的缺陷,提供一种会话分类模型的训练方法及装置、会话分类方法及装置。
[0005]本专利技术是通过下述技术方案来解决上述技术问题:
[0006]根据本专利技术的第一方面,提供一种会话分类模型的训练方法,包括以下步骤:
[0007]获取训练样本,所述训练样本包括样本会话和对应的类别标签;
[0008]利用行业词库对所述样本会话进行切割,得到目标分词,所述行业词库包括若干个与OTA领域对应的分词;
[0009]基于Embedding(词嵌入)方法获取与所述目标分词对应的词向量特征;
[0010]查询与所述样本会话对应的订单信息和/或用户信息;
[0011]从所述订单信息和/或用户信息中采集订单特征和/或用户特征;
[0012]以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型。
[0013]较佳地,所述机器学习网络包括循环神经网络和全连接网络,所述以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型的步骤包括:
[0014]将所述词向量特征输入所述循环神经网络,得到中间输出;
[0015]将所述中间输出、所述订单特征和/或所述用户特征输入所述全连接网络,得到会话分类结果;
[0016]根据所述会话分类结果和所述类别标签训练所述机器学习网络得到所述会话分类模型。
[0017]较佳地,在所述利用行业词典对所述样本会话进行切割的步骤和所述基于Embedding方法获取与所述目标分词对应的词向量特征的步骤之间还包括:
[0018]获取与OTA领域对应的同义词替换库,所述同义词替换库包括若干个标准词和与
所述标准词对应的多个同义词;
[0019]分别判断所述同义词替换库中是否存在与所述目标分词对应的同义词,若存在,则采用对应于所述同义词的标准词去替换所述目标分词;
[0020]过滤掉所述样本会话的特殊字符;
[0021]调整过滤之后的所述样本会话的长度来统一所述样本会话的长度。
[0022]较佳地,所述类别标签包括至少两种不同类型的标签,所述以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型的步骤还包括:
[0023]对于每种类型的标签,分别以所述词向量特征、所述订单特征和/或所述用户特征为输入,以所述标签为输出训练得到对应的会话分类模型;其中,所述类型包括产品和用户行为。
[0024]根据本专利技术的第二方面,提供一种会话分类方法,包括以下步骤:
[0025]获取待分类的客服会话;
[0026]将所述客服会话输入会话分类模型,得到客服会话分类结果,所述会话分类模型通过本专利技术的会话分类模型的训练方法得到。
[0027]较佳地,当训练的所述会话分类模型包括多个时,所述将所述客服会话输入会话分类模型的步骤包括:
[0028]分别将所述客服会话输入多个不同的会话分类模型,得到多个不同的客服会话分类结果。
[0029]根据本专利技术的第三方面,提供一种会话分类模型的训练装置,包括:
[0030]第一获取模块,用于获取训练样本,所述训练样本包括样本会话和对应的类别标签;
[0031]分割模块,用于利用行业词库对所述样本会话进行切割,得到目标分词,所述行业词库包括若干个与OTA领域对应的分词;
[0032]第二获取模块,用于基于Embedding方法获取与所述目标分词对应的词向量特征;
[0033]查询模块,用于查询与所述样本会话对应的订单信息和/或用户信息;
[0034]采集模块,用于从所述订单信息和/或用户信息中采集订单特征和/或用户特征;
[0035]训练模块,用于以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型。
[0036]根据本专利技术的第四方面,提供一种会话分类装置,包括:
[0037]会话获取模块,用于获取待分类的客服会话;
[0038]会话分类模块,用于将所述客服会话输入会话分类模型,得到客服会话分类结果,所述会话分类模型通过本专利技术的会话分类模型的训练装置得到。
[0039]根据本专利技术的第五方面,提供一种电子设备,包括存储器以及与所述存储器连接的处理器,所述处理器执行存储在所述存储器上的计算机程序时实现本专利技术的会话分类模型的训练方法或者本专利技术的会话分类方法。
[0040]根据本专利技术的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术的会话分类模型的训练方法或者本专利技术的会话分类方法。
[0041]本专利技术的积极进步效果在于:
[0042]通过将较为专业的OTA场景相关的行业词加入词库中,确保了分词的准确性,从而简化模型的学习难度。同时在训练中对基础的网络模型进行改进,在会话的文本特征的基础上结合用户特征和订单特征,能更好地识别出会话对应的类别,从而对客服与用户的会话内容给予准确的分类。另外,对不同类型的类别使用不同的网络相比于使用单一网络同时预测多种类型的准确率更高,两个网络可以并行计算。
附图说明
[0043]图1为本专利技术实施例1的会话分类模型的训练方法的流程示意图。
[0044]图2为本专利技术实施例1的会话分类模型的训练方法的框架示意图。
[0045]图3为本专利技术实施例2的会话分类模型的训练方法的框架示意图。
[0046]图4为本专利技术实施例3的会话分类方法的流程示意图。
[0047]图5为本专利技术实施例5的会话分类模型的训练装置的结构示意图。
[0048]图6为本专利技术实施例7的会话分类装置的结构示意图。
[0049]图7为本专利技术实施例9的电子设备的结构示意图。
具体实施方式
[0050]下面通过实施例的方式进一步说明本专利技术,但并不因此将本专利技术限制在所述的实施例范本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种会话分类模型的训练方法,其特征在于,包括以下步骤:获取训练样本,所述训练样本包括样本会话和对应的类别标签;利用行业词库对所述样本会话进行切割,得到目标分词,所述行业词库包括若干个与OTA领域对应的分词;基于Embedding方法获取与所述目标分词对应的词向量特征;查询与所述样本会话对应的订单信息和/或用户信息;从所述订单信息和/或用户信息中采集订单特征和/或用户特征;以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型。2.根据权利要求1所述的会话分类模型的训练方法,其特征在于,所述机器学习网络包括循环神经网络和全连接网络,所述以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型的步骤包括:将所述词向量特征输入所述循环神经网络,得到中间输出;将所述中间输出、所述订单特征和/或所述用户特征输入所述全连接网络,得到会话分类结果;根据所述会话分类结果和所述类别标签训练所述机器学习网络得到所述会话分类模型。3.根据权利要求1所述的会话分类模型的训练方法,其特征在于,在所述利用行业词典对所述样本会话进行切割的步骤和所述基于Embedding方法获取与所述目标分词对应的词向量特征的步骤之间还包括:获取与OTA领域对应的同义词替换库,所述同义词替换库包括若干个标准词和与所述标准词对应的多个同义词;分别判断所述同义词替换库中是否存在与所述目标分词对应的同义词,若存在,则采用对应于所述同义词的标准词去替换所述目标分词;过滤掉所述样本会话的特殊字符;调整过滤之后的所述样本会话的长度来统一所述样本会话的长度。4.根据权利要求1所述的会话分类模型的训练方法,其特征在于,所述类别标签包括至少两种不同类型的标签,所述以所述词向量特征、所述订单特征和/或所述用户特征为输入,所述类别标签为输出,训练机器学习网络得到所述会话分类模型的步骤还包括:对于每种类型的标签,分别以所述词向量特征、所述订单特征和/或所述用户特征为输入,以所述标签为输出训练得到对应的会话分类模型;其中,所述类...

【专利技术属性】
技术研发人员:王颢张振华聂强强曹喆岫
申请(专利权)人:携程旅游网络技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1