基于机器学习的用于在线客服的工单生成方法技术

技术编号:23100181 阅读:65 留言:0更新日期:2020-01-14 20:48
本发明专利技术涉及基于机器学习的用于在线客服的工单生成方法,包括:A.从大数据量的用户和在线客服的文字通话记录中,根据数据字段提取每条文字通话记录中相应的文本内容;B.将提取的文本内容通过机器学习算法来训练分类器,生成分类模型,分类模型能够通过输入的信息判断该信息所对应的咨询类型;C.用户和在线客服的文字通话结束后,通过文本摘取算法提取本次文字通话记录中用户的核心问题和在线客服答复的核心答案;D.将核心问题和核心答案输入分类模型中,得到对应的咨询类型;E.根据核心问题、核心答案和咨询类型,生成工单。本发明专利技术能够根据聊天记录自动处理,并快速创建工单,大幅度提高了在线客服的工作效率,减少了工作量。

【技术实现步骤摘要】
基于机器学习的用于在线客服的工单生成方法
本专利技术涉及工单自动生成的方法,具体讲是基于机器学习的用于在线客服的工单生成方法。
技术介绍
在客服领域,在线客服通常指的是在互联网上通过文字方式与用户沟通对话的客服。在目前的在线客服领域,客服人员处理完与客户的会话后,会手动创建一个工单,该工单主要概括当前会话的主要内容并存档,以便后续使用。在这个过程中,客服人员需要重新浏览之前的聊天记录以做出概括,并且记录聊天记录中的关键信息,如用户名、银行卡号、电话号码等重要信息,并概括出聊天记录中的主要内容,登记到不同咨询类型(如订单,物流,退换货等)中。处理完整个流程往往需要多次浏览聊天记录,并且很明显这是一个非常耗时且效率极低、极易出错的过程。
技术实现思路
本专利技术提供了一种基于机器学习的用于在线客服的工单生成方法,以能够自动对聊天记录进行处理,并快速创建工单,提高在线客服的资源利用率和工作效率。本专利技术基于机器学习的用于在线客服的工单生成方法,包括:A.从大数据量的用户和在线客服的文字通话记录中,根据需要的数据字段提取每条文字通话记录中相应的文本内容;B.将提取的文本内容通过机器学习算法来训练分类器,生成分类模型,分类模型能够通过输入的信息判断该信息所对应的咨询类型;C.用户和在线客服的一次文字通话结束后,通过文本摘取算法提取出本次文字通话记录中用户的核心问题和在线客服答复的核心答案;D.将所述的核心问题和核心答案输入所述的分类模型中,得到对应的咨询类型;>E.根据核心问题、核心答案和咨询类型,生成工单。本专利技术充分利用了机器学习和自然语言处理技术将人工操作过程进行了智能化处理,极大的提高了在线客服的工作效率,降低了工作量。进一步的,步骤A中还包括,定义并保存与业务相关的所有咨询类型,例如:贷款申请、偿还贷款、贷款利息、存款利息、征信问题等。具体的,步骤B中通过机器学习算法来训练分类器,步骤包括:B1.对提取的文本内容进行数据清洗;B2.通过分词工具(例如jieba分词软件)对数据清洗后的文本内容进行分词,并将分词文本通过embedding算法转化为词向量,并将词向量的长度通过填充符填充至允许的最大长度;B3.将所有词向量输入神经网络,通过反向传播算法进行判断咨询类型的训练;B4.训练完成后,保存对验证集数据判断准确性最高的分类模型。通过分类模型,无论输入用户的咨询问题,还是在线客服的回复答案,都能够得到对应的咨询分类,以及每种咨询分类对应的准确性分数。进一步的,步骤B1所述的数据清洗,包括对提取的文本内容进行错别字更正和删除停止词。所述的停止词包括语气词、标点符号等。具体的,步骤C中,在通过文本摘取算法提取核心问题和核心答案之前,包括通过文本摘取算法训练提取模型,步骤为:C1.对训练集中的一次文字通话记录进行数据清洗,包括对文字纠错、去掉欢迎语和表情符号及结束语等;C2.对数据清洗后的文字通话记录人工标注其中的核心问题和核心答案;C3.通过分词工具对核心问题和核心答案进行分词,并将得到的分词文本通过embedding算法转化为核心问题词向量和核心答案词向量;C4.通过基于双向循环神经网络的编码器对核心问题词向量和核心答案词向量进行编码;C5.将编码器每个时刻的输出向量,按用户问题及客服答案分成两部分,将用户问题及客服答案分别通过softmax函数进行咨询类型的分类,并提取出编码器判断的核心问题及核心答案;C6.根据损失函数调整所述的双向循环神经网络,通过多次迭代得到在验证集里准确率最高的提取模型。具体的,步骤D中,将步骤C提取的核心问题和核心答案分别输入到所述的分类模型中,分别获得核心问题对应的咨询分类及分类准确性分数,以及核心答案对应的咨询分类及分类准确性分数;将分类准确性分数高的咨询分类确定为本次文字通话最终的咨询分类。本专利技术的基于机器学习的用于在线客服的工单生成方法,能够根据聊天记录自动处理,并快速创建工单,大幅度提高了在线客服的工作效率,减少了工作量。以下结合实施例的具体实施方式,对本专利技术的上述内容再作进一步的详细说明。但不应将此理解为本专利技术上述主题的范围仅限于以下的实例。在不脱离本专利技术上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本专利技术的范围内。附图说明图1为本专利技术基于机器学习的用于在线客服的工单生成方法的流程图。具体实施方式如图1所示本专利技术基于机器学习的用于在线客服的工单生成方法,包括:A.从大数据量(例如10万条数据量)的用户和在线客服的文字通话记录中,根据需要的数据字段提取每条文字通话记录中相应的文本内容。所述的数据字段至少包括:会话ID、消息ID、发送时间、发送方标识、发送方ID、消息内容等。定义并保存与业务相关的所有咨询类型,例如:贷款申请、偿还贷款、贷款利息、存款利息、征信问题等。B.将提取的文本内容通过机器学习算法来训练分类器,生成分类模型:B1.对提取的文本内容进行数据清洗,包括对提取的文本内容进行错别字更正和删除停止词。所述的停止词包括语气词、标点符号等。B2.通过分词工具(例如jieba分词软件)对数据清洗后的文本内容进行分词,并将分词文本通过embedding算法转化为词向量,并将词向量的长度通过填充符填充至允许的最大长度。B3.将所有词向量输入神经网络,通过反向传播算法进行判断咨询类型的训练。B4.训练完成后,保存对验证集数据判断准确性最高的分类模型。通过分类模型,无论输入用户的咨询问题,还是在线客服的回复答案,都能够得到对应的咨询分类,以及每种咨询分类对应的准确性分数。C.通过文本摘取算法训练提取模型,通过提取模型对文字通话记录中的核心问题和核心答案进行提取的提取模型,步骤为:C1.对训练集中的一次文字通话记录进行数据清洗,包括对文字纠错、去掉欢迎语和表情符号及结束语等;C2.对数据清洗后的文字通话记录人工标注其中的核心问题和核心答案;C3.通过分词工具对核心问题和核心答案进行分词,并将得到的分词文本通过embedding算法转化为核心问题词向量和核心答案词向量;C4.通过基于双向循环神经网络的编码器对核心问题词向量和核心答案词向量进行编码;C5.将编码器每个时刻的输出向量,按用户问题及客服答案分成两部分,将用户问题及客服答案分别通过softmax函数进行咨询类型的分类,并提取出编码器判断的核心问题及核心答案;C6.根据损失函数调整所述的双向循环神经网络,通过多次迭代得到在验证集里准确率最高的提取模型。需要咨询的用户打开咨询页面,与在线客服建立连接后,便生成了一个会话ID。当用户发送消息内容给在线客服时,会附带上会话ID、发送方ID(用户ID),以及标识该发送方是用户的标识信息,消息内容到达服务后台会生成本文档来自技高网...

【技术保护点】
1.基于机器学习的用于在线客服的工单生成方法,其特征包括:/nA.从大数据量的用户和在线客服的文字通话记录中,根据需要的数据字段提取每条文字通话记录中相应的文本内容;/nB.将提取的文本内容通过机器学习算法来训练分类器,生成分类模型,分类模型能够通过输入的信息判断该信息所对应的咨询类型;/nC.用户和在线客服的一次文字通话结束后,通过文本摘取算法提取出本次文字通话记录中用户的核心问题和在线客服答复的核心答案;/nD.将所述的核心问题和核心答案输入所述的分类模型中,得到对应的咨询类型;/nE.根据核心问题、核心答案和咨询类型,生成工单。/n

【技术特征摘要】
1.基于机器学习的用于在线客服的工单生成方法,其特征包括:
A.从大数据量的用户和在线客服的文字通话记录中,根据需要的数据字段提取每条文字通话记录中相应的文本内容;
B.将提取的文本内容通过机器学习算法来训练分类器,生成分类模型,分类模型能够通过输入的信息判断该信息所对应的咨询类型;
C.用户和在线客服的一次文字通话结束后,通过文本摘取算法提取出本次文字通话记录中用户的核心问题和在线客服答复的核心答案;
D.将所述的核心问题和核心答案输入所述的分类模型中,得到对应的咨询类型;
E.根据核心问题、核心答案和咨询类型,生成工单。


2.如权利要求1所述的基于机器学习的用于在线客服的工单生成方法,其特征为:步骤A中还包括,定义并保存与业务相关的所有咨询类型。


3.如权利要求1所述的基于机器学习的用于在线客服的工单生成方法,其特征为:步骤B中通过机器学习算法来训练分类器,步骤包括:
B1.对提取的文本内容进行数据清洗;
B2.通过分词工具对数据清洗后的文本内容进行分词,并将分词文本通过embedding算法转化为词向量,并将词向量的长度通过填充符填充至允许的最大长度;
B3.将所有词向量输入神经网络,通过反向传播算法进行判断咨询类型的训练;
B4.训练完成后,保存对验证集数据判断准确性最高的分类模型。


4.如权利要求3所述的基于机器学习的...

【专利技术属性】
技术研发人员:白铖谢世茂
申请(专利权)人:四川新网银行股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1