对问题描述信息进行分类的方法及装置制造方法及图纸

技术编号:24168999 阅读:31 留言:0更新日期:2020-05-16 02:20
本说明书实施例中提供了一种对问题描述信息进行分类的方法及装置,方法包括:首先对用户提供的问题描述信息进行分词处理以得到词序列,并通过BERT模型分析该词序列以得到编码向量序列,其中,该编码向量序列中的各个编码向量与该词序列中的各个词一一对应;接着通过第一深度神经网络分析该编码向量序列以得到第一特征向量。同时,还可以获取用于指示该用户的账户状态的至少两项账户状态描述信息,并对至少两项账户状态描述信息进行特征提取以得到第二特征向量。之后,即可根据第一特征向量和第二特征向量确定问题描述信息对应的分类类别。

Method and device for classifying problem description information

【技术实现步骤摘要】
对问题描述信息进行分类的方法及装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及对问题描述信息进行分类的方法及装置。
技术介绍
通过智能客服机器人与用户进行智能问答或者为用户指定人工客服的过程中,往往会针对用户提供的问题描述信息,执行相应的分类处理过程以确定该问题描述信息对应的分类类别。通常的,分类类别可以是预先设置的标准问题,也可以是某个人工客服技能组的标识,以便向用户提供该标准问题对应的标准答案,或者为用户指定属于该标识所指示的人工客服技能组中的人工客服,使得指定的人工客服与用户进行进一步的对话,从而解决用户存在的问题。因此,希望有一种新的技术方案,以期能够更为准确的确定用户提供的问题描述信息对应的分类类别。
技术实现思路
本说明书一个或多个实施例中提供了一种对问题描述信息进行分类的方法及装置,能够更为准确的确定用户提供的问题描述信息对应的分类类别。第一方面,提供了一种对对问题描述信息进行分类的方法,该方法包括:对用户提供的问题描述信息进行分词处理,得到词序列;r>通过BERT模型本文档来自技高网...

【技术保护点】
1.一种对问题描述信息进行分类的方法,所述方法包括:/n对用户提供的问题描述信息进行分词处理,得到词序列;/n通过BERT模型分析所述词序列,得到编码向量序列,所述编码向量序列中的各个编码向量与所述词序列中的各个词一一对应;/n通过第一深度神经网络DNN分析所述编码向量序列,得到第一特征向量;/n获取用于指示所述用户的账户状态的至少两项账户状态描述信息,并对所述至少两项账户状态描述信息进行特征提取,得到第二特征向量;/n至少根据所述第一特征向量和所述第二特征向量,确定所述问题描述信息对应的分类类别。/n

【技术特征摘要】
1.一种对问题描述信息进行分类的方法,所述方法包括:
对用户提供的问题描述信息进行分词处理,得到词序列;
通过BERT模型分析所述词序列,得到编码向量序列,所述编码向量序列中的各个编码向量与所述词序列中的各个词一一对应;
通过第一深度神经网络DNN分析所述编码向量序列,得到第一特征向量;
获取用于指示所述用户的账户状态的至少两项账户状态描述信息,并对所述至少两项账户状态描述信息进行特征提取,得到第二特征向量;
至少根据所述第一特征向量和所述第二特征向量,确定所述问题描述信息对应的分类类别。


2.根据权利要求1所述的方法,其中,所述分类类别包括标准问题或人工客服技能组的标识。


3.根据权利要求1所述的方法,其中,所述至少两项账户状态描述信息包括:账户是否被锁定、借款额度、是否存在逾期还款中的至少两项。


4.根据权利要求1所述的方法,其中,
所述问题描述信息包括所述用户向智能客服机器人提供的用户问句;
或者,所述问题描述信息包括所述用户与智能客服机器人进行多轮对话的过程中,向所述智能客服机器人提供的用户问句以及与所述用户问句相关的应答信息。


5.根据权利要求1所述的方法,其中,所述对所述至少两项账户状态描述信息进行特征提取,得到第二特征向量,包括:
针对各项所述账户状态描述信息中属于离散型的第一账户状态描述信息,对所述第一账户状态描述信息进行独热编码,得到所述第一账户状态描述信息对应的第一编码;
针对各项所述账户状态描述信息中属于连续型的第二账户状态描述信息,对所述第二账户状态描述信息进行归一化处理,并根据归一化处理的结果得到第二编码;
形成由各项所述账户状态描述信息对应的第一编码或第二编码组成的编码序列;
通过第二DNN分析所述编码序列,得到第二特征向量。


6.根据权利要求1至5中任一所述的方法,其中,所述方法还包括:
获取用于指示所述用户的行为轨迹的历史行为描述信息序列,并对所述历史行为描述信息序列中的各项历史行为描述信息进行特征提取,得到第三特征向量;
所述至少根据所述第一特征向量和所述第二特征向量,确定所述问题描述信息对应的分类类别,包括:根据所述第一特征向量、所述第二特征向量和所述第三特征向量,确定所述问题描述信息对应的分类类别。


7.根据权利要求6所述的方法,其中,所述根据所述第一特征向量、所述第二特征向量和所述第三特征向量,确定所述问题描述信息对应的分类类别,包括:
拼接所述第一特征向量、所述第二特征向量和所述第三特征向量,得到综合向量;
通过分类器分析所述综合向量,得到所述问题描述信息对应的分类类别。


8.根据权利要求6所述的方法,其中,各项所述历史行为描述信息中的任意一项历史行为描述信息,指示了所述用户点击的服务、查询的信息、收到的提示以及求助的类型中的任意一项。


9.根据权利要求6所述的方法,其中,所述对所述历史行为描述信息序列中的各项历史行为描述信息进行特征提取,得到第三特征向量,包括:
确定所述历史行为描述信息序列中的各项历史行为描述信息分别对应的表示向量,并利用各个所述表示向量组成表示向量序列;
通过预置的特征提取模型分析所述表示向量序列,得到第三特征向量。


10.根据权利要求9所述的方法,其中,所述特征提取模型包括循环神经网络RNN、长短期记忆网络LSTM或门控循环单元GRU。


11.一种对问题描述信息进行分类的装置,所述装置包括:
分词处理单元,用于对用户提供的问题描述信息进行...

【专利技术属性】
技术研发人员:龙翀
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1