用于客服问答的数据处理方法及装置制造方法及图纸

技术编号:23343580 阅读:20 留言:0更新日期:2020-02-15 03:57
本申请公开了一种用于客服问答的数据处理方法及装置。该方法包括:将历史问答数据输入预训练模型进行预训练,以提取特征向量,所述历史问答数据是指用户端与客服端的历史问答数据;基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型;基于所述问题分类模型对所述用户端输入的问题进行分类,以得到与所述问题对应的答案;将所述答案反馈至所述用户端。本申请解决了相关技术中客服问答的匹配方法由于模型训练流程复杂导致匹配效率较低的技术问题。通过本申请,达到了简化模型训练过程的目的,从而实现了提高客服问答匹配效率的技术效果。

Data processing method and device for customer service Q & A

【技术实现步骤摘要】
用于客服问答的数据处理方法及装置
本申请涉及自然语言处理
,具体而言,涉及一种用于客服问答的数据处理方法及装置。
技术介绍
随着互联网的发展,网站常常面临着巨大的用户咨询压力,传统人工客服存在响应慢、服务时间有限、流动性大等局限性。大部分客服问题其实是高频重复问题,这些问题往往都有标准的答案,可以利用机器去解决,通过构建一套智能客服系统去自动匹配用户的提问,当用户对答案不满意时,可以再寻求人工客服的帮助,这不仅提升了用户体验也提高了客服人员的工作效率。相关技术中的智能客服系统匹配客服问答的方法是对用户输入的问题做处理,如分词、抽取关键词、同义词扩展、计算句子向量等,然后基于向量相似度匹配出一个问题集合,从问题集合中挑出最相似的那个问题,将这个问题对应的答案返回给用户。专利技术人发现,相关技术中客服问答的匹配方法至少存在如下问题:1)匹配问题的模型训练流程复杂,需要消耗的时间长;2)匹配问题的在线系统需要单独开发,模型对接过程复杂,支持并发访问量少。针对相关技术中客服问答的匹配方法由于模型训练流程复杂导致匹配效率较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种用于客服问答的数据处理方法及装置,以解决相关技术中客服问答的匹配方法由于模型训练流程复杂导致匹配效率较低的问题。为了实现上述目的,根据本申请的一个方面,提供了一种用于客服问答的数据处理方法。根据本申请的用于客服问答的数据处理方法包括:将历史问答数据输入预训练模型进行预训练,以提取特征向量,所述历史问答数据是指用户端与客服端的历史问答数据;基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型;基于所述问题分类模型对所述用户端输入的问题进行分类,以得到与所述问题对应的答案;将所述答案反馈至所述用户端。进一步地,所述将历史问答数据输入预训练模型进行预训练,以提取特征向量包括:确定所述历史问答数据的分类标签;根据所述历史问答数据的分类标签对所述历史问答数据进行数据标注;将标注后的历史问答数据按照预设格式存储至数据库中。进一步地,所述基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型之后包括:获取所述用户端输入的问题数据;根据预设规则对所述问题数据进行编码,以得到向量数据;将所述向量数据作为参数输入所述问题分类模型进行预判,以输出所述问题数据属于每个问题类别的概率;根据所述问题数据属于每个问题类别的概率确定与所述问题类别对应的答案,并将所述答案返回至所述用户端。进一步地,所述基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型之后包括:获取所述用户端的提问请求;将所述提问请求中的问题数据输入所述问题分类模型,以得到问题分类结果;根据所述问题分类结果确定与所述用户端的提问请求相对应的客服端回复结果。进一步地,所述基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型之后包括:按照预设规则配置监听端口;通过所述监听端口接收所述用户端的提问请求。为了实现上述目的,根据本申请的另一方面,提供了一种用于客服问答的数据处理装置。根据本申请的用于客服问答的数据处理装置包括:训练模块,用于将历史问答数据输入预训练模型进行预训练,以提取特征向量,所述历史问答数据是指用户端与客服端的历史问答数据;调整模块,用于基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型;分类模块,用于基于所述问题分类模型对所述用户端输入的问题进行分类,以得到与所述问题对应的答案;反馈模块,用于将所述答案反馈至所述用户端。进一步地,所述训练模块包括:确定单元,用于确定所述历史问答数据的分类标签;标注单元,用于根据所述历史问答数据的分类标签对所述历史问答数据进行数据标注;存储单元,用于将标注后的历史问答数据按照预设格式存储至数据库中。进一步地,所述装置还包括:第一获取模块,用于获取所述用户端输入的问题数据;编码模块,用于根据预设规则对所述问题数据进行编码,以得到向量数据;预判模块,用于将所述向量数据作为参数输入所述问题分类模型进行预判,以输出所述问题数据属于每个问题类别的概率;第一确定模块,用于根据所述问题数据属于每个问题类别的概率确定与所述问题类别对应的答案,并将所述答案返回至所述用户端。进一步地,所述装置还包括:第二获取模块,用于获取所述用户端的提问请求;输入模块,用于将所述提问请求中的问题数据输入所述问题分类模型,以得到问题分类结果;第二确定模块,用于根据所述问题分类结果确定与所述用户端的提问请求相对应的客服端回复结果。进一步地,所述装置还包括:监听模块,用于按照预设规则配置监听端口;接收模块,用于通过所述监听端口接收所述用户端的提问请求。在本申请实施例中,采用将历史问答数据输入预训练模型进行预训练,以提取特征向量,基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型的方式,通过基于所述问题分类模型对所述用户端输入的问题进行分类,以得到与所述问题对应的答案,并将所述答案反馈至所述用户端,达到了简化模型训练过程的目的,从而实现了提高客服问答匹配效率的技术效果,进而解决了相关技术中客服问答的匹配方法由于模型训练流程复杂导致匹配效率较低的技术问题。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请第一实施例的用于客服问答的数据处理方法的流程示意图;图2是根据本申请第二实施例的用于客服问答的数据处理方法的流程示意图;图3是根据本申请第三实施例的用于客服问答的数据处理方法的流程示意图;图4是根据本申请第四实施例的用于客服问答的数据处理方法的流程示意图;图5是根据本申请第五实施例的用于客服问答的数据处理方法的流程示意图;图6是根据本申请第一实施例的用于客服问答的数据处理装置的组成结构示意图;图7是根据本申请第二实施例的用于客服问答的数据处理装置的组成结构示意图;图8是根据本申请第三实施例的用于客服问答的数据处理装置的组成结构示意图;以及图9是根据本申请第四实施例的用于客服问答的数据处理装置的组成结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”本文档来自技高网
...

【技术保护点】
1.一种用于客服问答的数据处理方法,其特征在于,包括:/n将历史问答数据输入预训练模型进行预训练,以提取特征向量,所述历史问答数据是指用户端与客服端的历史问答数据;/n基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型;/n基于所述问题分类模型对所述用户端输入的问题进行分类,以得到与所述问题对应的答案;/n将所述答案反馈至所述用户端。/n

【技术特征摘要】
1.一种用于客服问答的数据处理方法,其特征在于,包括:
将历史问答数据输入预训练模型进行预训练,以提取特征向量,所述历史问答数据是指用户端与客服端的历史问答数据;
基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型;
基于所述问题分类模型对所述用户端输入的问题进行分类,以得到与所述问题对应的答案;
将所述答案反馈至所述用户端。


2.根据权利要求1所述的用于客服问答的数据处理方法,其特征在于,所述将历史问答数据输入预训练模型进行预训练,以提取特征向量包括:
确定所述历史问答数据的分类标签;
根据所述历史问答数据的分类标签对所述历史问答数据进行数据标注;
将标注后的历史问答数据按照预设格式存储至数据库中。


3.根据权利要求1所述的用于客服问答的数据处理方法,其特征在于,所述基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型之后包括:
获取所述用户端输入的问题数据;
根据预设规则对所述问题数据进行编码,以得到向量数据;
将所述向量数据作为参数输入所述问题分类模型进行预判,以输出所述问题数据属于每个问题类别的概率;
根据所述问题数据属于每个问题类别的概率确定与所述问题类别对应的答案,并将所述答案返回至所述用户端。


4.根据权利要求1所述的用于客服问答的数据处理方法,其特征在于,所述基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型之后包括:
获取所述用户端的提问请求;
将所述提问请求中的问题数据输入所述问题分类模型,以得到问题分类结果;
根据所述问题分类结果确定与所述用户端的提问请求相对应的客服端回复结果。


5.根据权利要求1所述的用于客服问答的数据处理方法,其特征在于,所述基于所述特征向量对所述预训练模型进行调整,以得到问题分类模型之后包括:
按照预设规则配置监听端口;
通过所述监听端口接收所述用户端的提问请求。
<...

【专利技术属性】
技术研发人员:徐涛吴峰郭伟
申请(专利权)人:上海易点时空网络有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1