人工智能客服机器人的问题解答方法及系统技术方案

技术编号:16175758 阅读:31 留言:0更新日期:2017-09-09 02:59
本发明专利技术公开了一种人工智能客服机器人的问题解答方法及系统,所述问题解答系统包括问题输入模块、特征提取模块、类型输出模块、类型查询模块、解答匹配模块及解答输出模块;问题输入模块接收整段问题信息,特征提取模块通过进行多卷积提取若干个主要特征信息,还通过进行下采样处理提取若干个目标特征信息,类型输出模块输出问题类型信息,类型查询模块查询对应类型的语料库,解答匹配模块提取问题序列文本信息及若干个解答序列文本信息,并且进行匹配,生成相似度列表,解答输出模块输出对应的解答信息。本发明专利技术极大地提高了人工智能客服机器人的解答准确率,降低了语料库的维护成本,从而提高了用户体验度。

【技术实现步骤摘要】
人工智能客服机器人的问题解答方法及系统
本专利技术涉及人工智能领域,特别涉及一种人工智能客服机器人的问题解答方法及系统。
技术介绍
目前,最广泛的客服聊天机器人,使用了传统NLP(NatureLanguageProcessing,自然语言处理)技术,对问题进行关键字提取,然后进行聚类,并在答案集合中进行匹配。在匹配的结果中,进行短文本相似度计算,针对每个候选答案给出一个分值,排序后取前N个返回给用户。由于语言表达的多样性、语义理解的困惑度,特别是中文的歧义等现象非常常见,导致了NLP技术的解答准确率比较低,而且由于自然语言处理中的上下文复杂性,这种技术的解答准确率是受到严重限制的。同时这种技术的语料库的维护成本相当高,需要人工给出很多的标注,对词的聚类也需要投入大量的人工,因此在企业实际应用中,在企业和用户两方面都没有得到很好的反馈。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中客服聊天机器人使用的NLP技术解答准确率低,语料库的维护成本高,导致用户体验度低的缺陷,提供一种人工智能客服机器人的问题解答方法及系统。本专利技术是通过下述技术方案来解决上述技术问题:一种人工智能客服机器人的问题解答方法,其特点在于,所述问题解答方法包括以下步骤:S1、接收整段问题信息,对所述整段问题信息进行多卷积,并且提取若干个主要特征信息;S2、对若干个主要特征信息进行下采样处理,并且从若干个主要特征信息提取若干个目标特征信息;S3、根据若干个目标特征信息并基于人工智能分类算法输出问题类型信息;S4、根据所述问题类型信息查询对应类型的语料库;S5、从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息,将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配,并且生成相似度列表,所述相似度列表用于表征所述问题序列文本信息分别与若干个解答序列文本信息之间的相似度;S6、输出所述相似度列表中相似度最高的解答序列文本信息所对应的解答信息。较佳地,在步骤S1中,基于CNN(ConvolutionalNeuralNetwork,卷积神经网络)模型对所述整段文本信息进行多卷积,并且提取若干个主要特征信息;在步骤S3中,所述人工智能分类算法为softmax算法(机器学习算法)。较佳地,在步骤S5中,基于Bi-LSTM模型(双向长短时记忆模型)及CNN模型,从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息。较佳地,在步骤S5中,采用Cosine(余弦)算法将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配。较佳地,在步骤S5中,生成所述相似度列表之后,对所述相似度列表中的若干个解答序列文本信息以相似度从高到低的顺序进行排列,并且选取前五个解答序列文本信息;在步骤S6中,输出前五个解答序列文本信息中相似度最高的解答序列文本信息所对应的解答信息,还分别输出其余四个解答序列文本信息所对应的解答信息对应的问题信息。一种人工智能客服机器人的问题解答系统,其特点在于,所述问题解答系统包括问题输入模块、特征提取模块、类型输出模块、类型查询模块、解答匹配模块及解答输出模块;所述问题输入模块用于接收整段问题信息,并且将所述整段问题信息发送至所述特征提取模块;所述特征提取模块用于对所述整段问题信息进行多卷积,并且提取若干个主要特征信息,所述特征提取模块还用于对若干个主要特征信息进行下采样处理,并且从若干个主要特征信息提取若干个目标特征信息,所述特征提取模块还用于将若干个目标特征信息发送至所述类型输出模块;所述类型输出模块用于根据若干个目标特征信息并基于人工智能分类算法输出问题类型信息;所述类型查询模块用于根据所述问题类型信息查询对应类型的语料库;所述解答匹配模块用于从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息,将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配,并且生成相似度列表,所述相似度列表用于表征所述问题序列文本信息分别与若干个解答序列文本信息之间的相似度;所述解答输出模块用于输出所述相似度列表中相似度最高的解答序列文本信息所对应的解答信息。较佳地,所述特征提取模块用于基于CNN模型对所述整段文本信息进行多卷积,并且提取若干个主要特征信息;所述人工智能分类算法为softmax算法。较佳地,所述解答匹配模块用于基于Bi-LSTM模型及CNN模型,从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息。较佳地,所述解答匹配模块用于采用Cosine算法将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配。较佳地,所述解答匹配模块用于生成所述相似度列表之后,对所述相似度列表中的若干个解答序列文本信息以相似度从高到低的顺序进行排列,并且选取前五个解答序列文本信息;所述解答输出模块用于输出前五个解答序列文本信息中相似度最高的解答序列文本信息所对应的解答信息,还分别输出其余四个解答序列文本信息所对应的解答信息对应的问题信息。在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本专利技术各较佳实例。本专利技术的积极进步效果在于:本专利技术提供的人工智能客服机器人的问题解答方法及系统使用深度学习模型,极大地提高了人工智能客服机器人的解答准确率,降低了语料库的维护成本,从而较好地满足在企业实际应用中的各项要求,提高了用户体验度。附图说明图1为本专利技术较佳实施例的人工智能客服机器人的问题解答方法的流程图。图2为本专利技术较佳实施例的人工智能客服机器人的问题解答系统的结构示意图。图3为本专利技术较佳实施例中的分布式容器化部署的示意图。具体实施方式下面通过实施例的方式进一步说明本专利技术,但并不因此将本专利技术限制在所述的实施例范围之中。如图1所示,本实施例提供的人工智能客服机器人的问题解答方法包括以下步骤:步骤101、接收整段问题信息,对整段问题信息进行多卷积,并且提取若干个主要特征信息。在本实施例中,所述问题解答方法采用两级的深度学习模型,第一级Trigger模型(深度学习的常用模型)负责对输入问题进行分类,从而为第二级的模型选择提供依据。第二级的QA模型(深度学习的常用模型)负责对该分类下的问题进行答案匹配并输出结果。在本步骤中,人工智能客服机器人接收用户输入的问题后,即整段问题信息,并且准备进行问题的分类工作。在本步骤中,基于CNN模型对所述整段文本信息进行多卷积,并且提取若干个主要特征信息。步骤102、对若干个主要特征信息进行下采样处理,并且从若干个主要特征信息提取若干个目标特征信息。在本步骤中,对若干个主要特征信息进行下采样处理,从而进一步提取若干个目标特征信息。在本实施例中,并不具体限定主要特征信息及目标特征信息的提取数量,均可根据实际情况及实际算法来提取。步骤103、根据若干个目标特征信息并基于softmax算法输出问题类型信息。步骤104、根据所述问题类型信息查询对应类型的语料库。在本步骤中,根据输出的问题类型信息来查询对应类型的语料库,例如,当用户输入旅游相关问题,问题类型信息可以为“签证类”、“自由行类”、本文档来自技高网...
人工智能客服机器人的问题解答方法及系统

【技术保护点】
一种人工智能客服机器人的问题解答方法,其特征在于,所述问题解答方法包括以下步骤:S1、接收整段问题信息,对所述整段问题信息进行多卷积,并且提取若干个主要特征信息;S2、对若干个主要特征信息进行下采样处理,并且从若干个主要特征信息提取若干个目标特征信息;S3、根据若干个目标特征信息并基于人工智能分类算法输出问题类型信息;S4、根据所述问题类型信息查询对应类型的语料库;S5、从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息,将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配,并且生成相似度列表,所述相似度列表用于表征所述问题序列文本信息分别与若干个解答序列文本信息之间的相似度;S6、输出所述相似度列表中相似度最高的解答序列文本信息所对应的解答信息。

【技术特征摘要】
1.一种人工智能客服机器人的问题解答方法,其特征在于,所述问题解答方法包括以下步骤:S1、接收整段问题信息,对所述整段问题信息进行多卷积,并且提取若干个主要特征信息;S2、对若干个主要特征信息进行下采样处理,并且从若干个主要特征信息提取若干个目标特征信息;S3、根据若干个目标特征信息并基于人工智能分类算法输出问题类型信息;S4、根据所述问题类型信息查询对应类型的语料库;S5、从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息,将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配,并且生成相似度列表,所述相似度列表用于表征所述问题序列文本信息分别与若干个解答序列文本信息之间的相似度;S6、输出所述相似度列表中相似度最高的解答序列文本信息所对应的解答信息。2.如权利要求1所述的问题解答方法,其特征在于,在步骤S1中,基于CNN模型对所述整段文本信息进行多卷积,并且提取若干个主要特征信息;在步骤S3中,所述人工智能分类算法为softmax算法。3.如权利要求1所述的问题解答方法,其特征在于,在步骤S5中,基于Bi-LSTM模型及CNN模型,从所述整段问题信息中提取问题序列文本信息,从对应类型的语料库中的若干个解答信息中分别提取若干个解答序列文本信息。4.如权利要求1所述的问题解答方法,其特征在于,在步骤S5中,采用Cosine算法将所述问题序列文本信息分别与若干个解答序列文本信息进行匹配。5.如权利要求1~4中任意一项所述的问题解答方法,其特征在于,在步骤S5中,生成所述相似度列表之后,对所述相似度列表中的若干个解答序列文本信息以相似度从高到低的顺序进行排列,并且选取前五个解答序列文本信息;在步骤S6中,输出前五个解答序列文本信息中相似度最高的解答序列文本信息所对应的解答信息,还分别输出其余四个解答序列文本信息所对应的解答信息对应的问题信息。6.一种人工智能客服机器人的问题解答系统,其特征在于,所述问题解答系统包括问题输入模块、特征提取模块、类型输出模块、类型查询模块、解答匹配模块及解答输出模...

【专利技术属性】
技术研发人员:李健马超
申请(专利权)人:上海携程国际旅行社有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1