一种面向对话系统的数据处理方法及装置制造方法及图纸

技术编号:14202427 阅读:56 留言:0更新日期:2016-12-17 18:54
一种面向对话系统的数据处理方法及装置,其中,该方法包括:步骤一、获取用户输入的对话交互信息;步骤二、根据对话交互信息和上下文交互数据,生成相应的特征向量,利用特征向量检索预设知识库中存储的对话组,获取匹配的对话组所对应的反馈信息;步骤三、根据匹配的对话组对应的反馈信息,生成针对对话交互信息的反馈信息。该方法不再像现有方法那样仅仅依赖单个句子进行知识库检索来生成反馈信息,而是结合对话双方在此前对话过程中谈及的内容来进行知识库的检索,因此相较于现有方法,该方法及装置能够有效避免最终得到的反馈信息与用户输入的对话交互信息不相匹配的问题,这样有助于提高对话系统的用户体验。

Data processing method and device for conversation system

A dialogue oriented system and the data processing method and device, wherein, the method comprises the steps of: obtaining user input and interaction information; step two, according to the interactive information and context interaction data, generate the corresponding eigenvectors, the retrieval dialogue groups of preset knowledge stored in the feature vector, the corresponding information feedback the dialogue, group acquisition; step three, according to the feedback information, the corresponding dialogue group, generated for dialogue interactive information feedback. This method is no longer like the existing methods that only rely on single sentences to generate feedback for knowledge retrieval, but a combination of dialogue between the two sides after talking about the dialogue process content for retrieval of knowledge base, so compared with the existing methods, the method and the device can effectively avoid the final feedback information and user input interactive dialogue the information does not match the problem, it is helpful to improve the dialogue system user experience.

【技术实现步骤摘要】

本专利技术涉及机器人
,具体地说,涉及一种面向对话系统的数据处理方法及装置
技术介绍
传统的人机交互过程中,用户通常是通过键盘或鼠标等外设来将自己的命令传递给机器人。而这种人机方式操作复杂,效率低下,对于没有使用经验的用户来说,这种传统的人机交互方式成为了用户与机器人进行沟通的障碍。随着语音技术和自然语言处理技术的发展,基于语音交互的对话系统逐渐成为用户与智能机器人进行人机交互的必备系统。然而对于现有的对话系统而言,其工作方式通常是用户发起一个聊天,然后对话系统对用户输入的内容进行回答,这样一问一答,从而实现人机交互。因此,对话系统的回答就需要与用户发起的聊天主体相关,这样才能吸引用户继续就同一问题来与对话系统进行聊天,这样也就形成了对话。然而,现有对话系统在与用户进行交互的过程中,通常只会通过检索数据库来得到用户所输入的内容的固定答案,这样容易造成逻辑混乱或者答非所问的问题。
技术实现思路
为解决上述问题,本专利技术提供了一种面向对话系统的数据处理方法,其包括:步骤一、获取用户输入的对话交互信息;步骤二、根据所述对话交互信息和上下文交互数据,生成相应的特征向量,利用所述特征向量检索预设知识库中存储的对话组,获取匹配的对话组所对应的反馈信息;步骤三、根据所述匹配的对话组对应的反馈信息,生成针对所述对话交互信息的反馈信息。根据本专利技术的一个实施例,所述预设知识库中的对话组以向量方式存储。根据本专利技术的一个实施例,在所述步骤二中,利用该特征向量检索预设知识库,选取与所述特征向量相似度最高的预设数量的对话组作为匹配的对话组;获取所述匹配的对话组所对应的反馈信息形成候选反馈信息集合;在所述步骤三中,根据所述候选反馈信息集合,生成针对所述对话交互信息的反馈信息。根据本专利技术的一个实施例,在所述步骤二中,利用余弦相似度算法计算所述预设知识库中各个对话组的与该特征向量的相似度。根据本专利技术的一个实施例,在所述步骤三中,分别计算所述候选反馈信息集合中各个候选反馈信息与所述对话交互信息的相关度,根据所述各个候选反馈信息的相关度取值从所述候选反馈信息集合中选取出针对所述对话交互信息的反馈信息。本专利技术还提供了一种面向对话系统的数据处理装置,其包括:交互信息获取模块,其用于获取用户输入的对话交互信息;信息检索模块,其用于根据所述对话交互信息和上下文交互数据,生成相应的特征向量,利用所述特征向量检索预设知识库中存储的对话组,获取匹配的对话组所对应的反馈信息;反馈信息生成模块,其用于根据所述匹配的对话组对应的反馈信息,生成针对所述对话交互信息的反馈信息。根据本专利技术的一个实施例,所述预设知识库中的对话组以向量方式存储。根据本专利技术的一个实施例,所述信息检索模块配置为利用所述特征向量检索预设知识库,选取与所述特征向量相似度最高的预设数量的对话组作为匹配的对话组,获取所述匹配的对话组所对应的反馈信息形成候选反馈信息集合;反馈信息生成模块配置为根据所述候选反馈信息集合,生成针对所述对话交互信息的反馈信息。根据本专利技术的一个实施例,所述信息检索模块配置为利用余弦相似度算法计算所述预设知识库中各个对话组的与该特征向量的相似度。根据本专利技术的一个实施例,所述反馈信息生成模块配置为分别计算所述候选反馈信息集合中各个候选反馈信息与所述对话交互信息的相关度,根据所述各个候选反馈信息的相关度取值从所述候选反馈信息集合中选取出针对所述对话交互信息的反馈信息。本专利技术所提供的面向对话系统的数据处理方法及装置不再像现有方法那样仅仅依赖单个句子进行知识库检索来生成反馈信息,而是结合对话双方(即用户和对话系统)在此前对话过程中谈及的内容来进行知识库的检索,因此相较于现有方法,该方法及装置能够有效避免最终得到的反馈信息与用户输入的对话交互信息不相匹配的问题,这样有助于提高对话系统的用户体验。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:图1是根据本专利技术一个实施例的面向对话系统的数据处理方法的实现流程图;图2是根据本专利技术另一个实施例的面向对话系统的数据处理方法的实现流程图;图3是根据本专利技术一个实施例的面向对话系统的数据处理装置的结构示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本专利技术实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本专利技术可以不用这里的具体细节或者所描述的特定方式来实施。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。现有的对话系统通常由知识库和问题检索两部分构成,当用户输入一个新的请求信息后,对话系统会将该请求信息输入到知识库中来进行检索,并把检索匹配到的回复信息返回给用户,从而实现用户与对话系统之间的交互。然而,通过研究发现,现有的对话系统在利用知识库进行检索的时候,其仅仅依赖单个句子的信息,并没有考虑到对话双方(即用户和对话系统)在之前对话过程中所谈及的内容。这也就导致现有的对话系统容易出现逻辑混乱、答非所问的情况。针对现有对话系统所存在的上述问题,本专利技术提供了一种新的面向对话系统的数据处理方法。该方法在传统对话系统数据处理方法的基础上添加了对多轮对话的支持,从而使得最终返回给用户的反馈信息能够充分考虑人机对话的上下文语境,这样也就使得对话系统显得更加智能和人性化。为了更加清楚地阐述本专利技术所提供的面向对话系统的数据处理方法的实现原理、实现过程以及优点,以下分别结合不同的实施例来对该方法作进一步的说明。实施例一:图1示出了本实施例所提供的面向对话系统的数据处理方法的实现流程图。如图1所示,本实施例中,该方法首先在步骤S101中获取用户输入的对话交互信息。需要说明的是,根据实际需要,该方法在步骤S101中所获取到的对话交互信息既可以是用户输入的文本信息,也可以是用户输入的语音信息,本专利技术不限于此。在获得对话交互信息后,该方法在步骤S102中根据该对话交互信息和上下文交互数据,生成相应的特征向量。在得到该特征向量后,该方法在步骤S103中利用该特征向量来检索预设知识库中所存储的对话组,从而获取到与该特征向量相匹配的对话组,进而得到这些对话组所对应的反馈信息。由于当前对话的内容通常都依赖于双方已经交谈过的内容,当前对话的内容显然不是独立于语境的,因此本实施例所提供的方法依据当前用户输入的对话交互信息和上下文交互数据来生成最终针对对话交互信息的反馈信息。例如,存在以下对话过程:A:脸再瘦点就好了B:别戳我的痛处A:我说话比较直接啦,我错啦,姐姐B:我开玩本文档来自技高网...
一种面向对话系统的数据处理方法及装置

【技术保护点】
一种面向对话系统的数据处理方法,其特征在于,包括:步骤一、获取用户输入的对话交互信息;步骤二、根据所述对话交互信息和上下文交互数据,生成相应的特征向量,利用所述特征向量检索预设知识库中存储的对话组,获取匹配的对话组所对应的反馈信息;步骤三、根据所述匹配的对话组所对应的反馈信息,生成针对所述对话交互信息的反馈信息。

【技术特征摘要】
1.一种面向对话系统的数据处理方法,其特征在于,包括:步骤一、获取用户输入的对话交互信息;步骤二、根据所述对话交互信息和上下文交互数据,生成相应的特征向量,利用所述特征向量检索预设知识库中存储的对话组,获取匹配的对话组所对应的反馈信息;步骤三、根据所述匹配的对话组所对应的反馈信息,生成针对所述对话交互信息的反馈信息。2.如权利要求1所述的方法,其特征在于,所述预设知识库中的对话组以向量方式存储。3.如权利要求1或2所述的方法,其特征在于,在所述步骤二中,利用特征向量检索预设知识库,选取与所述特征向量相似度最高的预设数量的对话组作为匹配的对话组;获取所述匹配的对话组所对应的反馈信息,形成候选反馈信息集合;在所述步骤三中,根据所述候选反馈信息集合,生成针对所述对话交互信息的反馈信息。4.如权利要求3所述的方法,其特征在于,在所述步骤二中,利用余弦相似度算法计算所述预设知识库中各个对话组与该特征向量的相似度。5.如权利要求3所述的方法,其特征在于,在所述步骤三中,分别计算所述候选反馈信息集合中各个候选反馈信息与所述对话交互信息的相关度,根据所述各个候选反馈信息的相关度取值从所述候选反馈信息集合中选取出针对所述对话交互信息的反馈信息。6.一种面向对话系统的数据处理装置...

【专利技术属性】
技术研发人员:孔德乾
申请(专利权)人:北京光年无限科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1