一种基于seq2seq模型的实现问答机器人的方法技术

技术编号:16779606 阅读:59 留言:0更新日期:2017-12-12 23:54
本发明专利技术特别涉及一种基于seq2seq模型的实现问答机器人的方法。该基于seq2seq模型的实现问答机器人的方法,首先对语料数据进行预处理,并使用seq2seq模型对经过预处理的语料数据进行训练得到问答模型;然后接收用户输入的问题,根据问答语句的上下文信息提取主题词存放于数据库中;最后将处理后的问题输入到训练的seq2seq模型中,获取与所述问题对应的回答。该基于seq2seq模型的实现问答机器人的方法,可以根据问答语句的上下文提取出主题词,能够处理省略主题词的问答,具有普遍的通用性。可以应用在导购,热线,自动控制等多种场景中。

A method of implementing a question and answer robot based on seq2seq model

In particular, the invention relates to a method of realizing a question and answer robot based on the seq2seq model. The question and answer method of robot based on seq2seq model, the data pretreatment, and use the seq2seq model to the corpus of data preprocessing of training response model to receive user input; then, according to the context information quiz statement to extract topic words are stored in the database; the seq2seq model input to training after treatment, get corresponding to the answer. The implementation of question answering robot based on seq2seq model can extract topic words according to the context of question and answer, and it can handle the question and answer of omitting key words, which has universal universality. It can be used in many scenes, such as shopping guide, hotline, automatic control and so on.

【技术实现步骤摘要】
一种基于seq2seq模型的实现问答机器人的方法
本专利技术涉及人工智能
,特别涉及一种基于seq2seq模型的实现问答机器人的方法。
技术介绍
人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。该领域的研究包括智能点餐机器人、语言识别、图像识别、自然语言处理和专家系。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。TensorFlow是Google基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。seq2seq(SequencetoSequence)模型是Google开源的一款用于TensorFlow的通用编码器&解码器框架(encoder-decoderframework),可用于机器翻译、文本摘要、会话建模、图像描述等。Seq2Seq模型解决问题的主要思路是通过深度神经网络模型(常用的是LSTM,长短记忆网络,一种循环神经网络)将一个作为输入的序列映射为一个作为输出的序列,这一过程由编码输入与解码输出两个环节组成。seq2seq技术突破了传统的固定大小输入问题框架,开通了将经典深度神经网络模型(DNNs)运用于翻译与智能问答这一类序列型(SequenceBased,项目间有固定的先后关系)任务的先河,并被证实在英语-法语翻译、英语-德语翻译以及人机短问快答的应用中有着不俗的表现。基于上述情况,本专利技术提出了一种基于seq2seq模型的实现问答机器人的方法。
技术实现思路
本专利技术为了弥补现有技术的缺陷,提供了一种简单高效的基于seq2seq模型的实现问答机器人的方法。本专利技术是通过如下技术方案实现的:一种基于seq2seq模型的实现问答机器人的方法,其特征在于,包括以下步骤:(1)语料数据预处理;(2)使用seq2seq模型对经过预处理的语料数据进行训练得到问答模型;(3)接收用户输入的问题;(4)根据问答语句的上下文信息提取主题词存放于数据库中;(5)若问答语句中无主题词,则将存放于数据库的主题词加入到问答语句中;若问答语句中有主题词,则提取出主题词并更新到数据库中;(6)将处理后的问题输入到训练的seq2seq模型中,获取与所述问题对应的回答。所述步骤(1)中,语料数据预处理过程先根据知识图谱对语料库进行分词,然后将分词后的语料库转化为向量表示。所述语料数据预处理过程,先根据知识图谱使用python的jiaba分词器对语料库进行分词,然后将分词后的语料库使用word2vec向量表示,并将回答语句更新于MongoDB数据库中。本专利技术的有益效果是:该基于seq2seq模型的实现问答机器人的方法,可以根据问答语句的上下文提取出主题词,能够处理省略主题词的问答,具有普遍的通用性。可以应用在导购,热线,自动控制等多种场景中。附图说明附图1为本专利技术基于seq2seq模型的实现问答机器人的方法示意图。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图和实施例,对本专利技术进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。该基于seq2seq模型的实现问答机器人的方法,包括以下步骤:(1)语料数据预处理;(2)使用seq2seq模型对经过预处理的语料数据进行训练得到问答模型;(3)接收用户输入的问题;(4)根据问答语句的上下文信息提取主题词存放于数据库中;(5)若问答语句中无主题词,则将存放于数据库的主题词加入到问答语句中;若问答语句中有主题词,则提取出主题词并更新到数据库中;(6)将处理后的问题输入到训练的seq2seq模型中,获取与所述问题对应的回答。所述步骤(1)中,语料数据预处理过程先根据知识图谱对语料库进行分词,然后将分词后的语料库转化为向量表示。所述语料数据预处理过程,先根据知识图谱使用python的jiaba分词器对语料库进行分词,然后将分词后的语料库使用word2vec向量表示,并将回答语句更新于MongoDB数据库中。所述Python是一种面向对象的解释型计算机程序设计语言,是纯粹的自由软件,源代码和解释器CPython遵循GPL(GNUGeneralPublicLicense)协议。Python语法简洁清晰,特色之一是强制用空白符(whitespace)作为语句缩进。Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。所述MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。本文档来自技高网
...
一种基于seq2seq模型的实现问答机器人的方法

【技术保护点】
一种基于seq2seq模型的实现问答机器人的方法,其特征在于,包括以下步骤:(1)语料数据预处理;(2)使用seq2seq模型对经过预处理的语料数据进行训练得到问答模型;(3)接收用户输入的问题;(4)根据问答语句的上下文信息提取主题词存放于数据库中;(5)若问答语句中无主题词,则将存放于数据库的主题词加入到问答语句中;若问答语句中有主题词,则提取出主题词并更新到数据库中;(6)将处理后的问题输入到训练的seq2seq模型中,获取与所述问题对应的回答。

【技术特征摘要】
1.一种基于seq2seq模型的实现问答机器人的方法,其特征在于,包括以下步骤:(1)语料数据预处理;(2)使用seq2seq模型对经过预处理的语料数据进行训练得到问答模型;(3)接收用户输入的问题;(4)根据问答语句的上下文信息提取主题词存放于数据库中;(5)若问答语句中无主题词,则将存放于数据库的主题词加入到问答语句中;若问答语句中有主题词,则提取出主题词并更新到数据库中;(6)将处理后的问题输入到训练的seq2seq模型中,获取与所述问题对应的回...

【专利技术属性】
技术研发人员:尹青山段成德于治楼
申请(专利权)人:济南浪潮高新科技投资发展有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1