智能化情感问答方法、装置及计算机可读存储介质制造方法及图纸

技术编号:22166854 阅读:16 留言:0更新日期:2019-09-21 10:33
本发明专利技术涉及一种人工智能技术,揭露了一种智能化情感问答方法,包括:接收问答数据集,并对所述问答数据集进行情感属性标注得到情感属性标注集,对所述问答数据集进行预处理和词向量化得到问答词向量集,将所述情感属性标注集和所述问答词向量集先输入至卷积神经网络模型中训练,所述卷积神经网络退出训练并将所述问答词向量集输入至循环神经网络,直至所述循环神经网络满足预设阈值要求时退出训练;接收用户问题并输入至所述卷积神经网络判断情感属性,基于所述循环神经网络输出所述用户问题的答案。本发明专利技术还提出一种智能化的情感问答装置以及一种计算机可读存储介质。本发明专利技术可以实现精准的智能化的情感问答功能。

Intelligent Emotional Question Answering Method, Device and Computer Readable Storage Media

【技术实现步骤摘要】
智能化情感问答方法、装置及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种接收用户问题后智能化的给予所述问题答案的智能化情感问答方法、装置及计算机可读存储介质。
技术介绍
目前大部分问答系统的研究重点都关注在生成语句的语法和语义是否合理上,且所述问答系统的答案生成方式大都基于上下文或结合主题,很少考虑到对话者的情感,如用户输入:昨天的考试我没有及格,多数问答系统给予的回复一般如:竟然不是倒数,好神奇;用户输入:我养的狗今天去世了。回复:宠物狗特别容易死。但在现实生活中,如果对方通过语言表达出开心的情绪,通常情况下,对方的回复也应该是积极的情绪。如果对方通过语言表达出悲伤的情绪,往往另一方回应的内容也应是安慰等。因此,问答系统带有情感的回复往往更能受到用户的欢迎。
技术实现思路
本专利技术提供一种智能化情感问答方法、装置及计算机可读存储介质,其主要目的在于当用户输入问题时,给用户呈现出具有情感倾向的答案结果。为实现上述目的,本专利技术提供的一种智能化情感问答方法,包括:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中,利用所述卷积神经网络模型训练得到训练值,并将所述训练值输入至损失函数,利用所述损失函数并根据所述情感属性标注集与所述训练值计算得到损失值,判断所述损失值与预设阈值的大小关系,直至所述损失值小于预设阈值时,所述卷积神经网络退出训练;当所述卷积神经网络退出训练后,所述卷积神经网络将所述问题词向量集输入至循环神经网络,同时提示所述循环神经网络接受所述答案词向量集进行训练,直至所述循环神经网络满足预设阈值要求时,退出训练;接收用户问题,对所述用户问题进行所述预处理操作和所述词向量化操作后,输入至所述卷积神经网络判断情感属性类别,所述循环神经网络根据所述情感属性类别输出所述用户问题的答案。可选地,通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,包括:根据所述网络爬虫技术从URL页面内爬取以文本形式提问的问题,将所述以文本形式提问的问题组成问题数据集;遍历所述问题数据集内的问题,使用所述网络爬虫技术从URL页面内爬取与所述问题对应的多种答案,直至所述问题数据集遍历结束,得到与所述问题数据集对应的多种答案数据集。可选地,所述分词根据所述所述问答数据集建立分词概率模型P(S),并最大化所述分词概率模型,完成分词操作,所述分词概率模型P(S)为:其中,W1,W2,...,Wm为所述问答数据集内数据的词,m为所述问答数据集的数量;所述关键字抽取包括构建所述词的相关度并基于所述相关度提取关键字,所述相关度为:其中,f(Wi,Wj)为词Wi和词Wj的相关度,tfidf(Wi)为词Wi的词频与逆向频率值,tfidf(Wj)为词Wj的词频与逆向频率值,d为词Wi和词Wj关于词向量的欧式距离。可选地,所述Word2Vec算法为CBOW模型;所述CBOW模型包括输入层、投影层和输出层;所述投影层ζ(ω,j)为:其中,表示在路径ω内,第j个结点对应的霍夫曼编码,θ为所述CBOW模型的迭代因子,σ表示sigmoid函数,Xω为所述预处理操作完成的问答数据集。可选地,所述循环神经网络为长短期记忆网络;所述长短期记忆网络包括遗忘门、输入门、输出门;所述遗忘门为:ft=σ(wt[ht-1,xt]+bt)其中,ft为所述遗忘门的输出数据,xt为所述遗忘门的输入数据,t为所述问答词向量集的当前时间,t-1为所述问答词向量集当前时间的前一个时间,ht-1为所述输出门在所述问答词向量集当前时间的前一个时间的输出数据,wt为所述当前时间的权重,bt为所述当前时间的偏置,[]为矩阵乘法操作,σ表示所述sigmoid函数。此外,为实现上述目的,本专利技术还提供一种智能化的情感问答装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的智能化的情感问答程序,所述智能化的情感问答程序被所述处理器执行时实现如下步骤:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中,利用所述卷积神经网络模型训练得到训练值,并将所述训练值输入至损失函数,利用所述损失函数并根据所述情感属性标注集与所述训练值计算得到损失值,判断所述损失值与预设阈值的大小关系,直至所述损失值小于预设阈值时,所述卷积神经网络退出训练;当所述卷积神经网络退出训练后,所述卷积神经网络将所述问题词向量集输入至循环神经网络,同时提示所述循环神经网络接受所述答案词向量集进行训练,直至所述循环神经网络满足预设阈值要求时,退出训练;接收用户问题,对所述用户问题进行所述预处理操作和所述词向量化操作后,输入至所述卷积神经网络判断情感属性类别,所述循环神经网络根据所述情感属性类别输出所述用户问题的答案。可选地,通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,包括:根据所述网络爬虫技术从URL页面内爬取以文本形式提问的问题,将所述以文本形式提问的问题组成问题数据集;遍历所述问题数据集内的问题,使用所述网络爬虫技术从URL页面内爬取与所述问题对应的多种答案,直至所述问题数据集遍历结束,得到与所述问题数据集对应的多种答案数据集。可选地,所述分词根据所述所述问答数据集建立分词概率模型P(S),并最大化所述分词概率模型,完成分词操作,所述分词概率模型P(S)为:其中,W1,W2,...,Wm为所述问答数据集内数据的词,m为所述问答数据集的数量;所述关键字抽取包括构建所述词的相关度并基于所述相关度提取关键字,所述相关度为:其中,f(Wi,Wj)为词Wi和词Wj的相关度,tfidf(Wi)为词Wi的词频与逆向频率值,tfidf(Wj)为词Wj的词频与逆向频率值,d为词Wi和词Wj关于词向量的欧式距离。可选地,所述Word2Vec算法为CBOW模型;所述CBOW模型包括输入层、投影层和输出层;所述投影层ζ(ω,j)为:其中,表示在路径ω内,第j个结点对应的霍夫曼编码,θ为所述CBOW模型的迭代因子,σ表示sigmoid函数,Xω为所述预处理操作完成的问答数据集。可选地,所述循环神经网络为长短期记忆网络;所述长短期记忆网络包括遗忘门、输入门、输出门;所述遗忘门为:ft=σ(wt[ht本文档来自技高网...

【技术保护点】
1.一种智能化情感问答方法,其特征在于,所述方法包括:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中,利用所述卷积神经网络模型训练得到训练值,并将所述训练值输入至损失函数,利用所述损失函数并根据所述情感属性标注集与所述训练值计算得到损失值,判断所述损失值与预设阈值的大小关系,直至所述损失值小于预设阈值时,所述卷积神经网络退出训练;当所述卷积神经网络退出训练后,所述卷积神经网络将所述问题词向量集输入至循环神经网络,同时提示所述循环神经网络接受所述答案词向量集进行训练,直至所述循环神经网络满足预设阈值要求时,退出训练;接收用户问题,对所述用户问题进行所述预处理操作和所述词向量化操作后,输入至所述卷积神经网络判断情感属性类别,所述循环神经网络根据所述情感属性类别输出所述用户问题的答案。...

【技术特征摘要】
1.一种智能化情感问答方法,其特征在于,所述方法包括:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中,利用所述卷积神经网络模型训练得到训练值,并将所述训练值输入至损失函数,利用所述损失函数并根据所述情感属性标注集与所述训练值计算得到损失值,判断所述损失值与预设阈值的大小关系,直至所述损失值小于预设阈值时,所述卷积神经网络退出训练;当所述卷积神经网络退出训练后,所述卷积神经网络将所述问题词向量集输入至循环神经网络,同时提示所述循环神经网络接受所述答案词向量集进行训练,直至所述循环神经网络满足预设阈值要求时,退出训练;接收用户问题,对所述用户问题进行所述预处理操作和所述词向量化操作后,输入至所述卷积神经网络判断情感属性类别,所述循环神经网络根据所述情感属性类别输出所述用户问题的答案。2.如权利要求1所述的智能化情感问答方法,其特征在于,通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,包括:根据所述网络爬虫技术从URL页面内爬取以文本形式提问的问题,将所述以文本形式提问的问题组成问题数据集;遍历所述问题数据集内的问题,使用所述网络爬虫技术从所述URL页面内爬取与所述问题对应的多种答案,直至所述问题数据集遍历结束,得到与所述问题数据集对应的多种答案数据集。3.如权利要求2所述的智能化情感问答方法,其特征在于,所述分词操作包括:根据所述问答数据集建立分词概率模型P(S),并最大化所述分词概率模型,完成分词操作,所述分词概率模型P(S)为:其中,W1,W2,...,Wm为所述问答数据集内数据的词,m为所述问答数据集的数量;所述关键字抽取操作包括:构建所述词的相关度,并基于所述相关度提取关键字,所述相关度为:其中,f(Wi,Wj)为词Wi和词Wj的相关度,tfidf(Wi)为词Wi的词频与逆向频率值,tfidf(Wj)为词Wj的词频与逆向频率值,d为词Wi和词Wj关于词向量的欧式距离。4.如权利要求3中的智能化情感问答方法,其特征在于,所述Word2Vec算法为CBOW模型;所述CBOW模型包括输入层、投影层和输出层;所述投影层ζ(ω,j)为:其中,表示在路径ω内,第j个结点对应的霍夫曼编码,θ为所述CBOW模型的迭代因子,σ表示sigmoid函数,Xω为所述预处理操作完成的问答数据集。5.如权利要求4所述的智能化情感问答方法,其特征在于,所述循环神经网络为长短期记忆网络,所述长短期记忆网络包括遗忘门、输入门、输出门;所述遗忘门为:ft=σ(wt[ht-1,xt]+bt)其中,ft为所述遗忘门的输出数据,xt为所述遗忘门的输入数据,t为所述问答词向量集的当前时间,t-1为所述问答词向量集当前时间的前一个时间,ht-1为所述输出门在所述问答词向量集当前时间的前一个时间的输出数据,wt为所述当前时间的权重,b...

【专利技术属性】
技术研发人员:侯丽
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1