【技术实现步骤摘要】
智能化情感问答方法、装置及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种接收用户问题后智能化的给予所述问题答案的智能化情感问答方法、装置及计算机可读存储介质。
技术介绍
目前大部分问答系统的研究重点都关注在生成语句的语法和语义是否合理上,且所述问答系统的答案生成方式大都基于上下文或结合主题,很少考虑到对话者的情感,如用户输入:昨天的考试我没有及格,多数问答系统给予的回复一般如:竟然不是倒数,好神奇;用户输入:我养的狗今天去世了。回复:宠物狗特别容易死。但在现实生活中,如果对方通过语言表达出开心的情绪,通常情况下,对方的回复也应该是积极的情绪。如果对方通过语言表达出悲伤的情绪,往往另一方回应的内容也应是安慰等。因此,问答系统带有情感的回复往往更能受到用户的欢迎。
技术实现思路
本专利技术提供一种智能化情感问答方法、装置及计算机可读存储介质,其主要目的在于当用户输入问题时,给用户呈现出具有情感倾向的答案结果。为实现上述目的,本专利技术提供的一种智能化情感问答方法,包括:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中 ...
【技术保护点】
1.一种智能化情感问答方法,其特征在于,所述方法包括:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中,利用所述卷积神经网络模型训练得到训练值,并将所述训练值输入至损失函数,利用所述损失函数并根据所述情感属性标注集与所述训练值计算得到损失值,判断所述损失值与预设阈值的大小关系,直至所述损失值小于预设阈值时,所述卷积神经网络退出训练;当所述卷积神经网络退出训练后,所述卷积神经网络将所述问题词向量集输入至循环神经网络,同时提示所述循环神经网络接受所述答案词向量集进行训练,直至所述循环神经网络满足预设阈值要求时,退出训练;接收用户问题,对所述用户问题进行所述预处 ...
【技术特征摘要】
1.一种智能化情感问答方法,其特征在于,所述方法包括:通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,将所述问题数据集与所述多种答案数据集组成问答数据集,并对所述问答数据集进行情感属性标注,得到与所述问答数据集对应的情感属性标注集;对所述问答数据集进行包括分词和关键字抽取的预处理操作,并根据Word2Vec算法对所述预处理操作完成的问答数据集进行词向量化操作,得到问答词向量集,所述问答词向量集包括问题词向量集和答案词向量集;将所述情感属性标注集输入至损失函数中,将所述问题词向量集输入至卷积神经网络模型中,利用所述卷积神经网络模型训练得到训练值,并将所述训练值输入至损失函数,利用所述损失函数并根据所述情感属性标注集与所述训练值计算得到损失值,判断所述损失值与预设阈值的大小关系,直至所述损失值小于预设阈值时,所述卷积神经网络退出训练;当所述卷积神经网络退出训练后,所述卷积神经网络将所述问题词向量集输入至循环神经网络,同时提示所述循环神经网络接受所述答案词向量集进行训练,直至所述循环神经网络满足预设阈值要求时,退出训练;接收用户问题,对所述用户问题进行所述预处理操作和所述词向量化操作后,输入至所述卷积神经网络判断情感属性类别,所述循环神经网络根据所述情感属性类别输出所述用户问题的答案。2.如权利要求1所述的智能化情感问答方法,其特征在于,通过网络爬虫技术从互联网中获取问题数据集和与所述问题数据集对应的多种答案数据集,包括:根据所述网络爬虫技术从URL页面内爬取以文本形式提问的问题,将所述以文本形式提问的问题组成问题数据集;遍历所述问题数据集内的问题,使用所述网络爬虫技术从所述URL页面内爬取与所述问题对应的多种答案,直至所述问题数据集遍历结束,得到与所述问题数据集对应的多种答案数据集。3.如权利要求2所述的智能化情感问答方法,其特征在于,所述分词操作包括:根据所述问答数据集建立分词概率模型P(S),并最大化所述分词概率模型,完成分词操作,所述分词概率模型P(S)为:其中,W1,W2,...,Wm为所述问答数据集内数据的词,m为所述问答数据集的数量;所述关键字抽取操作包括:构建所述词的相关度,并基于所述相关度提取关键字,所述相关度为:其中,f(Wi,Wj)为词Wi和词Wj的相关度,tfidf(Wi)为词Wi的词频与逆向频率值,tfidf(Wj)为词Wj的词频与逆向频率值,d为词Wi和词Wj关于词向量的欧式距离。4.如权利要求3中的智能化情感问答方法,其特征在于,所述Word2Vec算法为CBOW模型;所述CBOW模型包括输入层、投影层和输出层;所述投影层ζ(ω,j)为:其中,表示在路径ω内,第j个结点对应的霍夫曼编码,θ为所述CBOW模型的迭代因子,σ表示sigmoid函数,Xω为所述预处理操作完成的问答数据集。5.如权利要求4所述的智能化情感问答方法,其特征在于,所述循环神经网络为长短期记忆网络,所述长短期记忆网络包括遗忘门、输入门、输出门;所述遗忘门为:ft=σ(wt[ht-1,xt]+bt)其中,ft为所述遗忘门的输出数据,xt为所述遗忘门的输入数据,t为所述问答词向量集的当前时间,t-1为所述问答词向量集当前时间的前一个时间,ht-1为所述输出门在所述问答词向量集当前时间的前一个时间的输出数据,wt为所述当前时间的权重,b...
【专利技术属性】
技术研发人员:侯丽,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。