基于机器学习的问答交互方法及装置制造方法及图纸

技术编号:24683857 阅读:22 留言:0更新日期:2020-06-27 08:05
本发明专利技术公开了一种基于机器学习的问答交互方法及装置,该方法包括:获取用户的问题文本,并提取出所述问题文本的问题要素;根据所述问题要素从预设的知识图谱中检索所述问题文本对应的问题答案;若检索出的问题答案的数量大于1,则将所述问题文本以及所述问题答案输入到预设的语料分类模型中,得到各问题答案的准确性概率;根据各问题答案的准确性概率确定出所述问题文本对应的推送答案,并将所述推送答案发送给所述用户。本发明专利技术的基于机器学习的问答交互方法克服了现有智能客服机器人能够回答的问题范围小及准确性无法判断的缺陷,大大拓展了回答问题的范围并提升了回答问题的准确性。

Interactive method and device of question and answer based on machine learning

【技术实现步骤摘要】
基于机器学习的问答交互方法及装置
本专利技术涉及智能问答领域,具体而言,涉及一种基于机器学习的问答交互方法及装置。
技术介绍
近年来随着人工智能技术的迅速发展,智能客服机器人在各行各业的运用越来越广泛。在银行大数据领域也需要这样的智能客服机器人,以帮助用户解答在查询数据湖或数据仓库时遇到的问题。目前已有的智能客服系统主要是基于语料库,计算用户问题与语料库中已有问题的相似度,取相似度最高的答案。这种方法虽能回答很多问题,但一旦有用户问起语料库中没有问过的问题就会无法答复或答非所问。因此现有技术缺少一种能够更为准确的回答用户问题的智能客服系统。
技术实现思路
本专利技术为了解决上述
技术介绍
中的至少一个技术问题,提出了一种基于机器学习的问答交互方法及装置。为了实现上述目的,根据本专利技术的一个方面,提供了一种基于机器学习的问答交互方法,该方法包括:获取用户的问题文本,并提取出所述问题文本的问题要素;根据所述问题要素从预设的知识图谱中检索所述问题文本对应的问题答案;若检索出的问题答案的数量大于1,则将所述问题文本以及所述问题答案输入到预设的语料分类模型中,得到各问题答案的准确性概率,其中,所述语料分类模型为根据预设的机器学习算法并采用标注出答案正确性的问题答案对作为训练样本训练得出的;根据各问题答案的准确性概率确定出所述问题文本对应的推送答案,并将所述推送答案发送给所述用户。可选的,该基于机器学习的问答交互方法还包括:获取标注出答案正确性的问题答案对;将所述问题答案对转换为词向量;将转换为词向量的所述问题答案对作为训练样本并根据预设的机器学习算法训练出所述语料分类模型。可选的,该基于机器学习的问答交互方法还包括:获取全量知识数据;将所述全量知识数据以键值对的格式存储到图数据库中,得到所述知识图谱。可选的,该基于机器学习的问答交互方法还包括:若检索出的问题答案的数量等于1,则将检索出的问题答案发送给所述用户。可选的,该基于机器学习的问答交互方法还包括:若检索出的问题答案的数量等于0,则将预设的缺省答案发送给所述用户。可选的,所述机器学习算法包括:Stacking算法。为了实现上述目的,根据本专利技术的另一方面,提供了一种基于机器学习的问答交互装置,该装置包括:问题要素提取单元,用于获取用户的问题文本,并提取出所述问题文本的问题要素;知识图谱检索单元,用于根据所述问题要素从预设的知识图谱中检索所述问题文本对应的问题答案;答案准确性概率确定单元,用于当检索出的问题答案的数量大于1时将所述问题文本以及所述问题答案输入到预设的语料分类模型中,得到各问题答案的准确性概率,其中,所述语料分类模型为根据预设的机器学习算法并采用标注出答案正确性的问题答案对作为训练样本训练得出的;答案推送单元,用于根据各问题答案的准确性概率确定出所述问题文本对应的推送答案,并将所述推送答案发送给所述用户。可选的,该基于机器学习的问答交互装置还包括:问题答案对获取单元,用于获取标注出答案正确性的问题答案对;词向量转换单元,用于将所述问题答案对转换为词向量;模型训练单元,用于将转换为词向量的所述问题答案对作为训练样本并根据预设的机器学习算法训练出所述语料分类模型。可选的,该基于机器学习的问答交互装置还包括:全量知识数据获取单元,用于获取全量知识数据;知识图谱构建单元,用于将所述全量知识数据以键值对的格式存储到图数据库中,得到所述知识图谱。可选的,所述答案推送单元,还用于当检索出的问题答案的数量等于1时将检索出的问题答案发送给所述用户。可选的,所述答案推送单元,还用于若检索出的问题答案的数量等于0时将预设的缺省答案发送给所述用户。为了实现上述目的,根据本专利技术的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于机器学习的问答交互方法中的步骤。为了实现上述目的,根据本专利技术的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述基于机器学习的问答交互方法中的步骤。本专利技术的有益效果为:本专利技术基于知识图谱,从知识图谱中检索答案,因此可以回答语料库中没有问过的问题;同时,基于语料库中的问题答案对采用机器学习的方法训练出一个语料分类模型,用于判断从知识图谱中检索出的答案的准确性概率,并基于准确性概率向用户反馈问题答案。本专利技术将知识图谱和语料库结合起来使用,不仅大大拓展了能回答问题的范围,而且还提升了回答问题的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1是本专利技术实施例基于机器学习的问答交互方法的流程图;图2是本专利技术实施例训练模型的流程图;图3是本专利技术实施例构建知识图谱的流程图;图4是本专利技术另一实施例基于机器学习的问答交互方法的流程图;图5是本专利技术实施例基于机器学习的问答交互装置的第一结构框图;图6是本专利技术实施例基于机器学习的问答交互装置的第二结构框图;图7是本专利技术实施例基于机器学习的问答交互装置的第三结构框图;图8是本专利技术实施例计算机设备示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。本领域内的技术人员应明白,本专利技术的实施例可提供为方法、系统、或计算机程序产品。因此,本专利技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本专利技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。图1是本专利技术实施本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的问答交互方法,其特征在于,包括:/n获取用户的问题文本,并提取出所述问题文本的问题要素;/n根据所述问题要素从预设的知识图谱中检索所述问题文本对应的问题答案;/n若检索出的问题答案的数量大于1,则将所述问题文本以及所述问题答案输入到预设的语料分类模型中,得到各问题答案的准确性概率,其中,所述语料分类模型为根据预设的机器学习算法并采用标注出答案正确性的问题答案对作为训练样本训练得出的;/n根据各问题答案的准确性概率确定出所述问题文本对应的推送答案,并将所述推送答案发送给所述用户。/n

【技术特征摘要】
1.一种基于机器学习的问答交互方法,其特征在于,包括:
获取用户的问题文本,并提取出所述问题文本的问题要素;
根据所述问题要素从预设的知识图谱中检索所述问题文本对应的问题答案;
若检索出的问题答案的数量大于1,则将所述问题文本以及所述问题答案输入到预设的语料分类模型中,得到各问题答案的准确性概率,其中,所述语料分类模型为根据预设的机器学习算法并采用标注出答案正确性的问题答案对作为训练样本训练得出的;
根据各问题答案的准确性概率确定出所述问题文本对应的推送答案,并将所述推送答案发送给所述用户。


2.根据权利要求1所述的基于机器学习的问答交互方法,其特征在于,还包括:
获取标注出答案正确性的问题答案对;
将所述问题答案对转换为词向量;
将转换为词向量的所述问题答案对作为训练样本并根据预设的机器学习算法训练出所述语料分类模型。


3.根据权利要求1所述的基于机器学习的问答交互方法,其特征在于,还包括:
获取全量知识数据;
将所述全量知识数据以键值对的格式存储到图数据库中,得到所述知识图谱。


4.根据权利要求1所述的基于机器学习的问答交互方法,其特征在于,还包括:
若检索出的问题答案的数量等于1,则将检索出的问题答案发送给所述用户。


5.根据权利要求1所述的基于机器学习的问答交互方法,其特征在于,还包括:
若检索出的问题答案的数量等于0,则将预设的缺省答案发送给所述用户。


6.根据权利要求1或2所述的基于机器学习的问答交互方法,其特征在于,所述机器学习算法包括:Stacking算法。


7.一种基于机器学习的问答交互装置,其特征在于,包括:
问题要素提取单元,用于获取用户的问题文本,并提取出所述问题文本的问题要素;
知识图谱检索单元,用于根据所述问题要素从预设的知识图谱中检索所述问题文本对应的问题答案;
答案准确性概率确定单元,用于当检索出的问题...

【专利技术属性】
技术研发人员:陈剑
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1