自动问答方法及系统技术方案

技术编号:16969673 阅读:74 留言:0更新日期:2018-01-07 06:36
本发明专利技术实施例提供一种自动问答方法及系统,从产品与服务数据中为用户问题生成答案数据,针对每一产品与服务数据集合对应一个路径,针对每一路径设置一个权值向量得到路径和权值对应关系表;当收到用户下发的用户问题后,则将该用户问题编码成特征向量,然后将特征向量与路径和权值对应关系表中的各权值向量进行匹配,在特征向量与其中一个权值向量匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。基于涵盖所有服务数据以及所有用户服务数据的产品与服务数据进行路径和权值向量设置,而不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。

【技术实现步骤摘要】
自动问答方法及系统
本专利技术涉及人工智能领域,尤其涉及一种自动问答方法及系统。
技术介绍
目前自动问答系统根据其知识的来源分为开放域和封闭域。前者的知识来源比较广泛,包括互联网、领域知识文档等等,典型的系统如IBM的Watson。后者的知识来源仅包括某个特殊的领域,例如电信领域的客服机器人,它仅仅回答与公司或者行业产品相关的知识。目前在封闭域的自动问答系统中,传统的自动问答系统实现方法是基于标准问题的,它通过人工的方法对用户可能提出的问题进行提炼生成一个标准问题库StdQ={Qesi,Ansi},其中Qesi表示一个标准问题,Ansi表示标准问题Qesi所对应标准答案。当用户提问问题时,将用户问题与每一个标准问题进行匹配,若匹配到合适的问题,则将该问题所对应的答案返回给用户。但这种方法存在一些弊端,例如生成的标准问题无法覆盖用户的查询问题,一方面,由于产品以及服务的更新会导致用户查询内容的变化,另一方面,用户是使用自然语言进行查询的,而每个人的语言习惯是不完全相同的,以至于一些用户问题难以匹配到标准问题。
技术实现思路
本专利技术实施例提供的自动问答方法及系统,主要解决的技术问题是:解决现有自动问答系统中采用标准问题库导致不能很好的覆盖用户问题,进而容易导致对用户问题解答识别,降低用户体验满意度的问题。为解决上述技术问题,本专利技术实施例提供一种自动问答方法,包括:获取用户下发的用户问题;将所述用户问题编码成特征向量;在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。本专利技术实施例还提供一种自动问答系统,问题交互模块,问题解析模块、答案处理模块;所述问题交互模块用于获取用户下发的用户问题;所述问题解析模块用于将所述用户问题编码成特征向量;所述答案处理模块用于在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。本专利技术实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述的自动问答方法。本专利技术的有益效果是:根据本专利技术实施例提供的自动问答方法、系统以及计算机存储介质,由于产品与服务数据是存储在数据库中的,本专利技术实施例从产品与服务数据中按问题分类出对应的数据作为各类问题的答案数据,针对每一答案数据集合对应一个路径,针对每一路径设置一个权值向量得到路径和权值对应关系表;当收到用户下发的用户问题后,则将该用户问题编码成特征向量,然后将特征向量与路径和权值对应关系表中的各权值向量进行匹配,在特征向量与其中一个权值向量匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。本专利技术实施例实现自动问答是基于数据库中的产品与服务数据(涵盖运营商提供的所有服务数据以及所有用户服务数据)进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本专利技术实施例中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。附图说明图1为本专利技术实施例一中的自动问答流程示意图;图2为本专利技术实施例一中的循环神经网络算法示意图;图3为本专利技术实施例二中的自动问答系统结构示意图;图4为本专利技术实施例二中的自动问答系统分布式设置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本专利技术中一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:各运营商的产品与服务数据是存储在数据库中的。例如,对于用户的话费余额、话费详单、流量余额、流量详单、剩余分钟数等产品数据都是针对每个用户分别存储在数据库中的。又例如对于电信火车、电信积木、电信飞机、电信旅游等服务的套餐内容、办理流程等数据也都存储在数据中。因此用户查询时本质是使用自然语言来搜索数据库中对应那部分的数据内容。以电信领域为例,用户查询的问题一般分为两类:一类是与用户自身相关的产品与服务数据,例如“我的流量还剩多少”、“我的话费还剩多少”、“我的通话分钟数还剩多少”、“我这月的话费怎么使用的”;另一类则是针对电信运营商所能提供的服务进行查询,例如“电信电视业务怎么开通”、“我的手机还可以参与哪些优惠活动”等。因此,本实施例产品与服务数据使用路径进行标记,针对每一路径生成一个权值向量得到路径和权值对应关系表。例如:产品与服务数据库中包含了各用户(不同用户可以用不同号码表示)的话费余额、话费详单、流量余额、流量详单,还包括了各种套餐业务(例如电信飞机)怎么开通、套餐业务内容等数据。对于用户的查询权限只限于他自己的数据,则使用路径表示一类数据,例如“用户.话费详单”、“用户.流量余额”、“用户.流量详单”;而对于不限权限的数据,则使用路径表示每一条数据,例如“电信飞机.套餐内容”、“电信飞机.办理流程”。经过上述过程对于每类问题从数据库中划分出对应的数据并设置好唯一路径之后,再为每个路径设置权值向量生成路径和权值对应关系表。通过历史的问答记录数据,生成一个问题到路径的样本集合。基于该样本集合,使用机器学习(包括神经网络)的方法来训练得到各路径的权值向量。本实施例汇总机器学习方法其过程可以参考正样例调整权值的过程。基于足够大数据量的历史问答记录而生成的向量可以很好的表述用户的意图特征,提升问题回答的准确率。基于上述设置,本实施例中当收到用户下发的用户问题后,实现自动问答的流程参见图1所示,包括:S101:获取用户下发的用户问题;S102:将用户问题编码成特征向量;S103:在特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。本实施例中,由于用户用的都是自然语言,每个用户所用的语言习惯不同会导致:用户问题中可能存在冗余字段、指代消解、缺失主语等问题,用户输入可能会出现错别字。因此,本实施例中,在收到用户问题之后,将用户问题编码成特征向量之前,还包括对所述用户问题进行以下至少一种初始化处理:对用户问题中的冗余字段进行过滤,例如,“你好”等;对用户问题中的错别字进行校正,例如将用户输入的“点心积木套餐”纠正为“电信积木套餐”;对用户问题中的名称内容进行标准化处理,例如将“积木套餐”标准化为“电信积木套餐”;对用户问题中上下文的指代进行消解处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“这个套餐怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”;对用户问题上下文的省略进行恢复处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“怎么办理?”。那么后文问题将会被预处理为“本文档来自技高网...
自动问答方法及系统

【技术保护点】
一种自动问答方法,包括:获取用户下发的用户问题;将所述用户问题编码成特征向量;在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。

【技术特征摘要】
1.一种自动问答方法,包括:获取用户下发的用户问题;将所述用户问题编码成特征向量;在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。2.如权利要求1所述的自动问答方法,其特征在于,将所述特征向量与路径和权值对应关系表中的各权值向量进行匹配包括:分别计算所述特征向量与所述各权值向量的相似度值,并获取得到的多个相似度值中的最大相似度值;判断所述特征向量是否与其中一个权值向量匹配成功包括:判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。3.如权利要求2所述的自动问答方法,其特征在于,所述最大相似度值小于等于所述预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例相似度标准值对提取的路径的权值向量进行更新。4.如权利要求2所述的自动问答方法,其特征在于,将所述答案反馈给所述用户后,检测到启用人工服务为所述用户解答所述用户问题时,根据所述最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。5.如权利要求1-4任一项所述的自动问答方法,其特征在于,将所述用户问题编码成特征向量之前,还包括对所述用户问题进行以下至少一种初始化处理:对所述用户问题中的冗余字段进行过滤;对所述用户问题中的错别字进行校正;对所述用户问题中的名称内容进行标准化处理;对所述用户问题中上下文的指代进行消解处理;对所述用户问题上下文的省略进行恢复处理。6.如权利要求1-4任一项所述的自动问答方法,其特征在于,从所述权...

【专利技术属性】
技术研发人员:曲文武
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1