一种针对问答系统的数据处理方法及系统技术方案

技术编号:14244109 阅读:161 留言:0更新日期:2016-12-21 23:37
本发明专利技术公开了一种针对问答系统的数据处理方法以及系统。本发明专利技术的方法包括:对接收到的用户输入进行语义分析,将用户输入解构为用户问题数据;调用用户定制知识库,对各个所述用户问题数据进行基于用户垂直领域的表意匹配,以获取所述用户输入的表意数据。综上,根据本发明专利技术的方法以及系统可以对用户输入进行数据处理以完成对用户输入的表意理解。相较于现有技术,根据本发明专利技术的方法以及系统可以获得更为准确的表意数据,用户体验得到极大提高。

【技术实现步骤摘要】

本专利技术涉及机器人领域,具体说涉及一种针对问答系统的数据处理方法及系统
技术介绍
对于现有的通用知识库体系,侧重的应用场景,主要是日常聊天或者自动客服。但是,对于行业垂直领域,通用化的知识问答系统,并不能很好地满足用户的基本需求。比如,问答系统可以应答的问题是“macbook air的价格”。一方面,如果用户问,“macbook pro的价格”,对于现有的通用知识库的体系来说,这两句话,由于具有较多的关键词的匹配相似成分,所以,计算出来的相似度就会相对较高。其实,这两句话的答案,是完全不同的。这样造成的结果就是表意理解的错误,进而给用户提供错误的信息。另一方面,如果有用户问“air怎么卖的”。对于通用知识库的体系的匹配计算和相似度计算来说,一般情况下,是不能给出两条数据为相似的提问的结果的。综上,为了使得问答系统的应答更为精确,提高问答系统的用户体验,需要一种更优的知识库数据处理方法。
技术实现思路
为了使得问答系统的应答更为精确,本专利技术提供了一种针对问答系统的数据处理方法,所述方法包括:对接收到的用户输入进行语义分析,将用户输入解构为用户问题数据;调用用户定制知识库,对各个所述用户问题数据进行基于用户垂直领域的表意匹配,以获取所述用户输入的表意数据。在一实施例中:将用户输入解构为用户问题数据,其中,将用户输入解构为问题主语以及问题主题;对各所述用户问题数据进行表意匹配,其中,对所述问题主语以及所述问题主题的用户问题数据进行表意匹配。在一实施例中,所述方法还包括:根据所述用户输入的表意数据生成相应的应答数据,其中,所述应答数据与所述问题主语以及所述问题主题的表意匹配结果表意匹配。在一实施例中,所述用户定制知识库包含在所述用户对应垂直领域具有相同表意的多个不同的用户问题数据。在一实施例中,构造用户定制知识库,其中:将用户定制化数据和/或日志请求数据按照垂直领域进行表意类别划分以获取多个不同表意类别的用户问题数据,同一表意类别下的所述用户问题数据具有相同表意。本专利技术还提出了一种针对问答系统的数据处理系统,所述系统包括:存储模块,其配置为存储用户定制知识库;语义分析模块,其配置为对接收到的用户输入进行语义分析,将用户输入解构为用户问题数据;表意匹配模块,其配置为调用所述用户定制知识库,对各个所述用户问题数据进行基于垂直领域的表意匹配,以获取所述用户输入的表意数据。在一实施例中:所述语义分析模块配置为将用户输入解构为问题主语以及问题主题;所述表意匹配模块配置为对所述问题主语以及所述问题主题的用户问题数据进行表意匹配。在一实施例中,所述系统还包括:应答模块,其配置为根据所述用户输入的表意数据生成相应的应答数据,其中,所述应答数据与所述问题主语以及所述问题主题的表意匹配结果表意匹配。在一实施例中,所述存储模块配置为存储用户定制知识库,其中,所述用户定制知识库包含在所述用户对应垂直领域具有相同表意的多个不同的用户问题数据。在一实施例中,所述系统还包括用户定制知识库构造模块,其配置为:将用户定制化数据和/或日志请求数据按照垂直领域进行表意类别划分以获取多个不同表意类别的用户问题数据,同一表意类别下的所述用户问题数据以及所述标准问题数据具有相同表意。根据本专利技术的方法以及系统可以对用户输入进行数据处理以完成对用户输入的表意理解;相较于现有技术,根据本专利技术的方法以及系统可以获得更为准确的表意数据,用户体验得到极大提高。本专利技术的其它特征或优点将在随后的说明书中阐述。并且,本专利技术的部分特征或优点将通过说明书而变得显而易见,或者通过实施本专利技术而被了解。本专利技术的目的和部分优点可通过在说明书、权利要求书以及附图中所特别指出的步骤来实现或获得。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例共同用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是根据本专利技术一实施例方法执行流程图;图2是根据本专利技术一实施例系统结构简图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此本专利技术的实施人员可以充分理解本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程并依据上述实现过程具体实施本专利技术。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。对于现有的通用知识库体系,侧重的应用场景,主要是日常聊天或者自动客服。但是,对于行业垂直领域,通用化的知识问答系统,并不能很好地满足用户的基本需求。现有技术中,当用户提问后,问答系统的通常做法是将用户提问(用户输入)转化为问答系统可以理解的表意数据(例如特定的关键词),然后根据表意数据生成与表意数据对应的应答数据(通常的,问答系统从数据库中搜索输出表意匹配结果所对应的答案)。如果用户输入转化为表意数据这一过程出现错误,那么就相当于问答系统对用户输入的具体含义理解错误,问答系统也就不可能输出正确的回答。在现有技术中,主要基于知识库完成用户输入到表意数据的转化。即基于知识库对用户输入进行表意匹配以获取表意数据。具体的,从知识库中搜索与用户输入匹配的表意数据。如果知识库中不存在与用户输入匹配的表意数据,那么表意匹配就无法完成。一般情况下,问答系统的知识库包含了问答系统可应答领域的绝大多数问题样本。通常,只要用户提问没有超出问答系统的应答范围,其均可在知识库中搜索到与用户提问对应匹配的表意数据。然而,在用户提问时,用户提问方式、问题表述方式等等是不受限的。尤其是在用户采用简化说法、违反语法格式的习惯用语等表述方式时,明明用户提问的本意(表意)是在问答系统的应答范围内,但是用户提问的具体表述并不常见,因此在知识库没有对应的匹配关系,用户提问无法转化为问答系统可以理解的表意数据,最终问答系统无法输出正确答案。例如,在一应用环境中,问答系统可以回答的问题是“macbook air的价格”(“macbook air的价格”这一表意数据可被问答系统理解并回答)。如果用户直接问“macbook air的价格是多少”,其可以获得正确的应答。但是如果用户问“air的价格是多少”,由于现有的知识库中并不存在“macbook air”与“air”的匹配关系,因此无法将“air的价格是多少”表意匹配成“macbook air的价格”。也就是说,问答系统不会认为“macbook air的价格”与“air的价格是多少”的表意是一致(近似)的。问答系统基于“air的价格是多少”在知识库中进行表意匹配,不可能得到“macbook air的价格”这一表意匹配结果。为了解决上述问题,现有技术中采用的方法通常是增加知识库中的匹配关系(不断扩充知识库)。然而,简单的直接扩充知识库行为会带来负面效果。因为在实际应用场合中,数据表意的匹配(近似)关系是必须结合具体环境的。脱离了某些特定的应用环境,某些表意匹配关系(近似关系)就不成立了。以上面的举例为例,如果是进行苹果电脑的销售询问,那么“macbook air”与“air”可以建立匹配关系,即“air”可以指代“macbook air”。但是,如果在日常对话里面,“air”则不会一定指代“macbook air”,其指代的可能是“空气”。基于上述分析,为本文档来自技高网...
一种针对问答系统的数据处理方法及系统

【技术保护点】
一种针对问答系统的数据处理方法,其特征在于,所述方法包括:对接收到的用户输入进行语义分析,将用户输入解构为用户问题数据;调用用户定制知识库,对各个所述用户问题数据进行基于用户垂直领域的表意匹配,以获取所述用户输入的表意数据。

【技术特征摘要】
1.一种针对问答系统的数据处理方法,其特征在于,所述方法包括:对接收到的用户输入进行语义分析,将用户输入解构为用户问题数据;调用用户定制知识库,对各个所述用户问题数据进行基于用户垂直领域的表意匹配,以获取所述用户输入的表意数据。2.根据权利要求1所述的方法,其特征在于:将用户输入解构为用户问题数据,其中,将用户输入解构为问题主语以及问题主题;对各所述用户问题数据进行表意匹配,其中,对所述问题主语以及所述问题主题的用户问题数据进行表意匹配。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述用户输入的表意数据生成相应的应答数据,其中,所述应答数据与所述问题主语以及所述问题主题的表意匹配结果表意匹配。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述用户定制知识库包含在所述用户对应垂直领域具有相同表意的多个不同的用户问题数据。5.根据权利要求4所述的方法,其特征在于,构造用户定制知识库,其中:将用户定制化数据和/或日志请求数据按照垂直领域进行表意类别划分以获取多个不同表意类别的用户问题数据,同一表意类别下的所述用户问题数据具有相同表意。6.一种针对问答系统的数据处理系统,其特征在于,所述系统包括:存储模块,其配置...

【专利技术属性】
技术研发人员:包强
申请(专利权)人:北京光年无限科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1