一种基于众包的新型问答系统技术方案

技术编号:11439619 阅读:56 留言:0更新日期:2015-05-13 09:05
本发明专利技术提供一种基于众包的新型问答系统,包括:问答模块、智答模块、问答分析模块、中介模式决策模块、数据源查询模块、优化模块,问答分析模块根据获取的问答数据获得关键词组,中介模式决策模块根据关键词组与预设的属性候选集映射生成中介模式,数据源查询模块根据中介模式生成数据源查询语句并在多个数据源中检索获得实体数据,优化模块将实体数据封装为众包任务并将众包任务发送给智答模块,且优化模块根据智答模块反馈的众包反馈数据生成智答数据,本发明专利技术提供的基于众包的新型问答系统解决了自动问答系统受制于语义分析技术难度大、成本高的技术问题以及社区问答系统无法保证即时的技术问题,实现了快速且准确地回答用户提出的问题。

【技术实现步骤摘要】
一种基于众包的新型问答系统
本专利技术涉及一种互联网数据处理技术,尤其涉及一种基于众包的新型问答系统。
技术介绍
随着互联网的快速发展,用户获取的信息越来越多,在Web2.0时期,用户能够通过互联网分享信息,其分享的内容包括文字、图片、视频、网站和移动应用,因此,信息数量不断增多的同时种类也不断多元化。互联网逐渐成为了信息数据的巨大载体,而大量的信息数据带来了一项挑战——如何使用户获得真正需要的信息。搜索引擎作为一项信息检索工具,能够在指数增长级的大数据中,利用关键词匹配来过滤掉一定量的无用信息筛选出结果,但返回结果仍为上百万的网页链接,数量众多且形式单一,增大了筛选有效信息的难度。再者,搜索引擎采用的基于关键词语义检索的方式对用户输入关键词的要求高,若用户不能输入有效关键词,查询语句则无法准确表达用户搜索需求,导致检索结果不佳。问答系统弥补了搜索引擎的缺陷,能够通过自然语言表达信息需求并获得相对直接的信息结果。早期的自动问答系统,以人工智能技术对自然语言问题进行分析,再检索文献知识库快速推理获得高可信度答案。随着问答领域研究的深入,发现自动问答系统能够较好解决事实性问题,但因为语义的复杂性无法良好地处理一类复杂问题,事实性问题是能够得到一个客观事实作为答案的问题,如“《哈利波特》的作者是谁?”,问题的答案为J.K.罗琳,是一个实体人名,而目前提取实体答案的技术已经很成熟,复杂类问题通常是没有标准答案的问题,如“北京哪家餐厅味道好?”,这类问题的答案主观性强,依赖于传统文献知识库很难得出一个成体系的答案,最后,用户不仅可能不满意生成的答案,甚至还可能无法获取答案。而通过社区问答系统与自动问答系统不同的是,其研究内容不仅与机器算法相关,也融入了人计算的相关技术,能够利用人群的语义理解能力和广泛的背景知识储备给出答案解决复杂类问题。社区问答系统以一种一问多答服务平台的方式,提供了用户以自然语言提出问题并作答的功能,通过简单直接的方式满足人们表达信息和获取信息的需求。社区问答系统中的问题通常都有多个回答,传统的最佳答案筛选方式是由提问者只采纳一个回答作为最佳答案的方式,但受制于各个用户之间的知识背景差异及局限性,致使单个回答的最佳答案的质量较为片面。综上所述,问答系统以比搜索引擎更为自然的方式服务用户的信息需求,自动问答系统虽能够快速获取答案,但受制于语义分析技术难度大、成本高;社区问答系统解决了自动问答系统的语义难点,却无法保证即时作答,而且社区问答系统给出的单一回答较为片面。
技术实现思路
本专利技术提供一种基于众包的新型问答系统,解决了现有的自动问答系统受制于语义分析技术难度大、成本高的技术问题以及现有的社区问答系统无法保证即时的技术问题。本专利技术提供一种基于众包的新型问答系统,所述系统包括:客户端和服务器,所述客户端包括问答模块和智答模块,所述服务器包括问答分析模块、中介模式决策模块、数据源查询模块、优化模块,其中所述问答模块与所述问答分析模块相连,所述问答模块用于获取问答数据并将所述问答数据发送给所述问答分析模块,其中所述问答数据包括问题数据和回答数据;所述问答分析模块用于根据所述问答数据获取关键词组;所述中介模式决策模块分别与所述问答分析模块和所述数据源查询模块相连,所述中介模式决策模块用于根据所述问答分析模块发送的关键词组与预设的属性候选集映射生成中介模式;所述数据源查询模块用于根据所述中介模式生成数据源查询语句,并根据所述数据源查询语句在多个数据源中检索获得实体数据;所述优化模块分别与所述数据源查询模块和所述智答模块相连,所述优化模块用于将所述实体数据封装为众包任务并将所述众包任务发送给所述智答模块以使所述智答模块根据所述众包任务获得众包反馈数据,且所述优化模块还用于根据所述智答模块反馈的所述众包反馈数据生成智答数据;所述智答模块用于根据所述众包任务获取所述众包反馈数据,并将所述众包反馈数据发送给所述优化模块以使所述优化模块生成智答数据。本专利技术的实施方案中,所述问答分析模块具体用于:将所述问答数据进行分词处理,并在所述分词处理中过滤停用词;;将过滤后的词语基于本体的概念树进行分类标注,并记录所述词语在所述概念树中的频率;根据所述词语在所述概念树中的分类生成关键词组,所述关键词组包括实体组、概念组和关系组。本专利技术的实施方案中,所述中介模式决策模块具体用于:所述中介模式决策模块具体用于:根据所述关键词组中的词语在所述概念树中的频率对所述关键词组中的词语进行排序,生成有序的关键词组;将所述有序的关键词组中的实体或概念与所述预设的属性候选集进行映射,确定所述有序的关键词组中实体或概念的属性;根据所述关键词组及所述有序的关键词组中实体或概念的属性生成中介模式。本专利技术的实施方案中,所述数据源查询模块具体用于:根据所述中介模式构造查询语句;将所述查询语句重构生成数据源查询语句;将所述数据源查询语句在所述多个数据源中进行检索获得所述实体数据。本专利技术的实施方案中,所述优化模块具体用于:将所述实体数据进行自动预处理,获得中间智答数据;将所述中间智答数据封装为所述众包任务,并将所述众包任务发送给所述智答模块以使所述智答模块根据所述众包任务生成所述众包反馈数据;根据所述智答模块发送的所述众包反馈数据生成智答数据,并将所述智答数据发送给所述智答模块以使所述智答模块显示所述智答数据。本专利技术的实施方案中,所述智答模块具体用于:对所述众包任务进行投票和/或输入自定义值;根据所述众包任务获得的投票数和/或自定义值获取众包反馈数据,并将所述众包反馈数据发送给所述优化模块以使所述优化模块根据所述众包反馈数据中包含的投票数和/或自定义值生成智答数据;接收所述优化模块发送的所述智答数据,并显示所述智答数据。本专利技术的实施方案中,所述智答模块还用于:当所述众包任务获得的投票数和/或自定义值发生变化,则更新所述众包任务获得的投票数和/或自定义值;根据更新后的所述众包任务获得的投票数和/或自定义值更新所述众包反馈数据,并将更新后的众包反馈数据发送给所述优化模块以使所述优化模块根据所述更新后的众包反馈数据更新所述智答数据;接收所述优化模块发送的更新后的智答数据,并显示所述更新后的智答数据。本专利技术的实施方案中,所述优化模块还用于:接收所述智答模块发送的所述更新后的众包反馈数据;根据所述更新后的所述众包反馈数据更新所述智答数据,并将更新后的智答数据发送给所述智答模块以使所述智答模块显示所述更新后的智答数据。本专利技术实施例提供的基于众包的新型问答系统,通过问答模块获得问答数据并将问答数据发送给服务器的问答分析模块,问答分析模块根据问答数据获得关键词组,中介模式决策模块根据关键词组与预设的属性候选集映射生成中介模式,数据源查询模块根据中介模式生成数据源查询语句,并根据所述数据源查询语句在多个数据源中检索获得实体数据,所述优化模块将所述实体数据封装为众包任务并将所述众包任务发送给所述智答模块以使所述智答模块根据所述众包任务获得众包反馈数据,且所述优化模块根据所述智答模块反馈的所述众包反馈数据生成智答数据,本专利技术提供的基于众包的新型问答系统解决了现有的自动问答系统受制于语义分析技术难度大、成本高的技术问题以及现有的社区问答系统无法保证即时的技术问题,实现了本文档来自技高网
...
一种基于众包的新型问答系统

【技术保护点】
一种基于众包的新型问答系统,其特征在于,所述系统包括:客户端和服务器,所述客户端包括问答模块和智答模块,所述服务器包括问答分析模块、中介模式决策模块、数据源查询模块、优化模块,其中所述问答模块与所述问答分析模块相连,所述问答模块用于获取问答数据并将所述问答数据发送给所述问答分析模块,其中所述问答数据包括问题数据和回答数据;所述问答分析模块用于根据所述问答数据获取关键词组;所述中介模式决策模块分别与所述问答分析模块和所述数据源查询模块相连,所述中介模式决策模块用于根据所述问答分析模块发送的关键词组与预设的属性候选集映射生成中介模式;所述数据源查询模块用于根据所述中介模式生成数据源查询语句,并根据所述数据源查询语句在多个数据源中检索获得实体数据;所述优化模块分别与所述数据源查询模块和所述智答模块相连,所述优化模块用于将所述实体数据封装为众包任务并将所述众包任务发送给所述智答模块以使所述智答模块根据所述众包任务获得众包反馈数据,且所述优化模块还用于根据所述智答模块反馈的所述众包反馈数据生成智答数据;所述智答模块用于根据所述众包任务获取所述众包反馈数据,并将所述众包反馈数据发送给所述优化模块以使所述优化模块生成智答数据。...

【技术特征摘要】
1.一种基于众包的新型问答系统,其特征在于,所述系统包括:客户端和服务器,所述客户端包括问答模块和智答模块,所述服务器包括问答分析模块、中介模式决策模块、数据源查询模块、优化模块,其中所述问答模块与所述问答分析模块相连,所述问答模块用于获取问答数据并将所述问答数据发送给所述问答分析模块,其中所述问答数据包括问题数据和回答数据;所述问答分析模块用于根据所述问答数据获取关键词组;所述中介模式决策模块分别与所述问答分析模块和所述数据源查询模块相连,所述中介模式决策模块用于根据所述问答分析模块发送的关键词组与预设的属性候选集映射生成中介模式;所述数据源查询模块用于根据所述中介模式生成数据源查询语句,并根据所述数据源查询语句在多个数据源中检索获得实体数据;所述优化模块分别与所述数据源查询模块和所述智答模块相连,所述优化模块用于将所述实体数据封装为众包任务并将所述众包任务发送给所述智答模块以使所述智答模块根据所述众包任务获得众包反馈数据,且所述优化模块还用于根据所述智答模块反馈的所述众包反馈数据生成智答数据;所述智答模块用于根据所述众包任务获取所述众包反馈数据,并将所述众包反馈数据发送给所述优化模块以使所述优化模块生成智答数据。2.根据权利要求1所述的系统,其特征在于,所述问答分析模块具体用于:将所述问答数据进行分词处理,并在所述分词处理中过滤停用词;将过滤后的词语基于本体的概念树进行分类标注,并记录所述词语在所述概念树中的频率;根据所述词语在所述概念树中的分类及频率生成关键词组,所述关键词组包括实体组、概念组和关系组。3.根据权利要求2所述的系统,其特征在于,所述中介模式决策模块具体用于:根据所述关键词组中的词语在所述概念树中的频率对所述关键词组中的词语进行排序,生成有序的关键词组;将所述有序的关键词组中的实体或概念与所述预设的属性候选集进行映射,确定所述有序的关键词组中实体或概念的属性;根据所述关键...

【专利技术属性】
技术研发人员:孙海龙张日崇刘馨怡孙富民刘旭东
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1