【技术实现步骤摘要】
一种基于问题答案对的问答系统实现方法
本专利技术涉及一种基于问题答案对的问答系统实现方法,属于自然语言处理
技术介绍
搜索引擎技术在信息检索方面可以满足用户的信息需求,但是搜索引擎存在许多不完善的地方,主要体现在两个方面:一是搜索引擎对于用户输入的查询经过检索返回一系列相关网页,网页包含的内容过多,用户往往需要阅读这些网页才能定位自己的需求;二是搜索引擎采取关键词匹配对进行信息检索,关键词匹配技术只对句子进行语法解析而没有语义解析。对于难以用关键词表述的复杂需求,搜索无法给出令人满意的查询结果。为了改善信息检索的用户体验,直接以自然语言作为输入与输出的问答系统成为了研究热点。在众多问答系统中,有一类建立在已配对的问题答案对列表的问答系统,这类问答叫做基于问题答案对的问答系统。用户向问答系统提交自然语言表述的问题之后,系统首先会对问题进行分析,利用各种自然语言处理的技术去理解问题的意图或者主题,例如对问题按意图或主题进行分类、提取问题中的关键词、根据关键词生成关联词,然后将自然语言表述的问题转换成检索所需要的查询语句。接下来,在检索得到的相关候选问题答案对 ...
【技术保护点】
1.一种基于问题答案对的问答系统实现方法,其特征在于:该方法包括如下步骤:问题分析、问题检索和答案选择,具体如下:S1.问题分析,分析用户提出的问题,从而领会用户的提问意图;该步骤在分析用户的问题时,包括将问题向量化、从问题中提取关键词、关键词拓展的操作;S2.问题检索,根据问题检索问题答案对的数据库,获得候选问题答案对集合;具体是在问题答案对的数据库上搭建一个搜索引擎,查询结果是按照BM25模型匹配度计算结果排序;S3.答案选择,训练问题和基于步骤S2得到的候选问题答案对集合,通过对问题与候选问题答案对匹配度评分排序的方式得到最佳答案。
【技术特征摘要】
1.一种基于问题答案对的问答系统实现方法,其特征在于:该方法包括如下步骤:问题分析、问题检索和答案选择,具体如下:S1.问题分析,分析用户提出的问题,从而领会用户的提问意图;该步骤在分析用户的问题时,包括将问题向量化、从问题中提取关键词、关键词拓展的操作;S2.问题检索,根据问题检索问题答案对的数据库,获得候选问题答案对集合;具体是在问题答案对的数据库上搭建一个搜索引擎,查询结果是按照BM25模型匹配度计算结果排序;S3.答案选择,训练问题和基于步骤S2得到的候选问题答案对集合,通过对问题与候选问题答案对匹配度评分排序的方式得到最佳答案。2.根据权利要求1所述的一种基于问题答案对的问答系统实现方法,其特征在于:步骤S1问题分析,具体包括以下子步骤:S1.1问题向量化;S1.2提取关键词:抽取出文本中的实体名词,作为关键词;S1.3关键词拓展:训练词对词的关联概率,得到与关键词相关度高的词语。3.根据权利要求1所述的一种基于问题答案对的问答系统实现方法,其特征在于:步骤S2问题检索,具体包括以下子步骤:S2.1相似问题拓展:将问题中关键词替换为相关度高的词语,将一个原问题拓展为相似问题的集合,相似问题与原问题的相似度由词之间的相关度决定;S2.2候选问题答案对抽取:在问题答案对的数据库上搭建一个搜索引擎,通过搜索引擎获得与每个问题相关的候选问题答案对集合,搜索结果的分数是按照BM25模型匹配度计算得到,在这个分数的基础上加权相似问题与原问...
【专利技术属性】
技术研发人员:李舟军,肖武魁,兰忻怡,
申请(专利权)人:深圳智能思创科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。