一种基于问答库的信息检索方法、问答系统及计算设备技术方案

技术编号:35473721 阅读:23 留言:0更新日期:2022-11-05 16:20
本公开公开了一种基于问答库的信息检索方法、问答系统及计算设备,其中,问答库包含至少一个问题及各问题对应的至少一个答案,作为各问题的答案集合,基于问答库的信息检索方法包括:响应于用户查询,从问答库中确定召回的问题及召回问题对应的候选答案子集,作为召回的至少一个问答对,其中候选答案子集来自答案集合;将用户查询及至少一个问答对,输入预设匹配模型进行处理,以得到用户查询与各问答对的匹配度;以及按照匹配度对问答对进行排序,以作为检索结果。根据本公开的方案,能够显著提高问答的准确性和相关性,提高问答质量。提高问答质量。提高问答质量。

【技术实现步骤摘要】
一种基于问答库的信息检索方法、问答系统及计算设备


[0001]本公开涉及计算机网络
,尤其涉及基于问答库的信息检索方案。

技术介绍

[0002]为了克服传统搜索引擎的缺点,问答系统技术应运而生。问答系统能够准确地识别出用户自然语言所表达的查询语义意图,并为其匹配到最相关的答案,作为查询结果。以社区问答为例,越来越多的社区问答平台,为互联网用户提供了一个在线提问和解答的平台,来帮助人们快速获得日常或专业问题的高质量回答。
[0003]随着社区问答变得越来越受欢迎,平台当中存在的问题也逐渐浮现出来,其中一个就是回答的质量参差不齐,并且低质量的回答会极大地影响用户在平台上的体验;另外,自然语言问句表述的多样性,会造成相似问句难以匹配,相似问题下的最佳答案无法快速获取。
[0004]因此,如何快速有效地从问答资源中匹配出最接近且高质量的回答,是社区问答平台的关键问题。

技术实现思路

[0005]本公开提供了一种基于问答库的信息检索方法、问答系统及计算设备,以力图解决或者至少缓解上面存在的至少一个问题。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于问答库的信息检索方法,所述问答库包含至少一个问题及各问题对应的至少一个答案,作为各问题的答案集合,所述方法包括:响应于用户查询,从所述问答库中确定召回的问题及召回问题对应的候选答案子集,作为召回的至少一个问答对,其中所述候选答案子集来自所述答案集合;将所述用户查询及所述至少一个问答对,输入预设匹配模型进行处理,以得到所述用户查询与各所述问答对的匹配度;以及按照所述匹配度对所述问答对进行排序,以作为检索结果。2.如权利要求1所述的方法,还包括生成所述预设匹配模型的步骤:将用户查询、问题和答案作为训练数据,并基于预设任务,分别对训练数据进行标注,得到标注数据;构建用于生成预设匹配模型的训练模型,并设置模型的初始参数;将所述训练数据拼接后输入训练模型进行处理,以得到预测匹配度和预测类别;以及利用所述预测匹配度、预测类别和标注数据,计算损失值,并基于损失值调整所述训练模型的模型参数,直到训练结束,得到预设匹配模型。3.如权利要求2所述的方法,其中,所述训练模型包括语言表示模型、文本匹配组件和实体识别组件;以及当训练结束时,将训练好的语言表示模型和训练好的文本匹配组件,作为预设匹配模型。4.如权利要求3所述的方法,其中,所述将训练数据拼接后输入训练模型进行处理,以得到预测匹配度和预测类别的步骤包括:将所述训练数据输入语言表示模型进行处理,得到第一语义向量和第二语义向量;将所述第一语义向量输入文本匹配组件中进行处理,以输出预测匹配度;将所述第二语义向量输入实体识别组件中进行处理,以输出预测类别。5.如权利要求1

4中任一项所述的方法,还包括步骤:针对所述问答库中的各问题,分别选取出与所述问题的匹配度高的至少一个答案,作为所述问题的候选答案子集。6.如权利要求5所述的方法,其中...

【专利技术属性】
技术研发人员:吴锡坤战立涛杨雷
申请(专利权)人:车智互联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1