【技术实现步骤摘要】
一种基于问答库的信息检索方法、问答系统及计算设备
[0001]本公开涉及计算机网络
,尤其涉及基于问答库的信息检索方案。
技术介绍
[0002]为了克服传统搜索引擎的缺点,问答系统技术应运而生。问答系统能够准确地识别出用户自然语言所表达的查询语义意图,并为其匹配到最相关的答案,作为查询结果。以社区问答为例,越来越多的社区问答平台,为互联网用户提供了一个在线提问和解答的平台,来帮助人们快速获得日常或专业问题的高质量回答。
[0003]随着社区问答变得越来越受欢迎,平台当中存在的问题也逐渐浮现出来,其中一个就是回答的质量参差不齐,并且低质量的回答会极大地影响用户在平台上的体验;另外,自然语言问句表述的多样性,会造成相似问句难以匹配,相似问题下的最佳答案无法快速获取。
[0004]因此,如何快速有效地从问答资源中匹配出最接近且高质量的回答,是社区问答平台的关键问题。
技术实现思路
[0005]本公开提供了一种基于问答库的信息检索方法、问答系统及计算设备,以力图解决或者至少缓解上面存在的至少一个 ...
【技术保护点】
【技术特征摘要】
1.一种基于问答库的信息检索方法,所述问答库包含至少一个问题及各问题对应的至少一个答案,作为各问题的答案集合,所述方法包括:响应于用户查询,从所述问答库中确定召回的问题及召回问题对应的候选答案子集,作为召回的至少一个问答对,其中所述候选答案子集来自所述答案集合;将所述用户查询及所述至少一个问答对,输入预设匹配模型进行处理,以得到所述用户查询与各所述问答对的匹配度;以及按照所述匹配度对所述问答对进行排序,以作为检索结果。2.如权利要求1所述的方法,还包括生成所述预设匹配模型的步骤:将用户查询、问题和答案作为训练数据,并基于预设任务,分别对训练数据进行标注,得到标注数据;构建用于生成预设匹配模型的训练模型,并设置模型的初始参数;将所述训练数据拼接后输入训练模型进行处理,以得到预测匹配度和预测类别;以及利用所述预测匹配度、预测类别和标注数据,计算损失值,并基于损失值调整所述训练模型的模型参数,直到训练结束,得到预设匹配模型。3.如权利要求2所述的方法,其中,所述训练模型包括语言表示模型、文本匹配组件和实体识别组件;以及当训练结束时,将训练好的语言表示模型和训练好的文本匹配组件,作为预设匹配模型。4.如权利要求3所述的方法,其中,所述将训练数据拼接后输入训练模型进行处理,以得到预测匹配度和预测类别的步骤包括:将所述训练数据输入语言表示模型进行处理,得到第一语义向量和第二语义向量;将所述第一语义向量输入文本匹配组件中进行处理,以输出预测匹配度;将所述第二语义向量输入实体识别组件中进行处理,以输出预测类别。5.如权利要求1
‑
4中任一项所述的方法,还包括步骤:针对所述问答库中的各问题,分别选取出与所述问题的匹配度高的至少一个答案,作为所述问题的候选答案子集。6.如权利要求5所述的方法,其中...
【专利技术属性】
技术研发人员:吴锡坤,战立涛,杨雷,
申请(专利权)人:车智互联北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。