提升知识库长文本问答准确率的方法技术

技术编号:40525254 阅读:32 留言:0更新日期:2024-03-01 13:44
本发明专利技术提供了一种提升知识库长文本问答准确率的方法,包括:对上传知识库的长文本进行预处理后存储到向量数据库中,接收用户向知识库提出的问题,并将问题进行向量化,得到问题向量;从向量数据库中匹配出与问题向量相关的文本向量,并提取相似度大于预设阈值,或者相似度排在前K的文本向量作为匹配结果,其中,K为大于1的自然数;将匹配结果通过大语音模型进行处理,得到问题对应的答案。从而能够更加迅速地从长文本中捕捉到语境信息,减轻模型对长序列的处理负担,提高整体计算效率,并提升长文本问答的准确性。

【技术实现步骤摘要】

本专利技术涉及信息处理,具体地,涉及一种提升知识库长文本问答准确率的方法


技术介绍

1、当前知识库问答系统正不断快速发展与演进,并且应用到私有化领域,取得了长足的进步。知识库问答的主要任务是:给定自然语言问句,计算机能够自动的基于知识库中的知识回答该问题。常见的知识库有freebase,dbpedia,wikidata等等。知识在知识库中的存在形式为三元组的形式(s,p,o),其中s代表主语实体,o代表宾语实体,p代表主语实体和宾语实体之间的关系谓语。

2、目前的中文知识库问答主要分为两类。一类是通过大量的特征与模型结合来实现,回答准确度高,但使用的模型和特征较为复杂,很难落地在实际场景。另外一类是针对不同的特定场景定制问答服务,这些问答服务广泛应用于智能客服、机器人等领域。

3、但是,在处理长文本时,通常会面临一些挑战和问题,包括信息计算过载、处理效率低、耗时长,回答不准确等。


技术实现思路

1、针对现有技术中的缺陷,本专利技术的目的是提供一种提升知识库长文本问答准确率的方法。...

【技术保护点】

1.一种提升知识库长文本问答准确率的方法,其特征在于,包括:

2.根据权利要求1所述的提升知识库长文本问答准确率的方法,其特征在于,所述步骤1包括:

3.根据权利要求2所述的提升知识库长文本问答准确率的方法,其特征在于,当上传的所述长文本涉及到多个不同的专业领域时,分别在不同的领域对大语音模型进行优化调整。

4.根据权利要求2所述的提升知识库长文本问答准确率的方法,其特征在于,在对转换格式后的长文本进行分层处理之前,所述方法还包括:

5.根据权利要求1-4中任一项所述的提升知识库长文本问答准确率的方法,其特征在于,还包括

6....

【技术特征摘要】

1.一种提升知识库长文本问答准确率的方法,其特征在于,包括:

2.根据权利要求1所述的提升知识库长文本问答准确率的方法,其特征在于,所述步骤1包括:

3.根据权利要求2所述的提升知识库长文本问答准确率的方法,其特征在于,当上传的所述长文本涉及到多个不同的专业领域时,分别在不同的领域对大语音模型进行优化调整。

4.根据权利要求2所述的提升知识库长文本问答准确率的方法,其特征在于,在对转换格式后的长文本进行分层处理之前,所述方法还包括:

5.根据权利要求1-4中任一项所述的提升知识库长文本问答准确率的方法,其特征在于,还包括:

6.一种提升知识库长文本问答准确率的装置,其特征在于,包括...

【专利技术属性】
技术研发人员:张宋伟唐杰王宗宝戴立言
申请(专利权)人:上海网达软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1