基于大语言模型和制造技术

技术编号:39755694 阅读:6 留言:0更新日期:2023-12-17 23:54
本发明专利技术提供一种基于大语言模型和

【技术实现步骤摘要】
基于大语言模型和BERT模型的本地知识库更新方法及系统


[0001]本专利技术涉及计算机
,特别涉及一种基于大语言模型和
BERT
模型的本地知识库更新方法及系统


技术介绍

[0002]智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案

智能问答系统能够实现给出用户的答案的准确以及是否给出都是基于本地知识库来实现的;因此如何实现本地知识库的更新,有助与提高智能问答系统的适用性以及智能性;而如何实现准确有效地对本地知识库的更新是亟需解决的技术问题


技术实现思路

[0003]本专利技术目的之一在于提供了一种基于大语言模型和
BERT
模型的本地知识库更新方法,实现准确有效地对本地知识库的更新

[0004]本专利技术实施例提供的一种基于大语言模型和
BERT
模型的本地知识库更新方法,包括:
[0005]接入预设的第三方平台并获取待分析数据;
[0006]将待分析数据输入大语言模型,获取至少一个第一问答知识项;
[0007]将待分析数据输入
BERT
模型,获取至少一个第二问答知识项;
[0008]基于第一问答知识项和第二问答知识项,对本地知识库进行更新

[0009]优选的,接入预设的第三方平台并获取待分析数据,包括:
[0010]基于搜索关键词库,对第三方平台上的数据进行检索;
[0011]提取检索结果中前预设数量的对象对应的数据作为待分析数据;
[0012]优选的,搜索关键词库通过如下步骤构建:
[0013]获取历史问答记录;
[0014]确定历史问答记录中各个问题对应的匹配的各个答案的匹配度;
[0015]将匹配度小于等于预设的第一阈值的问题中的关键词提取后存入搜索关键词库中;
[0016]和
/
或,
[0017]确定各个历史问答记录对应的用户反馈意见;
[0018]基于预设的量化模板对用户反馈意见进行量化,获取量化值;
[0019]将量化值小于等于预设的第二阈值的问题中的关键词提取后存入搜索关键词库中

[0020]优选的,基于第一问答知识项和第二问答知识项,对本地知识库进行更新,包括:
[0021]计算每个第一问答知识项中问题与每个第二问答知识项中问题的第一相似度;
[0022]计算每个第一问答知识项中答案与每个第二问答知识项中答案的第二相似度;
[0023]将第一相似度大于预设的第一相似度阈值且第二相似度大于预设的第二相似度
阈值的第一问答知识项与第二问答知识项关联;
[0024]基于相关联的第一问答知识项与第二问答知识项,对本地知识库进行更新

[0025]优选的,基于第一问答知识项和第二问答知识项,对本地知识库进行更新,包括:
[0026]确定第一问答知识项或第二问答知识项的来源;
[0027]基于预设的来源信任评分表,确定第一问答知识项或第二问答知识项的第一信任评分;
[0028]确定第一问答知识项或第二问答知识项对应的待分析数据的数量;
[0029]基于预设的数量信任评分表,确定第一问答知识项或第二问答知识项的第二信任评分;
[0030]将第一信任评分和第二信任评分的和值小于预设的信任阈值的第一问答知识项或第二问答知识项删除

[0031]本专利技术还提供一种基于大语言模型和
BERT
模型的本地知识库更新系统,包括:
[0032]获取模块,用于接入预设的第三方平台并获取待分析数据;
[0033]第一分析模块,用于将待分析数据输入大语言模型,获取至少一个第一问答知识项;
[0034]第二分析模块,用于将待分析数据输入
BERT
模型,获取至少一个第二问答知识项;
[0035]更新模块,用于基于第一问答知识项和第二问答知识项,对本地知识库进行更新

[0036]优选的,获取模块接入预设的第三方平台并获取待分析数据,执行如下操作:
[0037]基于搜索关键词库,对第三方平台上的数据进行检索;
[0038]提取检索结果中前预设数量的对象对应的数据作为待分析数据;
[0039]优选的,搜索关键词库通过如下步骤构建:
[0040]获取历史问答记录;
[0041]确定历史问答记录中各个问题对应的匹配的各个答案的匹配度;
[0042]将匹配度小于等于预设的第一阈值的问题中的关键词提取后存入搜索关键词库中;
[0043]和
/
或,
[0044]确定各个历史问答记录对应的用户反馈意见;
[0045]基于预设的量化模板对用户反馈意见进行量化,获取量化值;
[0046]将量化值小于等于预设的第二阈值的问题中的关键词提取后存入搜索关键词库中

[0047]优选的,更新模块基于第一问答知识项和第二问答知识项,对本地知识库进行更新,执行如下操作:
[0048]计算每个第一问答知识项中问题与每个第二问答知识项中问题的第一相似度;
[0049]计算每个第一问答知识项中答案与每个第二问答知识项中答案的第二相似度;
[0050]将第一相似度大于预设的第一相似度阈值且第二相似度大于预设的第二相似度阈值的第一问答知识项与第二问答知识项关联;
[0051]基于相关联的第一问答知识项与第二问答知识项,对本地知识库进行更新

[0052]优选的,更新模块基于第一问答知识项和第二问答知识项,对本地知识库进行更新,执行如下操作:
[0053]确定第一问答知识项或第二问答知识项的来源;
[0054]基于预设的来源信任评分表,确定第一问答知识项或第二问答知识项的第一信任评分;
[0055]确定第一问答知识项或第二问答知识项对应的待分析数据的数量;
[0056]基于预设的数量信任评分表,确定第一问答知识项或第二问答知识项的第二信任评分;
[0057]将第一信任评分和第二信任评分的和值小于预设的信任阈值的第一问答知识项或第二问答知识项删除

[0058]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解

本专利技术的目的和其他优点可通过在所写的说明书

权利要求书

以及附图中所特别指出的结构来实现和获得

[0059]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述

附图说明
[0060]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于大语言模型和
BERT
模型的本地知识库更新方法,其特征在于,包括:接入预设的第三方平台并获取待分析数据;将待分析数据输入大语言模型,获取至少一个第一问答知识项;将待分析数据输入
BERT
模型,获取至少一个第二问答知识项;基于所述第一问答知识项和所述第二问答知识项,对本地知识库进行更新
。2.
如权利要求1所述的基于大语言模型和
BERT
模型的本地知识库更新方法,其特征在于,所述接入预设的第三方平台并获取待分析数据,包括:基于搜索关键词库,对第三方平台上的数据进行检索;提取检索结果中前预设数量的对象对应的数据作为所述待分析数据
。3.
如权利要求2所述的基于大语言模型和
BERT
模型的本地知识库更新方法,其特征在于,所述搜索关键词库通过如下步骤构建:获取历史问答记录;确定所述历史问答记录中各个问题对应的匹配的各个答案的匹配度;将匹配度小于等于预设的第一阈值的问题中的关键词提取后存入搜索关键词库中;和
/
或,确定各个历史问答记录对应的用户反馈意见;基于预设的量化模板对所述用户反馈意见进行量化,获取量化值;将量化值小于等于预设的第二阈值的问题中的关键词提取后存入搜索关键词库中
。4.
如权利要求1所述的基于大语言模型和
BERT
模型的本地知识库更新方法,其特征在于,所述基于所述第一问答知识项和所述第二问答知识项,对本地知识库进行更新,包括:计算每个第一问答知识项中问题与每个第二问答知识项中问题的第一相似度;计算每个第一问答知识项中答案与每个第二问答知识项中答案的第二相似度;将第一相似度大于预设的第一相似度阈值且第二相似度大于预设的第二相似度阈值的第一问答知识项与第二问答知识项关联;基于相关联的第一问答知识项与第二问答知识项,对本地知识库进行更新
。5.
如权利要求1所述的基于大语言模型和
BERT
模型的本地知识库更新方法,其特征在于,所述基于所述第一问答知识项和所述第二问答知识项,对本地知识库进行更新,包括:确定第一问答知识项或第二问答知识项的来源;基于预设的来源信任评分表,确定第一问答知识项或第二问答知识项的第一信任评分;确定第一问答知识项或第二问答知识项对应的待分析数据的数量;基于预设的数量信任评分表,确定第一问答知识项或第二问答知识项的第二信任评分;将所述第一信任评分和所述第二信任评分的和值小于预设的信任阈值的第一问答知识项或第二问答知识项删除
。6.
一种基于大语言模型和
BERT
...

【专利技术属性】
技术研发人员:周建斌徐姗杨植根闵腾超
申请(专利权)人:书音上海文化科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1