一种基于大语言模型的联网问答方法技术

技术编号:41798744 阅读:35 留言:0更新日期:2024-06-24 20:22
本发明专利技术公开了一种基于大语言模型的联网问答方法,属于人工智能技术领域,包括以下步骤:S1、获取用户输入问题;S2、构建判断用户输入问题是否需要联网模型;S3、将用户输入的问题提供给步骤S2判断用户输入问题是否需要联网模型,需要联网进入步骤S4,不需要联网则进入大语言模型输出问题结果;S4、网络信息获取和处理;S5、返回结果。本发明专利技术采用上述的一种基于大语言模型的联网问答方法,解决了大语言模型信息时效性差的问题。通过网络搜索获取最新信息,将网络搜索获取最新信息与大语言模型的自身知识库相结合,为用户提供准确且实时的答案。一定程度上缓解了大语言模型的训练周期长和训练成本高的问题,使其能够提供更实时的信息。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其是涉及一种基于大语言模型的联网问答方法


技术介绍

1、在人工智能领域,大语言模型已经成为了一种重要的技术,它能够理解和生成人类语言,从而在各种任务中表现出色,如机器翻译、问答系统、文本生成等。然而,尽管大语言模型具有强大的语言理解和生成能力,但其信息的实时性却是一个重要的限制。

2、大语言模型的训练数据通常来自于大规模的文本语料库,这些语料库包含了大量的知识和信息。然而,这些信息是静态的,也就是说,一旦模型训练完成,其知识库就固定下来了,无法获取训练后发生的新信息。这就导致了大语言模型的信息不具备实时性。

3、此外,大语言模型的训练周期长,训练成本高也是一个重要的问题。由于模型的规模巨大,训练一个大语言模型需要大量的计算资源和时间。这使得模型的更新和迭代变得困难,进一步加剧了信息实时性的问题。

4、例如,如果用户询问大语言模型关于最近的新闻事件,模型可能无法提供准确的答案,因为这些信息在模型训练的数据中并不存在。同样,对于快速变化的领域,如股市、科技新闻等,大语言模型也无法提供最新的信息。<本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的联网问答方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大语言模型的联网问答方法,其特征在于,步骤S21中,获取数据集的具体操作为:

3.根据权利要求1所述的一种基于大语言模型的联网问答方法,其特征在于,步骤S22中,预处理包括使用jieba进行分词和过滤停用词。

4.根据权利要求1所述的一种基于大语言模型的联网问答方法,其特征在于,步骤S23中,特征提取及表示的具体操作为:

5.根据权利要求4所述的一种基于大语言模型的联网问答方法,其特征在于,步骤S24中,通过朴素贝叶斯分类器构建判断用户输入问题...

【技术特征摘要】

1.一种基于大语言模型的联网问答方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大语言模型的联网问答方法,其特征在于,步骤s21中,获取数据集的具体操作为:

3.根据权利要求1所述的一种基于大语言模型的联网问答方法,其特征在于,步骤s22中,预处理包括使用jieba进行分词和过滤停用词。

4.根据权利要求1所述的一种基于大语言模型的联网问答方法,其特征在于,步骤s23中,特征提取及表示的具体操作为:

5.根据权利要求4所述的一种基于大语言模型的联网问答方法,其特征在于,步骤s24中,通过朴素贝叶斯分类器构建判断用户输入问题是否需要联网模型并对其进行测试,具体操作为:

6.根据权利要求5所述的一种基于大语言模型的联网问答方法,其...

【专利技术属性】
技术研发人员:赵龙霄佘雨芙王新鑫潘生林李琦
申请(专利权)人:吉玖天津技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1