一种数据处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:46136543 阅读:21 留言:0更新日期:2025-08-15 20:13
本申请提供了一种数据处理方法、装置、存储介质及电子设备,该方法包括:接收输入文本;对输入文本进行关键词提取,获得输入文本对应的关键词集合;对所述关键词集合以及所述输入文本进行向量化处理,获得所述关键词集合中的每个关键词的词向量以及输入文本的文本向量;根据所述关键词集合中的各个所述关键词、各个关键词的词向量以及所述文本向量查询知识库,获得目标知识数据集;根据输入文本以及目标知识数据集构建大模型的结构化提示词;将结构化提示词输入到所述大模型中,获得所述输入文本对应的结果数据。应用本申请实施例提供的方法,能够根据输入文本以及目标知识数据集构建大模型的结构化提示词,可以提升大模型的回答结果的准确性。

【技术实现步骤摘要】

本申请涉及数据处理,特别涉及一种数据处理方法、装置、存储介质及电子设备


技术介绍

1、年来,大语言模型(llms)在自然语言处理领域取得了显著进展。这些模型通过深度学习技术训练而成,能够在多种任务中表现出色,如文本生成、机器翻译、问答系统等。大语言模型通常基于大规模的语料库进行训练,这使得它们能够涵盖广泛的知识领域,并具备强大的语言理解和生成能力。

2、然而,输出结果的质量仍然受到训练数据和输入结构化提示词的影响。如果用户输入的结构化提示词无法全面覆盖所需的信息,或者大模型训练时所使用的数据集未涉及到用户所需的领域。在这种情况下,大语言模型可能会生成不完全准确或偏离主题的回答。


技术实现思路

1、本申请所要解决的技术问题是提供一种数据处理方法、装置、存储介质及电子设备,可以提升大模型的回答结果的准确性。具体方案如下:

2、一种数据处理方法,包括:

3、接收输入文本;

4、对所述输入文本进行关键词提取,获得所述输入文本对应的关键词集合;>

5、对所述关本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述输入文本进行关键词提取,获得所述输入文本对应的关键词集合,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述关键词集合中的各个所述关键词、各个所述关键词的词向量以及所述文本向量查询知识库,获得目标知识数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第一知识数据集、所述第二知识数据集以及所述第三知识数据集,获得目标知识数据集,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一知识数据集、所述第二知识数...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述输入文本进行关键词提取,获得所述输入文本对应的关键词集合,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述关键词集合中的各个所述关键词、各个所述关键词的词向量以及所述文本向量查询知识库,获得目标知识数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第一知识数据集、所述第二知识数据集以及所述第三知识数据集,获得目标知识数据集,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一知识数据集、所述第二知识数据集以及所述第三数据集中的各个知识数据与所述输入文本之间的相似度,在各个所述知识数据中选取出多个目标知识...

【专利技术属性】
技术研发人员:任彩红胡可云陈联忠
申请(专利权)人:北京嘉和海森健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1