一种端到端地理行业大语言模型构建及使用方法技术

技术编号:40601280 阅读:34 留言:0更新日期:2024-03-12 22:05
本发明专利技术公开了一种端到端地理行业大语言模型构建及使用方法,包括步骤:S0、LLM微调训练获得GeoLLM;S1、用户请求文本输入到GeoLLM;S2、GeoLLM依据,输出最优中间回复,中间回复包括文本任务类型和AI理解结果;S3、依据文本任务类型和AI理解结果生成文本回复和/或调用领域工具执行结果;S4、依据文本回复和/或领域工具执行结果,生成助理回复150。本发明专利技术通过统一格式的大模型输入输出,输入端去掉对prompt设计的依赖,输出端进行格式统一化。将LLM的预期文本回复和地理行业LLM需具备的领域知识和领域工具调用等信息转化成特定格式的文本描述形式,减少领域知识库选择和领域工具任务编排的工作,减少整体应用框架的复杂度。

【技术实现步骤摘要】

本专利技术涉及地理行业大语言模型构建,尤其涉及一种端到端地理行业大语言模型构建及使用方法


技术介绍

1、在基于大语言模型的人机交互对话场景,通常是通用大语言模型在某个具体领域(例如医学、金融、电商等)落地应用的场景,由于通用大语言模型的参数限制以及领域数据隐私限制,通用llm不能掌握足够多特定领域知识,现有地理领域大语言模型落地应用系统主要通过领域任务提示(prompt)管理配合llm扩展插件的技术框架来实现。

2、现有方法用领域知识继续微调llm的训练方法能够给通用llm增加领域知识的有效方式,但也有一定局限,知识微调往往只涉及了领域内的文本类知识,虽然能加深llm对领域文本知识的理解,但还没有涉及对地理领域插件工具的调用理解。

3、现有方法用指定prompt改善领域执行效果,该方式虽然开发成本低,但对提示库的数量和质量要求很高,而且不同用户输入往往需要选择合适的prompt, prompt选取又引入了单独的工作量。prompt选取通常使用相似检索模型,检索储备输入库,匹配到相似输入以后,将对应的prompt拼接到当前用户输入后本文档来自技高网...

【技术保护点】

1.一种端到端地理行业大语言模型构建及使用方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种端到端地理行业大语言模型构建及使用方法,其特征在于:所述文本任务类型包括信息抽取类、生成问答类和任务执行类。

3.根据权利要求1所述的一种端到端地理行业大语言模型构建及使用方法,其特征在于:所述AI理解结果包括领域知识提取、领域数据库、领域接口、Agent插件和搜索引擎判定。

4.根据权利要求1所述的一种端到端地理行业大语言模型构建及使用方法,其特征在于:所述LLM大语言模型采用baichuan-7B或chatglm-6B语言模型

5....

【技术特征摘要】

1.一种端到端地理行业大语言模型构建及使用方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种端到端地理行业大语言模型构建及使用方法,其特征在于:所述文本任务类型包括信息抽取类、生成问答类和任务执行类。

3.根据权利要求1所述的一种端到端地理行业大语言模型构建及使用方法,其特征在于:所述ai理解结果包括领域知识提取、领域数据库、领域接口、agent插件和搜索引擎判定。

4.根据权利要求1所述的一种端到端地理行业大语言模型构建及使用方法,其特征在于:所述llm大语言模型采用baichuan-7b或chatglm-6b语...

【专利技术属性】
技术研发人员:仲清吴恩平苏丽萍熊兆李小飞
申请(专利权)人:中科星图数字地球合肥有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1