一种基于大语言模型的专业检索方法和系统技术方案

技术编号:43437463 阅读:22 留言:0更新日期:2024-11-27 12:44
本发明专利技术涉及一种基于大语言模型的专业检索方法,包括:收集需要处理的文本数据,对所述文本数据进行预处理;利用大语言模型对预处理后的文本数据进行训练和微调,并针对训练后的所述大语言模型的检索结果预生成对应的问题;将所述预生成的对应问题作为训练数据,所述检索结果作为训练标签,训练小型模型以推理用户输入检索问题的语义和意图,以匹配预生成的问答对;当用户输入所述检索问题时,所述小型模型快速匹配所述预生成的问答对给出结果,若无法匹配获得所述预生成的问答对,则标记为待优化,本方案实现了高检索效率,并且在提升专业领域的检索准确性的同时规避了敏感的问答内容。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及种基于大语言模型的专业检索方法和系统


技术介绍

1、现有技术cn109740077a公开了一种基于语义索引的答案搜索方法、电子设备和存储介质。其中,方法包括:获取用户输入的问题文本;根据预先训练的语义索引模型对问题文本进行向量转化,得到问题的语义向量表达;将问题的语义向量表达与预先建立的答案向量索引库中的每个答案向量表达进行匹配;其中,答案向量索引库是根据语义索引模型将答案样本池中所有答案转化为向量表达而构建的;根据匹配到的答案向量表达,获取对应的答案文本,并将对应的答案文本作为搜索结果提供给用户。

2、现阶段大语言模型结合的客服问答、知识库问答都是先将知识库的内容提供给大语言模型例如gpt或llm,或使用lora进行大语言模型微调,然后由大语言模型提供的api进行实时推理,对硬件的要求较高,同时很难满足多人同时使用的需求。并且大语言模型知识问答输出的结果不确定,一旦用户输入敏感信息,可能会导致大语言模型输出敏感信息,会涉及很多的法律法规问题。


技术实现思路

1、为本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的专业检索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述S1收集需要处理的文本数据,对所述文本数据进行预处理,包括但不限于对所述文本数据进行清洗、去重、分词、标注处理。

3.如权利要求2所述的方法,其特征在于,所述S2利用大语言模型对预处理后的文本数据进行训练,并针对训练后的所述大语言模型的检索结果预生成对应的问题,包括针对所述检索结果生成一个问答对,基于同一检索结果预生成多个问题标签,其中,所述问答对应涵盖检索问题的语义解释和对应检索结果的专业解读。

4.如权利要求3所述的方法,其特征在于,所述S4中所述...

【技术特征摘要】

1.一种基于大语言模型的专业检索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述s1收集需要处理的文本数据,对所述文本数据进行预处理,包括但不限于对所述文本数据进行清洗、去重、分词、标注处理。

3.如权利要求2所述的方法,其特征在于,所述s2利用大语言模型对预处理后的文本数据进行训练,并针对训练后的所述大语言模型的检索结果预生成对应的问题,包括针对所述检索结果生成一个问答对,基于同一检索结果预生成多个问题标签,其中,所述问答对应涵盖检索问题的语义解释和对应检索结果的专业解读。

4.如权利要求3所述的方法,其特征在于,所述s4中所述若无法匹配获得所述预生成的问答对,包括所述小型模型未训练所述检索问题的相关专业术语和/或在匹配过程中对所述检索问题的语义解释和所述预生成的问答对中的问...

【专利技术属性】
技术研发人员:曲傲潘清雪陈晨
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1