【技术实现步骤摘要】
本说明书一个或多个实施例涉及医疗,尤其涉及一种基于医疗知识图谱的llm模型推理方法及相关设备。
技术介绍
1、大规模语言模型(large language models,llm),或者称之为预训练模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,使用自监督学习方法通过在庞大且多样化的公开数据集上进行预训练,掌握了诸多语言现象。然而,llm模型是黑箱模型,往往不能捕捉和获取事实知识,并且时常会出现“幻觉”(hallucination),编造一些子虚乌有的内容。相比之下,知识图谱(knowledge graph)则是结构化的语义知识库,用于以符号形式描述物理世界中丰富的事实概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组。
2、因此,如何准确利用知识图谱中存储的事实性知识来增强预训练模型的推理能力是亟待解决的问题。
技术实现思路
1、有鉴于此,本说明书一个或多个实施例提供一种基于医疗知识图谱的llm模型推理方法及相关设备。
2、第一方面,本说明书
...【技术保护点】
1.一种基于知识图谱的LLM模型推理方法,其特征在于,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述LLM模型为基于与目标应用场景相关的数据对预训练完成的LLM基础模型进行微调后得到的LLM服务模型;所述目标文本为与所述目标应用场景相关的文本。
3.根据权利要求2所述的方法,其特征在于,所述目标应用场景为医疗问询场景,所述目标文本包括与医疗问询场景相关的医疗问询文本,所述推理结果包括医疗问询结果。
4.根据权利要求1所述的方法,其特征
...【技术特征摘要】
1.一种基于知识图谱的llm模型推理方法,其特征在于,所述知识图谱包含多个节点和连接节点的边,所述节点代表实体,所述边代表实体之间的关系;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述llm模型为基于与目标应用场景相关的数据对预训练完成的llm基础模型进行微调后得到的llm服务模型;所述目标文本为与所述目标应用场景相关的文本。
3.根据权利要求2所述的方法,其特征在于,所述目标应用场景为医疗问询场景,所述目标文本包括与医疗问询场景相关的医疗问询文本,所述推理结果包括医疗问询结果。
4.根据权利要求1所述的方法,其特征在于,所述对所述子图进行特征提取,得到与所述目标文本相关的辅助信息,包括:
5.根据权利要求4所述的方法,其特征在于,每条路径中包含的节点的数量在预设的数量范围内。
6.根据权利要求4所述的方法,其特征在于,所述子图包括多个三元组,每个三元组中包括在子图中连接的节点、边和另一节点;
7.根据权利要求6所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:杨丹,申月,顾进杰,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。