一种基于中医大模型和多知识库的个性化中医问诊系统技术方案

技术编号:43985688 阅读:20 留言:0更新日期:2025-01-10 20:08
本发明专利技术属于中医技术领域,具体为一种基于中医大模型和多知识库的个性化中医问诊系统,包括:中医大模型、中医预训练嵌入模型、排序模型、中医向量数据库、中医图数据库;所述中医预训练嵌入模型的输出端与中医向量数据库建立连接,所述中医预训练嵌入模型的输出端与中医图数据库建立连接。降低了中医大模型在RLHF训练中偏好数据库的构建难度。提升了预训练的语义嵌入模型对中医文本的向量化的适配,提升了向量匹配的精准度。增加了中医知识图谱图数据源。训练了中医大模型、训练和引入了排序模型,使得上下文的选择更加精准。对每个名中医都构建了向量数据就和图数据库,实现了对每个名中医都有个性化的问答逻辑。

【技术实现步骤摘要】

本专利技术涉及中医,具体为一种基于中医大模型和多知识库的个性化中医问诊系统


技术介绍

1、随着自然语言处理(nlp)和大模型技术的发展,用大模型去学习名中医的医案、开方等知识,然后模拟名中医去进行自动问诊,已经成为一种新的替代解决方案。

2、现有技术的一些缺点:

3、(1)在中医大模型的rlhf训练阶段,因为不同的名中医有不同的问诊开方逻辑,因此很难构建用户的偏好数据集,此阶段无法很好的完成多轮问答的准确性训练。

4、(2)在构建rag的向量知识库时,需要将中医文本分割成更小的段落或句子。以何种标准进行分割,分割成多长的段落,这些问题还在研究中,目前并没有定论。这个阶段可能会造成信息完整性的缺失。

5、(3)在rag进行信息搜索时,是基于向量的相似度,从向量数据库中查找与输入文本(病患的问句)最接近的文本(中医文本片段)。由于向量是基于预训练的语义嵌入模型生成的,因此搜索到的文本与预训练的语义嵌入模型关系很大。仅仅根据向量的相似度,不足以保证搜索到的中医文本片段文本一定与病患的问句有很强的相关性,有可能是不本文档来自技高网...

【技术保护点】

1.一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于,包括:

2.根据权利要求1所述的一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于:所述中医预训练嵌入模型使用BERT作为嵌入模型的基础模型;

3.根据权利要求1所述的一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于:所述排序模型基于中医预训练嵌入模型的奖励模型,根据奖励值大小就可以将多个文本进行排序;

4.根据权利要求1所述的一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于:所述中医向量数据库:每个名中医都有一个单独的向量数据子库,其构建过程如下:...

【技术特征摘要】

1.一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于,包括:

2.根据权利要求1所述的一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于:所述中医预训练嵌入模型使用bert作为嵌入模型的基础模型;

3.根据权利要求1所述的一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于:所述排序模型基于中医预训练嵌入模型的奖励模型,根据奖励值大小就可以将多个文本进行排序;

4.根据权利要求1所述的一种基于中医大模型和多知识库的个性化中医问诊系统,其特征在于:所述中医向量数据库:每个名中医都有一个单独的向量数...

【专利技术属性】
技术研发人员:周华李志平陈占春
申请(专利权)人:上海贝业斯健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1