一种医疗领域大语言模型实现可控文本生成方法及系统技术方案

技术编号：41768485 阅读：60 留言：0更新日期：2024-06-21 21:46

本发明专利技术提出了一种医疗领域大语言模型实现可控文本生成方法及系统，通过医疗场景具体问题数据及对应知识数据构建可控的提示词，输入到大语音模型中，随后在大语言模型生成答案过程中，直接在输出空间上对输出文本进行限制从而达到对大语言模型的可控文本生成效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器学习，尤其涉及一种医疗领域大语言模型实现可控文本生成方法及系统。

技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。

2、大语言模型具有强大的通用语言理解和生成能力,能够在少样本甚至零样本的场景下达到多种自然语言处理任务的最优性能。目前通常用于文本翻译与聊天对话场景，但在在特定的场景去生成特定的有意义的词汇比较困难，不具有可控性；另外，模型会可能生成偏见言论等不安全的文本；这使得大语言模型在应用时增加文本生成的可控性变得非常重要。

3、而在医疗领域，大模型的医疗领域知识应用能力并不强大，若要借助大语言模型，对大语言模型生成文本内容的专业性、安全性有极高的要求，这也使得目前大语言模型在医疗领域垂直落地困难许多。目前受控文本生成从技法上来讲主要有两类，第一类是在隐空间做文章，第二类是在生成器的输出空间上做文章。相比于在隐空间施加控制，在输出空间施加控制在方法上更简单有效一些。且只有绝对限制大语言模型的输出内容才能保证大语言模型在医疗应用过程中绝对的安全性，那么...

【技术保护点】

1.一种医疗领域大语言模型实现可控文本生成方法，其特征在于，包括：

2.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，根据所有token对应的字符串，列出所有字符串的第一个字符，将字串符中第二字符作为相对应的第一字符的分支，依次类推，根据一个字符一层字典的原则建立多层字符token字典树。

3.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，构建受控解码树具体为：

4.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，根据所构建的受控解码树确定受控token表，具体为：若首次...

【技术特征摘要】

1.一种医疗领域大语言模型实现可控文本生成方法，其特征在于，包括：

3.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，构建受控解码树具体为：

4.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，根据所构建的受控解码树确定受控token表，具体为：若首次解码，则从第一个字符开始沿路径查找组合字符串是否有对应token，确定受控token表中元素。

5.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，根据所构建的受控解码树确定受控token表，具体为：若不是首次解码，则从上次受控解码树的状态更新位置沿路径查找可用token，确定受控token表中元素。

6.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法，其特征在于，确定受限token表...

【专利技术属性】
技术研发人员：张伯政，吴军，李彦芳，高希余，来庆涵，
申请(专利权)人：众阳健康科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人