【技术实现步骤摘要】
本专利技术属于机器学习,尤其涉及一种医疗领域大语言模型实现可控文本生成方法及系统。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、大语言模型具有强大的通用语言理解和生成能力,能够在少样本甚至零样本的场景下达到多种自然语言处理任务的最优性能。目前通常用于文本翻译与聊天对话场景,但在在特定的场景去生成特定的有意义的词汇比较困难,不具有可控性;另外,模型会可能生成偏见言论等不安全的文本;这使得大语言模型在应用时增加文本生成的可控性变得非常重要。
3、而在医疗领域,大模型的医疗领域知识应用能力并不强大,若要借助大语言模型,对大语言模型生成文本内容的专业性、安全性有极高的要求,这也使得目前大语言模型在医疗领域垂直落地困难许多。目前受控文本生成从技法上来讲主要有两类,第一类是在隐空间做文章,第二类是在生成器的输出空间上做文章。相比于在隐空间施加控制,在输出空间施加控制在方法上更简单有效一些。且只有绝对限制大语言模型的输出内容才能保证大语言模型在医疗应用过程中绝对的安全性,那么
...【技术保护点】
1.一种医疗领域大语言模型实现可控文本生成方法,其特征在于,包括:
2.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,根据所有token对应的字符串,列出所有字符串的第一个字符,将字串符中第二字符作为相对应的第一字符的分支,依次类推,根据一个字符一层字典的原则建立多层字符token字典树。
3.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,构建受控解码树具体为:
4.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,根据所构建的受控解码树确定受控toke
...【技术特征摘要】
1.一种医疗领域大语言模型实现可控文本生成方法,其特征在于,包括:
2.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,根据所有token对应的字符串,列出所有字符串的第一个字符,将字串符中第二字符作为相对应的第一字符的分支,依次类推,根据一个字符一层字典的原则建立多层字符token字典树。
3.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,构建受控解码树具体为:
4.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,根据所构建的受控解码树确定受控token表,具体为:若首次解码,则从第一个字符开始沿路径查找组合字符串是否有对应token,确定受控token表中元素。
5.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,根据所构建的受控解码树确定受控token表,具体为:若不是首次解码,则从上次受控解码树的状态更新位置沿路径查找可用token,确定受控token表中元素。
6.如权利要求1所述的一种医疗领域大语言模型实现可控文本生成方法,其特征在于,确定受限token表...
【专利技术属性】
技术研发人员:张伯政,吴军,李彦芳,高希余,来庆涵,
申请(专利权)人:众阳健康科技集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。