【技术实现步骤摘要】
一种在大语言模型生成文本中嵌入及检测数字水印的方法
[0001]本申请属于自然语言处理
,涉及一种于大模型中嵌入以及检测数字水印的方法
。
技术介绍
[0002]随着以
ChatGPT
为代表的大模型在各行各业的普遍应用,其为产业赋能
、
提质增效的同时,也引起了人们对检测和防止大模型在虚假信息和学术造假等任务中滥用的担忧
。
如何控制和检测生成式文本的滥用已经成为了业内的一项核心研究任务
。
[0003]当前的防止机器生成文本滥用的可控机器生成文本一般基于人工和自动检测
、
添加数字水印并检测等方法实现
。
随着大模型能力的快速提升,其生成的文本越来越接近与人工撰写的内容,通过人工和自动的方法进行检测越来越困难
。
而数字水印通过模型生成时自动添加的方式,能够从源头上控制文本的分布,结合配套的检测工具能够快速高效的准确检测生成文本,溯源内容来源,有效防止文本的恶意传播和滥用
。
[0 ...
【技术保护点】
【技术特征摘要】
1.
一种在大语言模型生成文本中嵌入数字水印的方法,其特征在于,包括:参考文本生成:根据用户输入,利用大语言模型生成面向领域任务的机器文本,记为参考文本;对所述参考文本划分标识水印嵌入范围和内容水印嵌入范围,分别记为第一文本段和第二文本段;加密标识嵌入:基于公钥系统,使用私钥对用户唯一标识进行加密并嵌入到所述第一文本段内,同时将所述用户唯一标识记录到数据库;内容水印嵌入:以所述用户唯一标识为密钥,将内容数字水印嵌入到所述第二文本段内;内容发布:将经过加密标识嵌入和内容水印嵌入后的整个文本输出给用户
。2.
根据权利要求1所述的在大语言模型生成文本中嵌入数字水印的方法,其特征在于,在加密标识嵌入环节,同时将所述用户唯一标识
、
参考文本的生成时间
、
参考文本记录到数据库
。3.
根据权利要求1所述的在大语言模型生成文本中嵌入数字水印的方法,其特征在于,对所述参考文本划分标识水印嵌入范围和内容水印嵌入范围,具体是:根据不同文本段落的重要程度,重要部分作为内容水印嵌入范围,其余部分作为标识水印嵌入范围;或者,采用文本前后顺序进行划分,前面部分作为标识水印嵌入范围,后面部分作为内容水印嵌入范围
。4.
根据权利要求1所述的在大语言模型生成文本中嵌入数字水印的方法,其特征在于,所述加密标识嵌入,具体包括:使用私钥对用户唯一标识
ID
进行加密,得到加密的用户标识
SIDr
;将原词表
V
进行随机打乱得到词表
Vt
,依据加密的用户标识
SIDr
对打乱后的词表
Vt
分区,并且令其中的一个分区中的词表概率增加,经过归一化之后,得到一个新的词表概率分布,根据当前的词表概率分布进行采样,记为当前时间
t
的生成字符
Xt
;当前时间
t
的采样过程结束,进入到下一时间
t+1
的采样...
【专利技术属性】
技术研发人员:徐青伟,范娥媚,尤元岳,谢鑫,严长春,裴非,
申请(专利权)人:知呱呱天津大数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。