基于亲属关系与文本特征匹配的模型版权保护方法和装置制造方法及图纸

技术编号：45716852 阅读：10 留言：0更新日期：2025-07-04 18:37

本发明专利技术公开了一种基于亲属关系与文本特征匹配的模型版权保护方法和装置，属于人工智能安全技术领域，包括：基于成员属性向量和亲属关系图构建包含自然语言描述实例的指纹数据集并用于对目标模型进行训练；将自然语言描述实例划分为上半段指纹启动文本和下半段评估目标文本，将上半段指纹启动文本输入可疑模型得到下半段预测文本，通过对下半段预测文本和下半段评估目标文本进行相似度比较来实现所有权初步验证；进一步基于可疑模型对上半段指纹启动文本和上半段非指纹启动文本的响应计算文本检索率指标和AUC指标以实现所有权最终确认。本发明专利技术通过提高大模型指纹技术的精准度、鲁棒性和适用性，实现了针对大语言模型所有权验证的高效解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能安全，具体涉及一种基于亲属关系与文本特征匹配的模型版权保护方法和装置。

技术介绍

1、在当今数字化信息飞速发展的时代，大语言模型在自然语言处理领域取得了突破性进展，广泛应用于文本生成、智能问答、机器翻译等诸多关键场景。随着大模型数量的不断增加以及应用场景的日益丰富，模型知识产权保护成为了关键问题。研发一个大模型需要投入大量的人力、物力和时间成本，从数据收集、清洗、标注，到模型架构设计、训练优化，每一个环节都凝聚着开发者的智慧与心血。一旦模型被盗用或未经授权使用，不仅会损害开发者的经济利益，还会破坏市场的公平竞争环境。

2、在技术层面，早期的模型保护手段主要依赖于简单的加密和访问控制措施，但这些方法难以应对复杂的模型篡改和盗用行为。随着模型融合技术的发展，恶意用户可以将盗用的模型与其他模型融合，改变模型的外在表现和内部结构。同时，增量训练技术则使得恶意用户能够通过不断训练，逐渐擦除原模型的指纹特征。这些技术手段给模型指纹技术带来了巨大的挑战，使得准确识别和追踪模型来源变得愈发困难。

3、在这样...

【技术保护点】

1.一种基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述构建包括个人属性、人格特质、习惯偏好和亲属关系的多维度的成员属性向量，包括：

3.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述基于各成员及其亲属关系构建亲属关系图，包括：

4.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述基于每个成员的成员属性向量生成多个自然语言描述实例并将其构建为包含亲属关系图结构信息的指纹数据...

【技术特征摘要】

1.一种基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，包括以下步骤：

3.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述基于各成员及其亲属关系构建亲属关系图，包括：

4.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述基于每个成员的成员属性向量生成多个自然语言描述实例并将其构建为包含亲属关系图结构信息的指纹数据集，包括：

5.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述利用指纹数据集对目标模型进行增量预训练得到嵌入指纹信息的指纹模型，包括：

6.根据权利要求1所述的基于亲属关系与文本特征匹配的模型版权保护方法，其特征在于，所述通过对下半段预测文本和下半段评估目标文本进行相似度比较来实现...

【专利技术属性】
技术研发人员：韩蒙，徐振华，田笑宁，曾文珺，邢文鹏，杨波，李荣昌，
申请(专利权)人：杭州君同未来科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人