合成数据的统一辨别方法、设备及计算机可读介质技术

技术编号：42082718 阅读：19 留言：0更新日期：2024-07-19 16:59

本申请实施例提供了一种合成数据的统一辨别方法、设备及计算机可读介质，该方案不需要限制待辨别的目标数据的模态，无论目标数据中包括了几种类型的模态数据，都可以自动构建统一的模型输入信息，并通过大语言模型以及转换器模型对不同模态数据的特征信息进行提取以及融合后，最终获取用于进行判断的辨别特征信息，进而完成所述目标数据是否为合成数据的辨别过程，整个处理过程不受目标数据模态的限制，因此适用范围广泛、灵活性较高。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及信息，尤其涉及一种合成数据的统一辨别方法、设备及计算机可读介质。

技术介绍

1、生成式ai(generative artificial intelligence)技术是指利用复杂的算法、模型和规则，从大规模数据集中进行学习，进而生成与真实数据相似的合成数据，包括图像、文本、音频、视频等。随着生成式ai技术的不断发展，其所生成的合成数据也与真实数据越来越接近，普通用户往往难以区分数据是合成数据还是真实数据。

2、目前虽然已经出现一些辨别合成数据的方案，但是此类方案在使用时往往存在诸多限制。大部分的辨别方案往往只针对某一种模态的数据，例如只能够识别某一张图像是否为合成图像，或者某一段音频是否为合成音频，无法采用一种统一的方案对包含任意模态的数据进行辨别。因此，方案的适用范围不够广泛、灵活性不足。

技术实现思路

1、本申请的一个目的是提供一种合成数据的统一辨别方法、设备及计算机可读介质，用以解决现有方案适用范围不够广泛、灵活性不足的问题。

2、为实现上述目的，本...

【技术保护点】

1.一种合成数据的统一辨别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述目标数据至少包括音频数据、图像数据、视频数据和文本数据中的一种模态数据；

3.根据权利要求2所述的方法，其特征在于，所述模型输入信息的格式如下：<Flag>音频数据<Audio>图像数据<Image>视频数据<Video>文本数据<Text>，其中，<Flag>表示整体标识字符，<Audio>表示音频数据标识字符，<Image>表示图像数据标识字符，<Vide...

【技术特征摘要】

1.一种合成数据的统一辨别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述目标数据至少包括音频数据、图像数据、视频数据和文本数据中的一种模态数据；

3.根据权利要求2所述的方法，其特征在于，所述模型输入信息的格式如下：<flag>音频数据<audio>图像数据<image>视频数据<video>文本数据<text>，其中，<flag>表示整体标识字符，<audio>表示音频数据标识字符，<image>表示图像数据标识字符，<video>表示视频数据标识字符，<text>表示文本数据标识字符，若目标数据不包含某一种模态数据，则所述模型输入信息中对应的模态数据为空。

4.根据权利要求3所述的方法，其特征在于，将所述模型输入信息输入至大语言模型，对各个模态数据的特征分别进行计算并融合，获取模型输出信息，所述模型输出信息包括融合了所有模态数据特征的整体特征信息以及分别表示各个模态数据特...

【专利技术属性】
技术研发人员：武嘉妮，孔欧，刘益东，
申请(专利权)人：上海蜜度数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人