【技术实现步骤摘要】
本申请涉及信息,尤其涉及一种合成数据的统一辨别方法、设备及计算机可读介质。
技术介绍
1、生成式ai(generative artificial intelligence)技术是指利用复杂的算法、模型和规则,从大规模数据集中进行学习,进而生成与真实数据相似的合成数据,包括图像、文本、音频、视频等。随着生成式ai技术的不断发展,其所生成的合成数据也与真实数据越来越接近,普通用户往往难以区分数据是合成数据还是真实数据。
2、目前虽然已经出现一些辨别合成数据的方案,但是此类方案在使用时往往存在诸多限制。大部分的辨别方案往往只针对某一种模态的数据,例如只能够识别某一张图像是否为合成图像,或者某一段音频是否为合成音频,无法采用一种统一的方案对包含任意模态的数据进行辨别。因此,方案的适用范围不够广泛、灵活性不足。
技术实现思路
1、本申请的一个目的是提供一种合成数据的统一辨别方法、设备及计算机可读介质,用以解决现有方案适用范围不够广泛、灵活性不足的问题。
2、为实现上述目的,本
...【技术保护点】
1.一种合成数据的统一辨别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标数据至少包括音频数据、图像数据、视频数据和文本数据中的一种模态数据;
3.根据权利要求2所述的方法,其特征在于,所述模型输入信息的格式如下:<Flag>音频数据<Audio>图像数据<Image>视频数据<Video>文本数据<Text>,其中,<Flag>表示整体标识字符,<Audio>表示音频数据标识字符,<Image>表示图像数据标识字
...【技术特征摘要】
1.一种合成数据的统一辨别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标数据至少包括音频数据、图像数据、视频数据和文本数据中的一种模态数据;
3.根据权利要求2所述的方法,其特征在于,所述模型输入信息的格式如下:<flag>音频数据<audio>图像数据<image>视频数据<video>文本数据<text>,其中,<flag>表示整体标识字符,<audio>表示音频数据标识字符,<image>表示图像数据标识字符,<video>表示视频数据标识字符,<text>表示文本数据标识字符,若目标数据不包含某一种模态数据,则所述模型输入信息中对应的模态数据为空。
4.根据权利要求3所述的方法,其特征在于,将所述模型输入信息输入至大语言模型,对各个模态数据的特征分别进行计算并融合,获取模型输出信息,所述模型输出信息包括融合了所有模态数据特征的整体特征信息以及分别表示各个模态数据特...
【专利技术属性】
技术研发人员:武嘉妮,孔欧,刘益东,
申请(专利权)人:上海蜜度数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。