数据合成方法、数据合成装置及计算机存储介质制造方法及图纸

技术编号：40779784 阅读：3 留言：0更新日期：2024-03-25 20:24

本申请提出一种数据合成方法、数据合成装置以及计算机存储介质。所述数据合成方法包括：基于用户的交互指令，获取配置文件；获取背景图片以及参考图片，基于所述配置文件获取所述背景图片上用户标注的位置坐标；将所述背景图片输入扩散模型，以及将所述位置坐标和所述参考图片作为输入约束条件输入扩散模型；利用所述扩散模型对所述背景图片以及所述输入约束条件进行编码处理，输出最终的合成图片。通过上述数据合成方法，设计出一套交互式流水线化目标检测数据合成系统，有效解决了业务场景数据不足时模型对数据的需求问题，在数据端保证算法效果，同时系统的操作人员不需要具备相关的算法背景知识，降低操作人员的准入门槛。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，特别是涉及一种数据合成方法、数据合成装置以及计算机存储介质。

技术介绍

1、人工智能算法快速发展，目前已经在计算机视觉领域中取得了突破性进展，无论是在分类、检测、分割、生成和数据合成等业务中，均取得可观的落地效果。基于此，当前安防领域中大量应用智能算法对产品进行迭代升级，随之产生海量数据需求。同时，不同的场景需要配置不同的算法与对应的数据，对于新的业务而言，常常出现现有的数据与目标场景不匹配等问题，无法满足前期算法效果。

技术实现思路

1、为解决上述技术问题，本申请提出了一种数据合成方法、数据合成装置以及计算机存储介质。

2、为解决上述技术问题，本申请提出了一种数据合成方法，所述数据合成方法包括：

3、基于用户的交互指令，获取配置文件；

4、获取背景图片以及参考图片，基于所述配置文件获取所述背景图片上用户标注的位置坐标；

5、将所述背景图片输入扩散模型，以及将所述位置坐标和所述参考图片作为输入约束条件输入扩散模型；

6、利用所述扩散模型对所述背景图片以及所述输入约束条件进行编码处理，输出最终的合成图片。

7、其中，所述基于用户的交互指令，获取配置文件，包括：

8、显示所述背景图片；

9、响应于用户的第一交互指令，在所述背景图片显示第一交互式画框；

10、基于所述第一交互式画框，显示对应图片区域的放大细节图；

11、响应于用户的第二交互指令，在所

12、基于所述第二交互式画框的坐标生成所述配置文件。

13、其中，所述基于用户的交互指令，获取配置文件，包括：

14、显示所述背景图片；

15、响应于用户的交互指令，在所述背景图片显示若干标记点；

16、基于所述若干标记点构建闭合区域；

17、基于所述闭合区域的坐标生成所述配置文件。

18、其中，所述基于所述配置文件获取所述背景图片上用户标注的位置坐标之前，所述数据合成方法还包括：

19、基于所述配置文件获取所述闭合区域的最大坐标值；

20、按照所述最大坐标值构建随机矩阵和二值矩阵，其中，所述闭合区域内的像素点在二值矩阵内为1，所述闭合区域外的像素点在二值矩阵内为0；

21、获取所述随机矩阵和所述二值矩阵乘积的矩阵最大值；

22、获取所述矩阵最大值对应的随机矩阵坐标点；

23、基于所述随机矩阵坐标点生成目标框，所述目标框用于提供用户标注的位置坐标。

24、其中，所述将所述位置坐标和所述参考图片作为输入约束条件输入扩散模型之前，所述数据合成方法还包括：

25、将所述位置坐标映射为位置向量；

26、将所述位置向量输入多层感知机进行编码计算，获取位置坐标约束条件；

27、利用编码模块将所述参考图片编码成参考图片约束条件。

28、其中，所述将所述位置坐标和所述参考图片作为输入约束条件输入扩散模型，包括：

29、将掩码矩阵、类别名称、裁剪图片、所述位置坐标和/或所述参考图片作为输入约束条件输入扩散模型。

30、其中，所述将掩码矩阵、类别名称、裁剪图片、所述位置坐标和/或所述参考图片作为输入约束条件输入扩散模型之前，所述数据合成方法还包括：

31、按照所述背景图片的尺寸创建掩码矩阵；

32、基于所述用户标注的位置坐标对所述掩码矩阵的坐标值赋值，其中，所述位置坐标围成的闭合区域的矩阵坐标值赋值第一掩码值，其余矩阵坐标值赋值第二掩码值；

33、将所述掩码矩阵输入掩码编码网络，获取掩码矩阵约束条件。

34、其中，所述将掩码矩阵、类别名称、裁剪图片、所述位置坐标和/或所述参考图片作为输入约束条件输入扩散模型之前，所述数据合成方法还包括：

35、获取预期类别的类别名称的文本字符串；

36、提取所述文本字符串的文本语义，生成类别名称约束条件。

37、其中，所述将掩码矩阵、类别名称、裁剪图片、所述位置坐标和/或所述参考图片作为输入约束条件输入扩散模型之前，所述数据合成方法还包括：

38、获取所述背景图片的裁剪局部图片；

39、提取所述背景图片的全局特征向量，以及所述裁剪局部图片的局部特征向量；

40、计算所述全局特征向量和所述局部特征向量的相似度编码特征；

41、将所述相似度编码特征输入多层感知机进行编码计算，获取裁剪图片约束条件。

42、其中，所述获取所述背景图片的裁剪局部图片，包括：

43、基于所述位置坐标确定所述背景图片的坐标框；

44、按照预设像素值基于所述坐标框获取扩张坐标框；

45、按照所述扩张坐标框获取裁剪扩展局部图片；

46、按照所述坐标框的尺寸对所述裁剪扩展局部图片变换为所述裁剪局部图片。

47、为解决上述技术问题，本申请还提出一种数据合成装置，所述数据合成装置包括存储器以及与所述存储器耦接的处理器；其中，所述存储器用于存储程序数据，所述处理器用于执行所述程序数据以实现如上述的数据合成方法。

48、为解决上述技术问题，本申请还提出一种计算机存储介质，所述计算机存储介质用于存储程序数据，所述程序数据在被计算机执行时，用以实现上述的数据合成方法。

49、与现有技术相比，本申请的有益效果是：数据合成装置基于用户的交互指令，获取配置文件；获取背景图片以及参考图片，基于所述配置文件获取所述背景图片上用户标注的位置坐标；将所述背景图片输入扩散模型，以及将所述位置坐标和所述参考图片作为输入约束条件输入扩散模型；利用所述扩散模型对所述背景图片以及所述输入约束条件进行编码处理，输出最终的合成图片。通过上述数据合成方法，设计出一套交互式流水线化目标检测数据合成系统，有效解决了业务场景数据不足时模型对数据的需求问题，在数据端保证算法效果，同时系统的操作人员不需要具备相关的算法背景知识，降低操作人员的准入门槛。

本文档来自技高网...

【技术保护点】

1.一种数据合成方法，其特征在于，所述数据合成方法包括：

2.根据权利要求1所述的数据合成方法，其特征在于，

3.根据权利要求1所述的数据合成方法，其特征在于，

4.根据权利要求3所述的数据合成方法，其特征在于，

5.根据权利要求1所述的数据合成方法，其特征在于，

6.根据权利要求1或5所述的数据合成方法，其特征在于，

7.根据权利要求6所述的数据合成方法，其特征在于，

8.根据权利要求6所述的数据合成方法，其特征在于，

9.根据权利要求6所述的数据合成方法，其特征在于，

10.根据权利要求9所述的数据合成方法，其特征在于，

11.一种数据合成装置，其特征在于，所述终端设备包括存储器以及与所述存储器耦接的处理器；

12.一种计算机存储介质，其特征在于，所述计算机存储介质用于存储程序数据，所述程序数据在被计算机执行时，用以实现如权利要求1至10任一项所述的数据合成方法。

【技术特征摘要】