一种图像处理方法、装置及存储介质制造方法及图纸

技术编号：28323466 阅读：15 留言：0更新日期：2021-05-04 13:04

本申请实施例提供一种图像处理方法、装置及存储介质，该方法包括：获取第一图像，所述第一图像包括至少一个时域特征和至少一个频域特征；所述第一图像根据待处理的第一语音数据得到；根据预设策略对所述第一图像进行更新，得到第二图像；其中，所述预设策略至少包括以下项之一：在时域上变换至少一个所述时域特征的时域位置；或者，在频域上变换至少一个所述频域特征的频域位置。本方案能够为训练模型提供丰富的、多样的训练数据，进而提高训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像处理方法、装置及存储介质
本申请实施例涉及数据处理
，尤其涉及一种图像处理方法、装置及存储介质。
技术介绍
神经网络广泛应用于图像识别和文本分析等任务上，一般要基于大规模的数据对神经网络进行训练。为扩充训练数据，一般训练额外的神经网络模型(例如采用自编码器模型)，使用该额外的神经网络模型合成新的语音数据，即将已有语音数据转换为具有相似结构的新语音数据，以扩充语音数据量。在对现有技术的研究和实践过程中，本申请实施例的专利技术人发现，虽然对于图像分类任务，可以从互联网上下载、处理和标注数百万张图片和文档来构建数据集，但是对于语音类的数据而言，在收集环节(例如需要通过人工录制语音数据)、预处理环节上需要耗费较多资源且容易标注错。可见，现有的训练数据的扩充方案效率一般且扩充的丰富程度有限。
技术实现思路
本申请实施例提供了一种图像处理方法、装置及存储介质，能够为训练模型提供丰富的、多样的训练数据，进而提高训练效果。第一方面中，本申请实施例提供一种图像处理方法，所述方法包括：获取第一图像，所述第一图像包括至少一个时域特征和至少一个频域特征；根据预设策略对所述第一图像进行更新，得到第二图像；其中，所述预设策略至少包括以下项之一：在时域上变换至少一个所述时域特征的时域位置；或者，在频域上变换至少一个所述频域特征的频域位置。一些实施方式中，所述根据预设策略对所述第一图像进行更新，得到第二图像，包括：获取所述第一图像在时域上的第一...

【技术保护点】
1.一种图像处理方法，其特征在于，所述方法包括：/n获取第一图像，所述第一图像包括至少一个时域特征和至少一个频域特征；/n根据预设策略对所述第一图像进行更新，得到第二图像；/n其中，所述预设策略至少包括以下项之一：/n在时域上变换至少一个所述时域特征的时域位置；/n或者，在频域上变换至少一个所述频域特征的频域位置。/n

【技术特征摘要】
1.一种图像处理方法，其特征在于，所述方法包括：
获取第一图像，所述第一图像包括至少一个时域特征和至少一个频域特征；
根据预设策略对所述第一图像进行更新，得到第二图像；
其中，所述预设策略至少包括以下项之一：
在时域上变换至少一个所述时域特征的时域位置；
或者，在频域上变换至少一个所述频域特征的频域位置。

2.根据权利要求1所述的方法，其特征在于，所述根据预设策略对所述第一图像进行更新，得到第二图像，包括：
获取所述第一图像在时域上的第一时域长度；
获取第一时域位置、第二时域位置和第三时域位置；其中，所述第一时域位置为时域上进行时域位置变换的长度，所述第一时域位置小于预设时域变换长度；所述第二时域位置小于第一变换长度，所述第一变换长度根据所述第一时域长度与所述第一时域位置得到；所述第三时域位置根据所述第一时域长度、所述第一时域位置和第二时域位置得到；
将所述第一时域位置与所述第二时域位置之间的时域信号作为第一特征块，将所述第一时域位置与所述第三时域位置之间的时域信号作为第二特征块；
交换所述第一特征块与所述第二特征块在所述第一图像中的时域位置，得到第三图像。

3.根据权利要求2所述的方法，其特征在于，所述第一时域长度为W，所述预设时域变换长度为W1，所述第一变换长度为W2；第一时域位置为ti,j，第二时域位置为ti,j+1，第三时域位置为ti,j+2；
其中，i为第i次在时域上进行时域位置变换的操作，ti,j为在第i次中第j次获取的时域位置；
W1、W2、ti,j、ti,j+1、ti,j+2、i、j均为正整数，W2＝W-2ti,j；
0＜ti,j≤W1，0＜ti,j+1≤W-2ti,j，ti,j+ti,j+1＜ti,j+2≤W-ti,j。

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述根据预设策略对所述第一图像进行更新，得到第二图像，还包括：
获取所述第一图像在频域上的第一频率宽度；
获取第一频域位置、第二频域位置和第三频域位置；其中，所述第一频域位置为频域上进行频域位置变换的长度，所述第一频域位置小于预设频域变换宽度；所述第二宽度位置小于第一变换宽度，所述第二宽度位置根据所述第一频率宽度、所述第一频域位置和第二频域位置得到，所述第三宽度位置根据所述第一频率宽度、所述第一频域位置和第二频域位置得到；
将所述第一频域位置与所述第二频域位置之间的时域信号作为第二特征块，将所述第一时域位置与所述第三时域位置之间的时域信号作为第四特征块；
交换所述第三特征块与所述第四特征块在所述第一图像中的频域位置，得到第四图像。

5.根据...

【专利技术属性】
技术研发人员：吴志勇，宋星辰，黄羿衡，
申请(专利权)人：清华大学深圳国际研究生院，腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人