一种图像处理方法、装置及存储介质制造方法及图纸

技术编号:28323466 阅读:15 留言:0更新日期:2021-05-04 13:04
本申请实施例提供一种图像处理方法、装置及存储介质,该方法包括:获取第一图像,所述第一图像包括至少一个时域特征和至少一个频域特征;所述第一图像根据待处理的第一语音数据得到;根据预设策略对所述第一图像进行更新,得到第二图像;其中,所述预设策略至少包括以下项之一:在时域上变换至少一个所述时域特征的时域位置;或者,在频域上变换至少一个所述频域特征的频域位置。本方案能够为训练模型提供丰富的、多样的训练数据,进而提高训练效果。

【技术实现步骤摘要】
一种图像处理方法、装置及存储介质
本申请实施例涉及数据处理
,尤其涉及一种图像处理方法、装置及存储介质。
技术介绍
神经网络广泛应用于图像识别和文本分析等任务上,一般要基于大规模的数据对神经网络进行训练。为扩充训练数据,一般训练额外的神经网络模型(例如采用自编码器模型),使用该额外的神经网络模型合成新的语音数据,即将已有语音数据转换为具有相似结构的新语音数据,以扩充语音数据量。在对现有技术的研究和实践过程中,本申请实施例的专利技术人发现,虽然对于图像分类任务,可以从互联网上下载、处理和标注数百万张图片和文档来构建数据集,但是对于语音类的数据而言,在收集环节(例如需要通过人工录制语音数据)、预处理环节上需要耗费较多资源且容易标注错。可见,现有的训练数据的扩充方案效率一般且扩充的丰富程度有限。
技术实现思路
本申请实施例提供了一种图像处理方法、装置及存储介质,能够为训练模型提供丰富的、多样的训练数据,进而提高训练效果。第一方面中,本申请实施例提供一种图像处理方法,所述方法包括:获取第一图像,所述第一图像包括至少一个时域特征和至少一个频域特征;根据预设策略对所述第一图像进行更新,得到第二图像;其中,所述预设策略至少包括以下项之一:在时域上变换至少一个所述时域特征的时域位置;或者,在频域上变换至少一个所述频域特征的频域位置。一些实施方式中,所述根据预设策略对所述第一图像进行更新,得到第二图像,包括:获取所述第一图像在时域上的第一时域长度;获取第一时域位置、第二时域位置和第三时域位置;其中,所述第一时域位置为时域上进行时域位置变换的长度,所述第一时域位置小于预设时域变换长度;所述第二时域位置小于第一变换长度,所述第一变换长度根据所述第一时域长度与所述第一时域位置得到;所述第三时域位置根据所述第一时域长度、所述第一时域位置和第二时域位置得到;将所述第一时域位置与所述第二时域位置之间的时域信号作为第一特征块,将所述第一时域位置与所述第三时域位置之间的时域信号作为第二特征块;交换所述第一特征块与所述第二特征块在所述第一图像中的时域位置,得到第三图像。一些实施方式中,所述第一时域长度为W,所述预设时域变换长度为W1,所述第一变换长度为W2;第一时域位置为ti,j,第二时域位置为ti,j+1,第三时域位置为ti,j+2;其中,i为第i次在时域上进行时域位置变换的操作,ti,j为在第i次中第j次获取的时域位置;W1、W2、ti,j、ti,j+1、ti,j+2、i、j均为正整数,W2=W-2ti,j;0<ti,j≤W1,0<ti,j+1≤W-2ti,j,ti,j+ti,j+1<ti,j+2≤W-ti,j。一些实施方式中,所述根据预设策略对所述第一图像进行更新,得到第二图像,还包括:获取所述第一图像在频域上的第一频率宽度;获取第一频域位置、第二频域位置和第三频域位置;其中,所述第一频域位置为频域上进行频域位置变换的长度,所述第一频域位置小于预设频域变换宽度;所述第二宽度位置小于第一变换宽度,所述第二宽度位置根据所述第一频率宽度、所述第一频域位置和第二频域位置得到,所述第三宽度位置根据所述第一频率宽度、所述第一频域位置和第二频域位置得到;将所述第一频域位置与所述第二频域位置之间的时域信号作为第二特征块,将所述第一时域位置与所述第三时域位置之间的时域信号作为第四特征块;交换所述第三特征块与所述第四特征块在所述第一图像中的频域位置,得到第四图像。一些实施方式中,所述第一频率宽度为H,所述预设频域变换宽度为H1,所述第一变换宽度为H2;第一频域位置为Fi,j,第二频域位置为Fi,j+1,第三频域位置为Fi,j+2;其中,i为第i次在频域上进行频域位置变换的操作,Fi,j为在第i次中第j次获取的频域位置;H1、H2、Fi,j、Fi,j+1、Fi,j+2、i、j均为正整数,H2=H-2Fi,j;0<Fi,j≤H1,0<Fi,j+1≤H-2Fi,j,Fi,j+Fi,j+1<Fi,j+2≤H-Fi,j。一些实施方式中,所述获取第一图像之后,所述根据预设策略对所述第一图像进行更新,得到第二图像之前,所述方法还包括:确定第一业务类型和第二业务类型,所述第一业务类型为第一图像应用的业务类型,所述第二业务类型为目标业务的业务类型;根据所述第一业务类型和所述第二业务类型的相同点和不同点,以及所述第一图像,确定所述预设策略。一些实施方式中,所述方法还包括:获取所述第一图像与目标语谱图的第一相似度,所述目标语谱图为所述第三图像或所述第四图像;当所述第一相似度高于第一阈值时,结束特征变换操作,将相似度高于第一阈值的所述目标语谱图作为所述第二图像。一些实施方式中,所述根据预设策略对所述第一图像进行更新,得到第二图像之后,所述方法还包括:以所述第一图像和所述第二图像作为训练数据,对预设模型进行训练,得到训练后的语音识别模型。一些实施方式中,所述对预设模型进行训练之前,所述方法还包括:将所述第一图像与历史语谱图进行匹配;若所述第一图像与所述历史语谱图的相似度高于预设相似度,则丢弃所述第一图像。一些实施方式中,所述方法还包括:更新所述第一图像的数据结构,得到第五图像;或者,更新所述第二图像的数据结构,得到第六图像。一些实施方式中,所述获取第一图像之后,所述方法还包括:确定图像处理方式,所述图像处理方式至少包括特征变换和数据结构更新中的一种。一些实施方式中,所述根据预设策略对所述第一图像进行更新,得到第二图像之后,所述方法还包括:以所述第一图像和所述第二图像作为训练数据,对预设模型进行训练,得到训练后的语音识别模型。一些实施方式中,当所述目标图像为至少一个时,所述方法还包括:根据业务类型、历史图像中的至少一项,从所述目标图像中去除无效图像。第二方面中,本申请实施例提供一种图像处理装置,具有实现对应于上述第一方面提供的图像处理方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。一些实施方式中,所述图像处理装置包括:获取模块,用于获取第一图像,所述第一图像包括至少一个时域特征和至少一个频域特征;处理模块,用于根据预设策略对所述获取模块获取的所述第一图像进行更新,得到第二图像;其中,所述预设策略至少包括以下项之一:在时域上变换至少一个所述时域特征的时域位置;或者,在频域上变换至少一个所述频域特征的频域位置。本申请实施例又一方面提供了一种图像处理装置,其包括至少一个连接的处理器、存储器和输入输出单元,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述存储器中的计算机程序来执行上述第本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,所述方法包括:/n获取第一图像,所述第一图像包括至少一个时域特征和至少一个频域特征;/n根据预设策略对所述第一图像进行更新,得到第二图像;/n其中,所述预设策略至少包括以下项之一:/n在时域上变换至少一个所述时域特征的时域位置;/n或者,在频域上变换至少一个所述频域特征的频域位置。/n

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:
获取第一图像,所述第一图像包括至少一个时域特征和至少一个频域特征;
根据预设策略对所述第一图像进行更新,得到第二图像;
其中,所述预设策略至少包括以下项之一:
在时域上变换至少一个所述时域特征的时域位置;
或者,在频域上变换至少一个所述频域特征的频域位置。


2.根据权利要求1所述的方法,其特征在于,所述根据预设策略对所述第一图像进行更新,得到第二图像,包括:
获取所述第一图像在时域上的第一时域长度;
获取第一时域位置、第二时域位置和第三时域位置;其中,所述第一时域位置为时域上进行时域位置变换的长度,所述第一时域位置小于预设时域变换长度;所述第二时域位置小于第一变换长度,所述第一变换长度根据所述第一时域长度与所述第一时域位置得到;所述第三时域位置根据所述第一时域长度、所述第一时域位置和第二时域位置得到;
将所述第一时域位置与所述第二时域位置之间的时域信号作为第一特征块,将所述第一时域位置与所述第三时域位置之间的时域信号作为第二特征块;
交换所述第一特征块与所述第二特征块在所述第一图像中的时域位置,得到第三图像。


3.根据权利要求2所述的方法,其特征在于,所述第一时域长度为W,所述预设时域变换长度为W1,所述第一变换长度为W2;第一时域位置为ti,j,第二时域位置为ti,j+1,第三时域位置为ti,j+2;
其中,i为第i次在时域上进行时域位置变换的操作,ti,j为在第i次中第j次获取的时域位置;
W1、W2、ti,j、ti,j+1、ti,j+2、i、j均为正整数,W2=W-2ti,j;
0<ti,j≤W1,0<ti,j+1≤W-2ti,j,ti,j+ti,j+1<ti,j+2≤W-ti,j。


4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据预设策略对所述第一图像进行更新,得到第二图像,还包括:
获取所述第一图像在频域上的第一频率宽度;
获取第一频域位置、第二频域位置和第三频域位置;其中,所述第一频域位置为频域上进行频域位置变换的长度,所述第一频域位置小于预设频域变换宽度;所述第二宽度位置小于第一变换宽度,所述第二宽度位置根据所述第一频率宽度、所述第一频域位置和第二频域位置得到,所述第三宽度位置根据所述第一频率宽度、所述第一频域位置和第二频域位置得到;
将所述第一频域位置与所述第二频域位置之间的时域信号作为第二特征块,将所述第一时域位置与所述第三时域位置之间的时域信号作为第四特征块;
交换所述第三特征块与所述第四特征块在所述第一图像中的频域位置,得到第四图像。


5.根据...

【专利技术属性】
技术研发人员:吴志勇宋星辰黄羿衡
申请(专利权)人:清华大学深圳国际研究生院腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1