当前位置: 首页 > 专利查询>鹏城实验室专利>正文

语音盲水印注入方法、装置、设备及存储介质制造方法及图纸

技术编号:28983300 阅读:17 留言:0更新日期:2021-06-23 09:32
本发明专利技术属于计算机技术领域,公开了一种语音盲水印注入方法、装置、设备及存储介质。该方法包括:对待处理语音进行预处理,得到多个预设长度的语音段;根据预设编码策略对待处理水印进行编码,得到初始水印编码;根据预设长度对初始水印编码进行标准化处理,得到处理后的水印编码;将语音段以及水印编码输入至训练好的预设神经网络,得到注入水印的语音段;对注入水印的语音段进行后处理,得到注入水印的音频。通过预设神经网络在语音中添加水印编码,得到注入水印的音频,并且通过预设编码策略对水印进行了编码,防止信息被盗窃者利用,通过本申请提出的方法进行语音水印注入,不能通过逆向工程反推出水印并去除,保护了语音的版权。

【技术实现步骤摘要】
语音盲水印注入方法、装置、设备及存储介质
本专利技术涉及计算机
,尤其涉及一种语音盲水印注入方法、装置、设备及存储介质。
技术介绍
由于深度学习的发展,个人版权的保护变得越来越重要。语音版权的保护面临巨大挑战。在商业应用中,常常需要保护语音的版权,并且需要确定语音版权的来源,一个未经过加水印的语音,一旦被盗用,常常难以进行追查。水印中的信息常常需要加密,没有经过加密的信息,很容易被盗窃者利用,信息安全的保密也面临着挑战。在有大量语音需要加水印时,一个高效的语音加密算法,可以更好的保证商业应用。现有的语音水印注入方法,一般为基于频谱或能量谱的水印注入,这种传统的方法有可能通过逆向工程,反推出原有水印并去除。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种语音盲水印注入方法、装置、设备及存储介质,旨在解决现有的语音水印注入方法生成的带有水印的语音,可以通过逆向工程反推出原有水印并去除的技术问题。为实现上述目的,本专利技术提供了一种语音盲水印注入方法,所述方法包括以下步骤:对待处理语音进行预处理,得到多个预设长度的语音段;根据预设编码策略对待处理水印进行编码,得到初始水印编码;根据所述预设长度对所述初始水印编码进行标准化处理,得到处理后的水印编码;将所述语音段以及所述水印编码输入至训练好的预设神经网络,得到注入水印的语音段;对所述注入水印的语音段进行后处理,得到注入水印的音频。可选地,所述将所述语音段以及所述水印编码输入至训练好的预设神经网络,得到注入水印的语音段之前,所述方法还包括:对样本语音集中的样本语音进行预处理,得到各样本语音对应的多个预设长度的样本语音段;根据预设编码策略对样本水印进行编码,得到初始样本水印编码;根据所述预设长度对所述初始样本水印编码进行标准化处理,得到处理后的样本水印编码;将所述样本语音段以及所述样本水印编码输入至预设神经网络,获取所述预设神经网络的损失值;当所述损失值小于或者等于预设损失阈值时,得到训练好的预设神经网络。可选地,所述预设神经网络至少包括:加密层、变分编码器以及解密层;所述将所述样本语音段以及所述样本水印编码输入至预设神经网络,获取所述预设神经网络的损失值,包括:将所述样本语音段以及所述样本水印编码输入至所述加密层,得到注入水印的样本语音段;将所述注入水印的样本语音段输入至所述变分编码器,获取所述变分编码器对应的均值和方差;将所述注入水印的样本语音段输入至所述解密层,得到对应的复原语音段以及复原水印编码;根据所述样本语音段、所述样本水印编码、所述注入水印的样本语音段、所述均值、所述方差、所述复原语音段以及所述复原水印编码确定所述预设神经网络的损失值。可选地,所述根据所述样本语音段、所述样本水印编码、所述注入水印的样本语音段、所述均值、所述方差、所述复原语音段以及所述复原水印编码确定所述预设神经网络的损失值,包括:根据所述样本语音段与所述注入水印的样本语音段确定第一距离;根据所述样本水印编码与所述复原水印编码确定第二距离;根据所述样本语音段与所述复原语音段确定第三距离;根据所述均值以及所述方差确定与正态分布之间的第四距离;根据所述第一距离、所述第二距离、所述第三距离以及所述第四距离确定所述预设神经网络的损失值。可选地,所述对待处理语音进行预处理,得到多个预设长度的语音段,包括:按照预设长度对所述待处理语音进行分割,得到分割后的待处理语音;判断所述分割后的待处理语音的长度是否达到所述预设长度;在所述分割后的待处理语音的长度未达到所述预设长度时,对所述分割后的待处理语音进行赘语填充,得到多个预设长度的语音段;相应地,所述对所述注入水印的语音段进行后处理,得到注入水印的音频,包括:对所述注入水印的语音段进行拼接以及赘语清除,得到注入水印的音频。可选地,所述根据所述预设长度对所述初始水印编码进行标准化处理,得到处理后的水印编码,包括:在所述初始水印编码中加入起始编码,得到起始水印编码;根据所述预设长度将所述起始水印编码循环预设次数,得到循环后的目标水印编码;在所述目标水印编码的长度大于所述预设长度时,根据所述预设长度对所述目标水印编码进行截取,以得到处理后的水印编码;在所述目标水印编码的长度小于所述预设长度时,添加赘语,以得到处理后的水印编码。可选地,所述对所述注入水印的语音段进行后处理,得到注入水印的音频之后,所述方法还包括:将多个包含水印的语音段输入至所述预设神经网络,得到解码后的原语音段以及原水印编码;对所述原语音段进行拼接以及赘语清除,得到原语音;搜索所述原水印编码中的起始位置,根据所述预设编码策略进行反向解码,得到原水印。此外,为实现上述目的,本专利技术还提出一种语音盲水印注入装置,所述语音盲水印注入装置包括:预处理模块,用于对待处理语音进行预处理,得到多个预设长度的语音段;编码模块,用于根据预设编码策略对待处理水印进行编码,得到初始水印编码;标准化处理模块,用于根据所述预设长度对所述初始水印编码进行标准化处理,得到处理后的水印编码;水印注入模块,用于将所述语音段以及所述水印编码输入至训练好的预设神经网络,得到注入水印的语音段;后处理模块,用于对所述注入水印的语音段进行后处理,得到注入水印的音频。此外,为实现上述目的,本专利技术还提出一种语音盲水印注入设备,所述语音盲水印注入设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音盲水印注入程序,所述语音盲水印注入程序配置为实现如上文所述的语音盲水印注入方法的步骤。此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有语音盲水印注入程序,所述语音盲水印注入程序被处理器执行时实现如上文所述的语音盲水印注入方法的步骤。本专利技术通过对待处理语音进行预处理,得到多个预设长度的语音段;根据预设编码策略对待处理水印进行编码,得到初始水印编码;根据预设长度对初始水印编码进行标准化处理,得到处理后的水印编码;将语音段以及水印编码输入至训练好的预设神经网络,得到注入水印的语音段;对注入水印的语音段进行后处理,得到注入水印的音频。通过预设神经网络在语音中添加水印编码,得到注入水印的音频,保护了语音的版权;并且通过预设编码策略对水印进行了编码,防止信息被盗窃者利用,且保证了水印的隐蔽性;通过本申请提出的方法进行语音水印注入,只要窃取方在没有获取模型的情况下,可以保证水印以及敏感信息不被侦测到,不能通过逆向工程反推出水印并去除,解决了现有的语音水印注入方法生成的带有水印的语音,可以通过逆向工程反推出原有水印并去除的技术问题。附图说明图1是本专利技术实施例方案涉及的硬件运本文档来自技高网...

【技术保护点】
1.一种语音盲水印注入方法,其特征在于,所述语音盲水印注入方法包括:/n对待处理语音进行预处理,得到多个预设长度的语音段;/n根据预设编码策略对待处理水印进行编码,得到初始水印编码;/n根据所述预设长度对所述初始水印编码进行标准化处理,得到处理后的水印编码;/n将所述语音段以及所述水印编码输入至训练好的预设神经网络,得到注入水印的语音段;/n对所述注入水印的语音段进行后处理,得到注入水印的音频。/n

【技术特征摘要】
1.一种语音盲水印注入方法,其特征在于,所述语音盲水印注入方法包括:
对待处理语音进行预处理,得到多个预设长度的语音段;
根据预设编码策略对待处理水印进行编码,得到初始水印编码;
根据所述预设长度对所述初始水印编码进行标准化处理,得到处理后的水印编码;
将所述语音段以及所述水印编码输入至训练好的预设神经网络,得到注入水印的语音段;
对所述注入水印的语音段进行后处理,得到注入水印的音频。


2.如权利要求1所述的语音盲水印注入方法,其特征在于,所述将所述语音段以及所述水印编码输入至训练好的预设神经网络,得到注入水印的语音段之前,所述方法还包括:
对样本语音集中的样本语音进行预处理,得到各样本语音对应的多个预设长度的样本语音段;
根据预设编码策略对样本水印进行编码,得到初始样本水印编码;
根据所述预设长度对所述初始样本水印编码进行标准化处理,得到处理后的样本水印编码;
将所述样本语音段以及所述样本水印编码输入至预设神经网络,获取所述预设神经网络的损失值;
当所述损失值小于或者等于预设损失阈值时,得到训练好的预设神经网络。


3.如权利要求2所述的语音盲水印注入方法,其特征在于,所述预设神经网络至少包括:加密层、变分编码器以及解密层;
所述将所述样本语音段以及所述样本水印编码输入至预设神经网络,获取所述预设神经网络的损失值,包括:
将所述样本语音段以及所述样本水印编码输入至所述加密层,得到注入水印的样本语音段;
将所述注入水印的样本语音段输入至所述变分编码器,获取所述变分编码器对应的均值和方差;
将所述注入水印的样本语音段输入至所述解密层,得到对应的复原语音段以及复原水印编码;
根据所述样本语音段、所述样本水印编码、所述注入水印的样本语音段、所述均值、所述方差、所述复原语音段以及所述复原水印编码确定所述预设神经网络的损失值。


4.如权利要求3所述的语音盲水印注入方法,其特征在于,所述根据所述样本语音段、所述样本水印编码、所述注入水印的样本语音段、所述均值、所述方差、所述复原语音段以及所述复原水印编码确定所述预设神经网络的损失值,包括:
根据所述样本语音段与所述注入水印的样本语音段确定第一距离;
根据所述样本水印编码与所述复原水印编码确定第二距离;
根据所述样本语音段与所述复原语音段确定第三距离;
根据所述均值以及所述方差确定与正态分布之间的第四距离;
根据所述第一距离、所述第二距离、所述第三距离以及所述第四距离确定所述预设神经网络的损失值。


5.如权利要求1所述的语音盲水印注入方法,其特征在于,所...

【专利技术属性】
技术研发人员:黄炜张伟哲束建钢钟晓雄艾建文
申请(专利权)人:鹏城实验室
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1