音频处理方法、装置及计算机可读存储介质制造方法及图纸

技术编号:31502347 阅读:20 留言:0更新日期:2021-12-22 23:22
本申请提出了一种音频处理方法、装置及计算机可读存储介质,涉及计算机技术领域,该方法包括:获取待处理音频,所述待处理音频包括一个或多个音频帧;针对所述一个或多个音频帧中的任一音频帧,对所述任一音频帧进行切分处理得到多个音频片段,确定所述多个音频片段中每个音频片段的音频类别,根据所述每个音频片段的音频类别确定所述任一音频帧的语音识别结果;根据各个音频帧的语音识别结果,将所述待处理音频中语音识别结果为目标识别结果的音频帧进行剔除,得到处理后的音频;对所述处理后的音频进行风格转换处理,得到目标音频。通过本申请实施例,可以提高音频风格转换所涉及的语音的准确性。及的语音的准确性。及的语音的准确性。

【技术实现步骤摘要】
音频处理方法、装置及计算机可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种音频处理方法、装置及计算机可读存储介质。

技术介绍

[0002]音频是多媒体中的一种重要媒体,音频中的语音是人类通过发音器官发出来的、具有一定意义的、目的是用来进行社会交际的声音,对音频进行风格转换,是指将音频中的语音的语言类型进行转换,例如音频中的语音的语言类型为卫藏方言,可以将音频中的语音的语言类型转换为康巴方言。
[0003]音频中通常会出现一些非正常语音,例如哼唱、犹豫、笑声、喊叫声等噪音,导致音频在进行风格转换时出现准确率较差的问题,即在风格转换前后,音频中的语音所对应的文本信息发生变化,例如,原始音频中的语音所对应的文本本意是问“你去哪儿”,进行风格转换后的音频中的语音所对应的文本变成了问“你去吃饭吗”,此时,虽然风格转换虽然能够解决语言不通的问题,但是却不能正确表达内容,因此提高音频风格转换所涉及的语音的准确性是十分有必要的。

技术实现思路

[0004]本申请实施例提供了一种音频处理方法、装置及计算机可读存储介质,可以提高音频风格转换所涉及的语音的准确性。
[0005]一方面,本申请实施例提供了一种音频处理方法,所述方法包括:
[0006]获取待处理音频,所述待处理音频包括一个或多个音频帧;
[0007]针对所述一个或多个音频帧中的任一音频帧,对所述任一音频帧进行切分处理得到多个音频片段,确定所述多个音频片段中每个音频片段的音频类别,根据所述每个音频片段的音频类别确定所述任一音频帧的语音识别结果;
[0008]根据各个音频帧的语音识别结果,将所述待处理音频中语音识别结果为目标识别结果的音频帧进行剔除,得到处理后的音频;
[0009]对所述处理后的音频进行风格转换处理,得到目标音频。
[0010]另一方面,本申请实施例提供了一种音频处理装置,所述装置包括:
[0011]获取模块,用于获取待处理音频,所述待处理音频包括一个或多个音频帧;
[0012]处理模块,用于针对所述一个或多个音频帧中的任一音频帧,对所述任一音频帧进行切分处理得到多个音频片段,确定所述多个音频片段中每个音频片段的音频类别,根据所述每个音频片段的音频类别确定所述任一音频帧的语音识别结果;
[0013]所述处理模块,还用于根据各个音频帧的语音识别结果,将所述待处理音频中语音识别结果为目标识别结果的音频帧进行剔除,得到处理后的音频;
[0014]所述处理模块,还用于对所述处理后的音频进行风格转换处理,得到目标音频。
[0015]相应地,本申请实施例提供了一种计算机设备,该设备包括处理器、通信接口和存
储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述存储器存储有计算机程序,所述处理器用于调用计算机程序,执行上述任一可能实现方式所述的音频处理方法。
[0016]相应地,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述处理器执行上述任一可能实现方式所述的音频处理方法所涉及的计算机程序。
[0017]相应地,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一可能实现方式所述的音频处理方法。
[0018]本申请实施例中,首先针对待处理音频包括的一个或多个音频帧中的任一音频帧,对任一音频帧进行切分处理得到多个音频片段,确定多个音频片段中每个音频片段的音频类别,根据每个音频片段的音频类别确定任一音频帧的语音识别结果,然后根据各个音频帧的语音识别结果,将待处理音频中语音识别结果为目标识别结果的音频帧进行剔除,得到处理后的音频,最后对处理后的音频进行风格转换处理,得到目标音频;上述音频处理方法,可以对待处理音频中的非语音音频进行剔除,从而减少外部干扰,提高音频的音频质量,这样有利于提高音频风格转换所涉及的语音的准确性。
附图说明
[0019]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本申请实施例提供的一种音频处理系统的架构示意图;
[0021]图2为本申请实施例提供的一种音频处理方法的流程示意图;
[0022]图3为本申请实施例提供的另一种音频处理方法的流程示意图;
[0023]图4为本申请实施例提供的确定音频类别的流程示意图;
[0024]图5为本申请实施例提供的x

vector模型的模型结构示意图;
[0025]图6为本申请实施例提供的另一种音频处理方法的流程示意图;
[0026]图7为本申请实施例提供的语音识别技术的原理图;
[0027]图8为本申请实施例提供的语音合成技术的原理图;
[0028]图9为本申请实施例提供的语音识别技术的处理示意图;
[0029]图10为本申请实施例提供的另一种音频处理方法的流程示意图;
[0030]图11是本申请实施例提供的一种音频处理装置的结构示意图;
[0031]图12是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0032]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0033]为了可以提高音频风格转换的准确率,本申请实施例基于云技术和人工智能技能
提出了一种音频处理方法。
[0034]云技术(Cloud technology)是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
[0035]云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
[0036]人工智能(Artific本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:获取待处理音频,所述待处理音频包括一个或多个音频帧;针对所述一个或多个音频帧中的任一音频帧,对所述任一音频帧进行切分处理得到多个音频片段,确定所述多个音频片段中每个音频片段的音频类别,根据所述每个音频片段的音频类别确定所述任一音频帧的语音识别结果;根据各个音频帧的语音识别结果,将所述待处理音频中语音识别结果为目标识别结果的音频帧进行剔除,得到处理后的音频;对所述处理后的音频进行风格转换处理,得到目标音频。2.根据权利要求1所述的方法,其特征在于,所述确定所述多个音频片段中每个音频片段的音频类别,包括:针对所述多个音频片段中的任一音频片段,对所述任一音频片段进行特征提取,得到所述任一音频片段的语音特征;利用音频分类模型的特征处理模块对所述任一音频片段的语音特征进行处理,得到所述任一音频片段的语音特征向量;利用所述音频分类模型的分类处理模块对所述任一音频片段的语音特征向量进行处理,得到任一音频片段的音频类别。3.根据权利要求1所述的方法,其特征在于,所述根据所述每个音频片段的音频类别确定所述任一音频帧的语音识别结果,包括:根据所述每个音频片段的音频类别,确定所述任一音频帧中音频类别为目标类别的音频片段的占比;根据所述占比确定所述任一音频帧的语音识别结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述占比确定所述任一音频帧的语音识别结果,包括:当所述占比小于比例阈值时,确定所述任一音频帧的语音识别结果为所述目标识别结果,所述目标识别结果用于指示所述任一音频帧为非语音音频。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:针对所述任一音频帧,确定所述任一音频帧为语音的预测值;其中,所述根据所述占比确定所述任一音频帧的语音识别结果,包括:根据所述占比和所述预测值确定所述任一音频帧为语音音频的参考概率;当所述参考概率小于概率阈值时,确定所述任一音频帧的语音识别...

【专利技术属性】
技术研发人员:马应龙索郎王修
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1