音频数据的处理方法和装置、存储介质制造方法及图纸

技术编号:25552195 阅读:37 留言:0更新日期:2020-09-08 18:52
本发明专利技术提供了一种音频数据的处理方法和装置、存储介质,包括:获取待处理音频数据的N个第一特征信息,其中,N为自然数;确定N个第一特征信息对应的N个语种,将N个音频数据分别输入至N个语种对应的N个语言识别模块中,其中,待处理音频数据包括N个音频数据,N个音频数据与N个第一特征信息一一对应;通过N个语言识别模块分别对N个音频数据进行处理,确定N个音频数据对应的N组目标词汇集,其中,N组目标词汇集中的词汇均为敏感词汇。采用上述技术方案,解决了相关技术中,无法有效的对方言进行脱敏的技术问题。

【技术实现步骤摘要】
音频数据的处理方法和装置、存储介质
本专利技术涉及计算机领域,具体而言,涉及一种音频数据的处理方法和装置、存储介质。
技术介绍
在语音识别领域中,用户的账号、密码、地址等敏感信息如果直接暴露出来,会极大的影响用户的财产和人身安全。另一方面,反动、暴力、色情、辱骂等不正当言论也会对网络环境造成极大的破坏。因此语音数据的脱敏是一个很重要的环节。如今流行的脱敏技术方案是维护一套敏感词的规则库,语音转写内容经过规则匹配将敏感的词语抹掉或置为*号。但对于方言,其规则,发音和普通话相比有较大的变化,还存在方言和普通话穿插的场景。如果以普通话的规则去匹配方言的敏感词,会使方言的脱敏效果很差。因此,针对相关技术中,无法有效的对方言进行脱敏的问题,尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种音频数据的处理方法和装置、存储介质,以至少解决相关技术中,无法有效的对方言进行脱敏的技术问题。根据本专利技术实施例的一个方面,提供了一种音频数据的处理方法,包括:获取待处理音频数据的N个第一特征信息,其中,上述N为自然数;确定上述N个第一特征信息对应的N个语种,将N个音频数据分别输入至上述N个语种对应的N个语言识别模块中,其中,上述待处理音频数据包括上述N个音频数据,上述N个音频数据与上述N个第一特征信息一一对应;通过上述N个语言识别模块分别对上述N个音频数据进行处理,确定上述N个音频数据对应的N组目标词汇集,其中,上述N组目标词汇集中的词汇均为敏感词汇。根据本专利技术实施例的另一方面,还提供了一种音频数据的处理装置,包括:检第一获取单元,用于获取待处理音频数据的N个第一特征信息,其中,上述N为自然数;第一确定单元,用于确定上述N个第一特征信息对应的N个语种,将N个音频数据分别输入至上述N个语种对应的N个语言识别模块中,其中,上述待处理音频数据包括上述N个音频数据,上述N个音频数据与上述N个第一特征信息一一对应;第二确定单元,用于通过上述N个语言识别模块分别对上述N个音频数据进行处理,确定上述N个音频数据对应的N组目标词汇集,其中,上述N组目标词汇集中的词汇均为敏感词汇。根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述音频数据的处理方法。根据本专利技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的音频数据的处理方法。在本专利技术实施例中,获取待处理音频数据的N个第一特征信息,其中,上述N为自然数;确定上述N个第一特征信息对应的N个语种,将N个音频数据分别输入至上述N个语种对应的N个语言识别模块中,其中,上述待处理音频数据包括上述N个音频数据,上述N个音频数据与上述N个第一特征信息一一对应;通过上述N个语言识别模块分别对上述N个音频数据进行处理,确定上述N个音频数据对应的N组目标词汇集,其中,上述N组目标词汇集中的词汇均为敏感词汇,进而解决了相关技术中,无法有效的对方言进行脱敏的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的音频数据的处理方法的流程示意图;图2是根据本专利技术实施例的另一种可选的音频数据的处理方法的流程示意图;图3是根据本专利技术实施例的一种可选的音频数据的处理方法的结构示意图;图4是根据本专利技术实施例的一种可选的电子装置的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。可选地,在本实施例中,如图1所示,提供了一种音频数据的处理方法的方法,具体可以包括以下步骤:步骤S102,获取待处理音频数据的N个第一特征信息,其中,上述N为自然数;步骤S104,确定上述N个第一特征信息对应的N个语种,将N个音频数据分别输入至上述N个语种对应的N个语言识别模块中,其中,上述待处理音频数据包括上述N个音频数据,上述N个音频数据与上述N个第一特征信息一一对应;步骤S106,通过上述N个语言识别模块分别对上述N个音频数据进行处理,确定上述N个音频数据对应的N组目标词汇集,其中,上述N组目标词汇集中的词汇均为敏感词汇。其中,敏感词汇可以理解为一种包含用户的账号、密码、地址等敏感信息的词汇。或者,敏感词汇也可以为与反动、暴力、色情、辱骂等不正当言论相关的词汇。可理解,以上仅为一种示例,本实施例在此不作任何限定。可选地,上述音频数据的处理方法可以但不限于数据脱敏的场景中。通过本实施例,获取待处理音频数据的N个第一特征信息,其中,上述N为自然数;确定上述N个第一特征信息对应的N个语种,将N个音频数据分别输入至上述N个语种对应的N个语言识别模块中,其中,上述待处理音频数据包括上述N个音频数据,上述N个音频数据与上述N个第一特征信息一一对应;通过上述N个语言识别模块分别对上述N个音频数据进行处理,确定上述N个音频数据对应的N组目标词汇集,其中,上述N组目标词汇集中的词汇均为敏感词汇,进而解决了相关技术中,无法有效的对方言进行脱敏的技术问题。在一种可选的实施例中,上述确定上述N个第一特征信息对应的N个语种,包括:将每个上述N个第一特征信息与一组样本特征信息一一匹配,确定与上述N个第一特征信息匹配的N个第二特征信息;其中,上述一组样本特征信息为预先确定的样本特征信息,上述一组样本特征信息中的一个样本特征信息对应于一个语种,上述N个第二特征信息为上述一组样本特征信息中的N个样本特征信息;根据上述N个第二特征信息确定上述N个语种,其中,上述N个语种与上述N个第二特征信息一一对应,上述N个第二特征信息用于指示上述N个语种对应的上述N个语言识别模块。在一种可选地实施例中,在上述将N个音频数据分别输入至上述N个语种对应的N个语言识别模块中之前,上述方法还包括:对上述N个第一特本文档来自技高网
...

【技术保护点】
1.一种音频数据的处理方法,其特征在于,包括:/n获取待处理音频数据的N个第一特征信息,其中,所述N为自然数;/n确定所述N个第一特征信息对应的N个语种,将N个音频数据分别输入至所述N个语种对应的N个语言识别模块中,其中,所述待处理音频数据包括所述N个音频数据,所述N个音频数据与所述N个第一特征信息一一对应;/n通过所述N个语言识别模块分别对所述N个音频数据进行处理,确定所述N个音频数据对应的N组目标词汇集,其中,所述N组目标词汇集中的词汇均为敏感词汇。/n

【技术特征摘要】
1.一种音频数据的处理方法,其特征在于,包括:
获取待处理音频数据的N个第一特征信息,其中,所述N为自然数;
确定所述N个第一特征信息对应的N个语种,将N个音频数据分别输入至所述N个语种对应的N个语言识别模块中,其中,所述待处理音频数据包括所述N个音频数据,所述N个音频数据与所述N个第一特征信息一一对应;
通过所述N个语言识别模块分别对所述N个音频数据进行处理,确定所述N个音频数据对应的N组目标词汇集,其中,所述N组目标词汇集中的词汇均为敏感词汇。


2.根据权利要求1所述的方法,其特征在于,所述确定所述N个第一特征信息对应的N个语种,包括:
将每个所述N个第一特征信息与一组样本特征信息一一匹配,确定与所述N个第一特征信息匹配的N个第二特征信息;其中,所述一组样本特征信息为预先确定的样本特征信息,所述一组样本特征信息中的一个样本特征信息对应于一个语种,所述N个第二特征信息为所述一组样本特征信息中的N个样本特征信息;
根据所述N个第二特征信息确定所述N个语种,其中,所述N个语种与所述N个第二特征信息一一对应,所述N个第二特征信息用于指示所述N个语种对应的所述N个语言识别模块。


3.根据权利要求1所述的方法,其特征在于,在所述将N个音频数据分别输入至所述N个语种对应的N个语言识别模块中之前,所述方法还包括:
对所述N个第一特征信息分别标记N个时间信息,其中,所述N个时间信息用于指示在所述待处理音频数据中产生所述N个第一特征信息的起止时间;
按照所述N个时间信息对所述待处理音频数据进行拆分,得到所述N个音频数据。


4.根据权利要求1所述的方法,其特征在于,所述通过所述N个语言识别模块分别对所述N个音频数据进行处理,确定所述N个音频数据对应的N组目标词汇集,包括:
通过所述N个语言识别模块分别确定所述N个音频数据对应的N个文本数据;
将所述N个文本数据中的词汇与所述N个语言识别模块中预先记录的N组样本词汇集中的词汇进行匹配,得到所述N组目标词汇集,其中,所述N组目标词汇集与所述N个文本数据一一对应,所述N组目标词汇集中的一个目标词汇集所包括的M个词汇与所述N组样本词汇集中的一个样本词汇集中的M个词汇匹配,所述M为自然数。


5.根据权利要求4所述的方法,其特征在于,在所述将所述N个文本数据中的词汇与所述N个语言识别模块中预先记录的N组样本词汇集中的词汇进行匹配,得到所述N组目标词汇集之后,所述...

【专利技术属性】
技术研发人员:刘畅奕航梁志婷徐世超徐浩
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1