音频播放方法、装置、音频播放设备以及电子设备制造方法及图纸

技术编号:39140754 阅读:15 留言:0更新日期:2023-10-23 14:54
本申请关于一种音频播放方法、装置、音频播放设备以及电子设备,属于音频处理技术领域,该方法中,音频播放端在播放音频时,通过已播放的音频片段,预测下一音频片段的播放模式为消音模式还是正常播放模式,基于所预测的播放模式,对该下一音频片段进行播放,与通过内容平台对音频进行审核和消音相比,能够降低对包含敏感内容的音频漏消音的概率,并且,能够降低音频审核所耗费的人力成本和时间成本。降低音频审核所耗费的人力成本和时间成本。降低音频审核所耗费的人力成本和时间成本。

【技术实现步骤摘要】
音频播放方法、装置、音频播放设备以及电子设备


[0001]本申请涉及音频处理
,尤其涉及一种音频播放方法、装置、音频播放设备以及电子设备。

技术介绍

[0002]当今互联网信息的爆炸式增长带来了大量的内容审查需求,其中,对音频内容进行审查以及对包含敏感内容的音频进行消音对于避免潜在的暴力、色情等敏感内容被肆意传播尤为重要。
[0003]相关技术中,内容平台提供音频内容审查功能,内容平台先对上传至该内容平台的音频进行分级,然后按照不同分级对应的审查规则,对音频的内容进行检测,对包含敏感内容的音频进行消音,向用户提供消音后的音频,用户对消音后的音频进行播放。
[0004]然而,上述方法中,通过内容平台对包含敏感内容的音频进行消音,对于信息快速增长的互联网环境来说,该方法难以对所有包含敏感内容的音频均进行消音,导致包含敏感内容的音频漏消音的概率较大,并且,对音频的审查需要耗费大量的人力成本和时间成本。

技术实现思路

[0005]本申请提供一种音频播放方法、装置、音频播放设备和电子设备,能够降低对包含敏感内容的音频漏消音的概率,降低音频审查所耗费的人力成本和时间成本。本申请的技术方案如下。
[0006]根据本申请实施例的第一方面,提供一种音频播放方法,该方法包括:
[0007]播放目标音频,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频片段的播放模式,该播放模式包括消音模式和正常播放模式;
[0008]基于下一音频片段的播放模式,对下一音频片段进行播放。
[0009]上述方法中,音频播放端在播放音频时,通过已播放的音频片段,预测下一音频片段的播放模式为消音模式还是正常播放模式,基于所预测的播放模式,对该下一音频片段进行播放,与通过内容平台对音频进行审核和消音相比,能够降低对包含敏感内容的音频漏消音的概率,并且,能够降低音频审核所耗费的人力成本和时间成本。
[0010]可选地,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频片段的播放模式,包括:
[0011]对已播放的音频片段进行语义检测,若检测到的语义包含预设敏感词的部分字符,则预测下一音频片段的播放模式为消音模式。
[0012]上述方法中,在检测到的语义包含预设敏感词的部分字符的情况下,判断下一音频片段的播放模式为消音模式,从而在预设敏感词未全部出现时即对其进行消音,能够在保证消音的正确性的情况下,保证不漏消音,能够提高对敏感内容进行消音的有效性。
[0013]可选地,基于目标音频中已播放的音频片段,预测已播放的音频片段的下一音频
片段的播放模式,包括:
[0014]确定下一音频片段之前的至少一个音频片段中预设敏感词的出现频率;
[0015]基于出现频率,确定下一音频片段中预设敏感词的出现概率;
[0016]若出现概率大于预设阈值,则预测下一音频片段的播放模式为消音模式。
[0017]上述方法中,基于预设敏感词在之前音频片段中的出现频率来预测下一音频片段的播放模式,从全局的角度进行分析,使得预测的结果更加贴合实际的场景和语境,并且,在预设敏感词出现之前就进行消音,能够保证消音的完整性和有效性。
[0018]可选地,不同的语言类型对应于不同的敏感词库,该方法还包括:
[0019]识别已播放的音频片段对应的语言类型,从所识别出的语言类型对应的敏感词库中确定预设敏感词。
[0020]上述方法中,通过为不同地点语言类型设置不同的敏感词库,能够保证对不同语言类型的音频中的敏感内容进行全面的检测,从而降低漏消音的概率。
[0021]可选地,不同的预设对象对应于不同的敏感词库,该方法还包括:
[0022]对已播放的音频片段进行音色识别,若所识别出的音色与任一预设对象的音色相匹配,则从预设对象对应的敏感词库中确定预设敏感词。
[0023]上述方法中,通过为不同的预设对象设置不同的敏感词库,使得敏感内容检测更加具有针对性和个性化。
[0024]可选地,该方法还包括:
[0025]对下一音频片段进行敏感词识别,若从下一音频片段中检测出敏感词库中不存在的敏感词,则基于所检测出的敏感词,对敏感词库进行更新。
[0026]上述方法中,通过对实际的下一音频片段进行敏感词识别,能够发现原来敏感词库中不存在的敏感词,从而对敏感词库进行更新,能够不断对敏感词库进行扩充,从而降低漏消音的概率;同时,能够发现原来敏感词库中存在而未检测出的敏感词,从而对预测方式进行不断优化,提高预测的准确率,从而降低漏消音的概率。
[0027]可选地,基于下一音频片段的播放模式,对下一音频片段进行播放,包括:
[0028]若播放模式为消音模式,则对下一音频片段进行消音播放;
[0029]若播放模式为正常播放模式,则对下一音频片段进行正常播放。
[0030]可选地,若播放模式为消音模式,则对下一音频片段进行消音播放,包括:
[0031]若播放模式为消音模式,则采用反声波消音、静音消音和覆盖消音中任一种方式对下一音频片段进行消音播放。
[0032]可选地,该方法还包括:
[0033]响应于对消音模式的开启、关闭或修改操作,向目标终端发送密码验证请求;
[0034]接收目标终端发送的验证通过消息,对消音模式进行开启、关闭或修改操作。
[0035]上述方法中,通过密码验证的方式限制对消音模式的开关和修改,能够保证由于消音模式的随意更改导致的消音失效,有利于提高在音频播放端进行消音的强制性和有效性。
[0036]根据本申请实施例的第二方面,提供一种音频播放装置,该装置包括:
[0037]播放模块,用于播放目标音频;
[0038]预测模块用于,基于目标音频中已播放的音频片段,预测已播放的音频片段的下
一音频片段的播放模式,该播放模式包括消音模式和正常播放模式;
[0039]播放模块,还用于基于下一音频片段的播放模式,对下一音频片段进行播放。
[0040]可选地,该预测模块用于:
[0041]对已播放的音频片段进行语义检测,若检测到的语义包含预设敏感词的部分字符,则预测下一音频片段的播放模式为消音模式。
[0042]可选地,该预测模块用于:
[0043]确定下一音频片段之前的至少一个音频片段中预设敏感词的出现频率;
[0044]基于出现频率,确定下一音频片段中出现预设,敏感词的出现概率;
[0045]若出现概率大于预设阈值,则预测下一音频片段的播放模式为消音模式。
[0046]可选地,不同的语言类型对应于不同的敏感词库,该装置还包括:
[0047]第一识别模块,用于识别已播放的音频片段对应的语言类型;
[0048]第一确定模块,用于从所识别出的语言类型对应的敏感词库中确定预设敏感词。
[0049]可选地,不同的预设对象对应于不同的敏感词库,该装本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频播放方法,其特征在于,该方法包括:播放目标音频,基于所述目标音频中已播放的音频片段,预测所述已播放的音频片段的下一音频片段的播放模式,所述播放模式包括消音模式和正常播放模式;基于所述下一音频片段的播放模式,对所述下一音频片段进行播放。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标音频中已播放的音频片段,预测所述已播放的音频片段的下一音频片段的播放模式,包括:对所述已播放的音频片段进行语义检测,若检测到的语义包含预设敏感词的部分字符,则预测所述下一音频片段的播放模式为消音模式。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标音频中已播放的音频片段,预测所述已播放的音频片段的下一音频片段的播放模式,包括:确定所述下一音频片段之前的至少一个音频片段中预设敏感词的出现频率;基于所述出现频率,确定所述下一音频片段中所述预设敏感词的出现概率;若所述出现概率大于预设阈值,则预测所述下一音频片段的播放模式为消音模式。4.根据权利要求2或3所述的方法,其特征在于,不同的语言类型对应于不同的敏感词库,所述方法还包括:识别所述已播放的音频片段对应的语言类型,从所识别出的语言类型对应的敏感词库中确定所述预设敏感词。5.根据权利要求2或3所述的方法,其特征在于,不同的预设对象对应于不同的敏感词库,所述方法还包括:对所述已播放的音频片段进行音色识别,若所识别出的音色与任一预设对象的音色相匹配,则从所述预设对象对应的敏感词库中确定所述预设敏感词。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述下一音频片段进行敏感词识别,若从所述下一音频片段中检测出敏感词库中不存在的敏感词,则基于所检测出的敏感词,对所述敏感词库进行更新。7.根据权利要求1所述的方法,其特征在于,所述基于所述下一音频片段的播放模式,对所述下一音频片段进行播放,包括:若所述播放模式为消音模式,则对所述下一音频片段进行消音播放;若所述播放模式为正常播放模式,则对所述下一音频片段进行正常播放;若所述播放模式为消音模式,则对所述下一音频片段进行消音播放,具体包括:若所述播放模式为消音模式,则采用反声波消音、静音消音和覆盖消音中任一种方式对所述下一音频片段进行消音播放。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于对所述消音模式的开启、关闭或修改操作,向目标终端发送密码验证请求;接收所述目标终端发送的验证通过消息,对所述消音模式进行开启、关闭或修改操作。9.一种音频播放装置,其特征在于,该装置包括:播放模块,用于播放目标音频;预测模块用于,基于所述目标音频中已播放的音频片段,预测所述已播放的音频片段的下一音频片段的播放模式,所述播放模式包括消音模式和正常播放模式;所述播放模块,还用于基于所述下一音频片段的播放模式,对所述下一音频片段进行
...

【专利技术属性】
技术研发人员:李良斌
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1