音频审核方法、装置、设备及可读存储介质制造方法及图纸

技术编号:33916888 阅读:20 留言:0更新日期:2022-06-25 20:23
本申请公开了音频审核方法、装置、设备及可读存储介质,该方法包括:对音频流进行切片,得到多个音频片段,并对音频片段进行排序;获取每一音频片段对应的文本信息;若文本信息中包含敏感词,将与敏感词对应的音频片段确定为目标音频片段,并获取敏感词对应的敏感词信息、目标音频片段对应的第一音频特征,及排在目标音频片段前后的各个音频片段对应的第二音频特征及第三音频特征;对目标音频片段进行评分,得到审核分值;若审核分值大于拦截阈值,对目标音频片段进行拦截。可见,本申请可以提高音频审核的准确性。此外,确定审核分值时,既考虑目标音频片段,又考虑播放顺序在目标音频片段前后的音频片段,进一步提高了音频审核的准确率。准确率。准确率。

【技术实现步骤摘要】
音频审核方法、装置、设备及可读存储介质


[0001]本申请涉及互联网
,更具体地说,涉及一种音频审核方法、装置、设备及可读存储介质。

技术介绍

[0002]为了规范网络环境,符合互联网规定,及出于对实际业务需求的考虑,对音频及音视频的审核是必须的,也是十分重要的。
[0003]现有技术中,通过语音识别,将音频转换为文本信息,并对该文本信息进行审核,直接将对文本信息的审核结果作为该音频的审核结果。这种方案,仅仅考虑了文本内容,并没有有效地利用音频本身,以至于现有的音频审核方法中仍存在没有精准识别违规内容的问题。
[0004]综上所述,亟需一种音频审核方法,用于进一步提高音频审核的准确性。

技术实现思路

[0005]有鉴于此,本申请提供了一种音频审核方法、装置、设备及可读存储介质,用于进一步提高音频审核的准确性。
[0006]为了实现上述目的,现提出的方案如下:
[0007]一种音频审核方法,包括:
[0008]获取待审核的音频流;
[0009]对所述音频流进行切片,得到多个音频片段,并基于各个音频片段在所述音频流中的播放顺序,对所述音频片段进行排序;
[0010]获取每一音频片段对应的文本信息;
[0011]判断每一文本信息中是否包含敏感词;
[0012]若所述文本信息中包含敏感词,将与所述敏感词对应的音频片段确定为目标音频片段,并获取所述敏感词对应的敏感词信息、所述目标音频片段对应的第一音频特征、排序在目标音频片段之前的各个音频片段对应的第二音频特征,及排序在目标音频片段后一位的音频片段对应的第三音频特征;
[0013]根据所述第一音频特征、所述第二音频特征、所述第三音频特征及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值;
[0014]判断所述审核分值是否大于预置的拦截阈值;
[0015]若所述审核分值大于所述拦截阈值,则对所述目标音频片段进行拦截。
[0016]可选的,获取所述敏感词对应的敏感词信息,包括:
[0017]通过预设的敏感词与类型及等级一一对应的敏感词表,确定所述敏感词对应的敏感词等级及敏感词类型。
[0018]可选的,所述文本信息中包含多个敏感词;
[0019]所述通过预设的敏感词与类型及等级一一对应的敏感词表,确定所述敏感词对应
的敏感词等级及敏感词类型,包括:
[0020]通过所述敏感词表,确定每一敏感词对应的敏感词等级;
[0021]将敏感词等级最高的敏感词,确定为目标敏感词;
[0022]查询所述敏感词表,获取所述目标敏感词对应的敏感词类型,所述敏感词信息中包括所述目标敏感词对应的敏感词类型及敏感词等级。
[0023]可选的,获取所述目标音频片段对应的第一音频特征,包括:
[0024]获取所述目标音频片段对应的第一情绪类型及第一短时能量值;
[0025]获取排序在目标音频片段之前的各个音频片段对应的第二音频特征,包括:
[0026]获取排序在目标音频片段之前的各个音频片段对应的第二短时能量值;
[0027]获取排序在目标音频片段前一位的音频片段对应的第二情绪类型;
[0028]获取排序在目标音频片段后一位的音频片段对应的第三音频特征,包括:
[0029]获取排序在目标音频片段后一位的音频片段对应的第三短时能量值;
[0030]获取排序在目标音频片段后一位的音频片段对应的第三情绪类型;
[0031]根据所述第一音频特征、所述第二音频特征、所述第三音频特征及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值,包括:
[0032]根据所述第一情绪类型、所述第一短时能量值、所述第二短时能量值、所述第二情绪类型、所述第三短时能量值、所述第三情绪类型及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值。
[0033]可选的,根据所述第一情绪类型、所述第一短时能量值、所述第二短时能量值、所述第二情绪类型、所述第三短时能量值、所述第三情绪类型及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值,包括:
[0034]计算所述第二短时能量值的平均值,作为短时能量平均值;
[0035]将所述第一短时能量值与所述短时能量平均值之差的平方,作为情绪波动值;
[0036]确定与所述第一情绪类型的激烈程度匹配的分值,作为第一情绪分值;
[0037]确定与所述第二情绪类型的激烈程度匹配的分值,作为第二情绪分值;
[0038]确定与所述情绪波动值的大小程度匹配的分值,作为第三情绪分值;
[0039]确定与所述第三情绪类型的激烈程度匹配的分值,作为第四情绪分值;
[0040]确定与所述第一短时能量值的大小程度匹配的分值,作为第一短时能量分值;
[0041]确定与排序在目标音频片段前一位的音频片段对应的第二短时能量值大小程度匹配的分值,作为第二短时能量分值;
[0042]确定与所述短时能量平均值的大小程度匹配的分值,作为第三短时能量分值;
[0043]确定与所述第三短时能量值的大小程度匹配的分值,作为第四短时能量分值;
[0044]确定与所述敏感词信息匹配的分值,作为敏感分值;
[0045]将所述第一情绪分值、所述第二情绪分值、所述第三情绪分值、所述第四情绪分值、所述第一短时能量分值、所述第二短时能量分值、第三短时能量分值、所述第四短时能量分值及所述敏感分值相加,得到审核分值。
[0046]可选的,获取所述目标音频片段对应的第一情绪类型,包括:
[0047]将所述目标音频片段输入至情绪分类模型中,得到目标音频片段对应的第一情绪类型;
[0048]获取排序在目标音频片段前一位的音频片段对应的第二情绪类型,包括:
[0049]将排序在目标音频片段前一位的音频片段输入至情绪分类模型中,得到所述排序在目标音频片段前一位的音频片段对应的第二情绪类型;获取排序在目标音频片段后一位的音频片段对应的第三情绪类型,包括:
[0050]将排序在目标音频片段后一位的音频片段输入至情绪分类模型中,得到所述排序在目标音频片段后一位的音频片段对应的第三情绪类型;
[0051]其中,所述情绪分类模型,以音频为训练样本,以音频对应的情绪类型为样本标签训练得到。
[0052]可选的,所述获取每一音频片段对应的文本信息,包括:
[0053]对所述每一音频片段进行编码,得到编码结果;
[0054]将所述编码结果输入至声学模型中,得到所述编码结果对应的文字信息,所述声学模型,以音频为训练样本,以音频对应的文字为样本标签,训练得到;
[0055]将所述文字信息输入至语言模型中,得到所述文字信息所组成的语句,所述语言模型,以文字集合为训练样本,以文字集合所组成的语句为样本标签,训练得到。
[0056]一种音频审核装置,包括:...

【技术保护点】

【技术特征摘要】
1.一种音频审核方法,其特征在于,包括:获取待审核的音频流;对所述音频流进行切片,得到多个音频片段,并基于各个音频片段在所述音频流中的播放顺序,对所述音频片段进行排序;获取每一音频片段对应的文本信息;判断每一文本信息中是否包含敏感词;若所述文本信息中包含敏感词,将与所述敏感词对应的音频片段确定为目标音频片段,并获取所述敏感词对应的敏感词信息、所述目标音频片段对应的第一音频特征、排序在目标音频片段之前的各个音频片段对应的第二音频特征,及排序在目标音频片段后一位的音频片段对应的第三音频特征;根据所述第一音频特征、所述第二音频特征、所述第三音频特征及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值;判断所述审核分值是否大于预置的拦截阈值;若所述审核分值大于所述拦截阈值,则对所述目标音频片段进行拦截。2.根据权利要求1所述的方法,其特征在于,获取所述敏感词对应的敏感词信息,包括:通过预设的敏感词与类型及等级一一对应的敏感词表,确定所述敏感词对应的敏感词等级及敏感词类型。3.根据权利要求2所述的方法,其特征在于,所述文本信息中包含多个敏感词;所述通过预设的敏感词与类型及等级一一对应的敏感词表,确定所述敏感词对应的敏感词等级及敏感词类型,包括:通过所述敏感词表,确定每一敏感词对应的敏感词等级;将敏感词等级最高的敏感词,确定为目标敏感词;查询所述敏感词表,获取所述目标敏感词对应的敏感词类型,所述敏感词信息中包括所述目标敏感词对应的敏感词类型及敏感词等级。4.根据权利要求1所述的方法,其特征在于,获取所述目标音频片段对应的第一音频特征,包括:获取所述目标音频片段对应的第一情绪类型及第一短时能量值;获取排序在目标音频片段之前的各个音频片段对应的第二音频特征,包括:获取排序在目标音频片段之前的各个音频片段对应的第二短时能量值;获取排序在目标音频片段前一位的音频片段对应的第二情绪类型;获取排序在目标音频片段后一位的音频片段对应的第三音频特征,包括:获取排序在目标音频片段后一位的音频片段对应的第三短时能量值;获取排序在目标音频片段后一位的音频片段对应的第三情绪类型;根据所述第一音频特征、所述第二音频特征、所述第三音频特征及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值,包括:根据所述第一情绪类型、所述第一短时能量值、所述第二短时能量值、所述第二情绪类型、所述第三短时能量值、所述第三情绪类型及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值。5.根据权利要求4所述的方法,其特征在于,根据所述第一情绪类型、所述第一短时能
量值、所述第二短时能量值、所述第二情绪类型、所述第三短时能量值、所述第三情绪类型及所述敏感词信息,对所述目标音频片段进行评分,得到审核分值,包括:计算所述第二短时能量值的平均值,作为短时能量平均值;将所述第一短时能量值与所述短时能量平均值之差的平方,作为情绪波动值;确定与所述第一情绪类型的激烈程度匹配的分值,作为第一情绪分值;确定与所述第二情绪类型的激烈程度匹配的分值,作为第二情绪分值;确定与所述情绪波动值的大小程度匹配的分值,作为第三情绪分值;确定与所述第三情绪类型的激烈程度匹配的分值,作为第四情绪分值;确定与所述第一短时能量值的大小程度匹配的分值,作为第一短时能量...

【专利技术属性】
技术研发人员:吴文亮马金龙徐志坚谢睿陈光尧邓其春王伟喆张政统曾锐鸿黎子骏
申请(专利权)人:广州欢城文化传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1