音频审核方法、装置、设备及可读存储介质制造方法及图纸

技术编号：33916888 阅读：20 留言：0更新日期：2022-06-25 20:23

本申请公开了音频审核方法、装置、设备及可读存储介质，该方法包括：对音频流进行切片，得到多个音频片段，并对音频片段进行排序；获取每一音频片段对应的文本信息；若文本信息中包含敏感词，将与敏感词对应的音频片段确定为目标音频片段，并获取敏感词对应的敏感词信息、目标音频片段对应的第一音频特征，及排在目标音频片段前后的各个音频片段对应的第二音频特征及第三音频特征；对目标音频片段进行评分，得到审核分值；若审核分值大于拦截阈值，对目标音频片段进行拦截。可见，本申请可以提高音频审核的准确性。此外，确定审核分值时，既考虑目标音频片段，又考虑播放顺序在目标音频片段前后的音频片段，进一步提高了音频审核的准确率。准确率。准确率。

全部详细技术资料下载

【技术实现步骤摘要】
音频审核方法、装置、设备及可读存储介质

[0001]本申请涉及互联网
，更具体地说，涉及一种音频审核方法、装置、设备及可读存储介质。

技术介绍

[0002]为了规范网络环境，符合互联网规定，及出于对实际业务需求的考虑，对音频及音视频的审核是必须的，也是十分重要的。
[0003]现有技术中，通过语音识别，将音频转换为文本信息，并对该文本信息进行审核，直接将对文本信息的审核结果作为该音频的审核结果。这种方案，仅仅考虑了文本内容，并没有有效地利用音频本身，以至于现有的音频审核方法中仍存在没有精准识别违规内容的问题。
[0004]综上所述，亟需一种音频审核方法，用于进一步提高音频审核的准确性。

技术实现思路

[0005]有鉴于此，本申请提供了一种音频审核方法、装置、设备及可读存储介质，用于进一步提高音频审核的准确性。
[0006]为了实现上述目的，现提出的方案如下：
[0007]一种音频审核方法，包括：
[0008]获取待审核的音频流；
[0009]对所述音频流进行切片，得到多个音频片段，并基于各个音频片段在所述音频流中的播放顺序，对所述音频片段进行排序；
[0010]获取每一音频片段对应的文本信息；
[0011]判断每一文本信息中是否包含敏感词；
[0012]若所述文本信息中包含敏感词，将与所述敏感词对应的音频片段确定为目标音频片段，并获取所述敏感词对应的敏感词信息、所述目标音频片段对应的第一音频特征、排序在目标音频片段之前的各个

【技术保护点】

【技术特征摘要】
1.一种音频审核方法，其特征在于，包括：获取待审核的音频流；对所述音频流进行切片，得到多个音频片段，并基于各个音频片段在所述音频流中的播放顺序，对所述音频片段进行排序；获取每一音频片段对应的文本信息；判断每一文本信息中是否包含敏感词；若所述文本信息中包含敏感词，将与所述敏感词对应的音频片段确定为目标音频片段，并获取所述敏感词对应的敏感词信息、所述目标音频片段对应的第一音频特征、排序在目标音频片段之前的各个音频片段对应的第二音频特征，及排序在目标音频片段后一位的音频片段对应的第三音频特征；根据所述第一音频特征、所述第二音频特征、所述第三音频特征及所述敏感词信息，对所述目标音频片段进行评分，得到审核分值；判断所述审核分值是否大于预置的拦截阈值；若所述审核分值大于所述拦截阈值，则对所述目标音频片段进行拦截。2.根据权利要求1所述的方法，其特征在于，获取所述敏感词对应的敏感词信息，包括：通过预设的敏感词与类型及等级一一对应的敏感词表，确定所述敏感词对应的敏感词等级及敏感词类型。3.根据权利要求2所述的方法，其特征在于，所述文本信息中包含多个敏感词；所述通过预设的敏感词与类型及等级一一对应的敏感词表，确定所述敏感词对应的敏感词等级及敏感词类型，包括：通过所述敏感词表，确定每一敏感词对应的敏感词等级；将敏感词等级最高的敏感词，确定为目标敏感词；查询所述敏感词表，获取所述目标敏感词对应的敏感词类型，所述敏感词信息中包括所述目标敏感词对应的敏感词类型及敏感词等级。4.根据权利要求1所述的方法，其特征在于，获取所述目标音频片段对应的第一音频特征，包括：获取所述目标音频片段对应的第一情绪类型及第一短时能量值；获取排序在目标音频片段之前的各个音频片段对应的第二音频特征，包括：获取排序在目标音频片段之前的各个音频片段对应的第二短时能量值；获取排序在目标音频片段前一位的音频片段对应的第二情绪类型；获取排序在目标音频片段后一位的音频片段对应的第三音频特征，包括：获取排序在目标音频片段后一位的音频片段对应的第三短时能量值；获取排序在目标音频片段后一位的音频片段对应的第三情绪类型；根据所述第一音频特征、所述第二音频特征、所述第三音频特征及所述敏感词信息，对所述目标音频片段进行评分，得到审核分值，包括：根据所述第一情绪类型、所述第一短时能量值、所述第二短时能量值、所述第二情绪类型、所述第三短时能量值、所述第三情绪类型及所述敏感词信息，对所述目标音频片段进行评分，得到审核分值。5.根据权利要求4所述的方法，其特征在于，根据所述第一情绪类型、所述第一短时能
量值、所述第二短时能量值、所述第二情绪类型、所述第三短时能量值、所述第三情绪类型及所述敏感词信息，对所述目标音频片段进行评分，得到审核分值，包括：计算所述第二短时能量值的平均值，作为短时能量平均值；将所述第一短时能量值与所述短时能量平均值之差的平方，作为情绪波动值；确定与所述第一情绪类型的激烈程度匹配的分值，作为第一情绪分值；确定与所述第二情绪类型的激烈程度匹配的分值，作为第二情绪分值；确定与所述情绪波动值的大小程度匹配的分值，作为第三情绪分值；确定与所述第三情绪类型的激烈程度匹配的分值，作为第四情绪分值；确定与所述第一短时能量值的大小程度匹配的分值，作为第一短时能量...

【专利技术属性】
技术研发人员：吴文亮，马金龙，徐志坚，谢睿，陈光尧，邓其春，王伟喆，张政统，曾锐鸿，黎子骏，
申请(专利权)人：广州欢城文化传媒有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人