音频内容审核方法、装置和软件部署方法制造方法及图纸

技术编号:36024758 阅读:29 留言:0更新日期:2022-12-21 10:22
本申请提供了一种音频内容审核方法、装置、软件部署方法、存储介质和计算机设备。该音频内容审核方法包括:将音频内容作为待审核音频输入关键词识别模型,得到待审核音频的置信度;置信度越高,则待审核音频中包含关键词的概率越大;在置信度属于第一置信度区间的情况下,判定待审核音频违规,禁止待审核音频发布;在置信度属于第二置信度区间的情况下,将待审核音频发送至审核端进行人工复核;第二置信度区间中的置信度均小于第一置信度区间中的置信度;在置信度属于第三置信度区间的情况下,判定待审核音频合规,允许待审核音频发布;第三置信度区间中的置信度均小于第二置信度区间中的置信度。该方法减少人工审核的工作量,提高了审核效率。提高了审核效率。提高了审核效率。

【技术实现步骤摘要】
音频内容审核方法、装置和软件部署方法


[0001]本申请涉及人工智能
,尤其涉及一种音频内容审核方法、装置和软件部署方法、存储介质和计算机设备。

技术介绍

[0002]随着5G和人工智能的快速发展,以及直播、短视频等泛娱乐产品的兴起,越来越多的音视频社交互动玩法层出不穷,不断吸引不同年龄段、不同身份的用户加入,使得娱乐社交的用户群体不断增大。因此,严格执行国家对泛娱乐平台、直播领域的监管要求和行为准则,构建积极健康的网络社交环境显得尤为重要。因此在用户进行泛娱乐社交时,需要对用户生产的音频内容进行安全审核,对损害网络健康安全的音频内容进行禁止发布和删除,进而构建健康、传递正确价值观的泛娱乐新生态。
[0003]而传统技术中常常需要大量人工参与审核,存在着审核人员工作量较大且审核效率低的问题。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中人工审核效率低且工作量大的技术缺陷。
[0005]第一方面,本申请提供一种音频内容审核方法,方法包括:
[0006]在音频内容发布前,将音频内容作为待审核音频输入关键词识别模型,得到待审核音频的置信度;置信度越高,则待审核音频中包含关键词的概率越大;
[0007]确定置信度所属的置信度区间;
[0008]在置信度属于第一置信度区间的情况下,判定待审核音频违规,禁止待审核音频发布;
[0009]在置信度属于第二置信度区间的情况下,将待审核音频发送至审核端进行人工复核;第二置信度区间中的置信度均小于第一置信度区间中的置信度;
[0010]在置信度属于第三置信度区间的情况下,判定待审核音频合规,允许待审核音频发布;第三置信度区间中的置信度均小于第二置信度区间中的置信度。
[0011]在其中一个实施例中,关键词识别模型通过以下步骤得到置信度:
[0012]将待审核音频转换为词格;
[0013]将关键词库与词格的各节点对应的待选词进行匹配;
[0014]根据匹配结果,得到置信度。
[0015]在其中一个实施例中,将关键词库与词格的各节点对应的待选词进行匹配,包括:
[0016]依次选择关键词库中的关键词作为待匹配关键词;
[0017]判断各待选词中是否存在与待匹配关键词匹配的待选词;
[0018]若存在,则以与待匹配关键词匹配的待选词为目标待选词。
[0019]在其中一个实施例中,根据匹配结果,得到待审核音频的置信度,包括:
[0020]以目标待选词对应的节点为目标节点,获取目标节点的后验概率;
[0021]根据目标节点的后验概率,得到置信度。
[0022]在其中一个实施例中,在关键词识别模型得到置信度的过程中还包括:
[0023]提取目标节点对应的时间信息;时间信息反映目标待选词在待审核音频中的位置;
[0024]将待审核音频发送至审核端进行人工复核包括:
[0025]将时间信息和待审核音频发送至审核端进行人工复核。
[0026]在其中一个实施例中,关键词库中包括多个类别的关键词,关键词识别模型还用于输出目标待选词的类别。
[0027]第二方面,本申请实施例提供一种软件部署方法,包括:
[0028]将音频内容审核装置集成到音频内容发布平台对应的应用程序中,得到目标应用程序;音频内容审核装置被配置为执行上述任一实施例中音频内容审核方法的步骤;
[0029]将目标应用程序部署到移动终端。
[0030]第三方面,本申请实施例提供一种音频内容审核装置,包括:
[0031]置信度计算模块,用于在音频内容发布前,将音频内容作为待审核音频输入关键词识别模型,得到待审核音频的置信度;置信度越高,则待审核音频中包含关键词的概率越大;
[0032]区间确定模块,用于确定置信度所属的置信度区间;
[0033]第一处理模块,用于在置信度属于第一置信度区间的情况下,判定待审核音频违规,禁止待审核音频发布;
[0034]第二处理模块,用于在置信度属于第二置信度区间的情况下,将待审核音频发送至审核端进行人工复核;第二置信度区间中的置信度均小于第一置信度区间中的置信度;
[0035]第三处理模块,用于在置信度属于第三置信度区间的情况下,判定待审核音频合规,允许待审核音频发布;第三置信度区间中的置信度均小于第二置信度区间中的置信度。
[0036]第四方面,本申请实施例提供一种存储介质,该存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例中的音频内容审核方法或软件部署方法的步骤。
[0037]第五方面,本申请实施例提供一种计算机设备,包括:一个或多个处理器,以及存储器;
[0038]存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行上述任一实施例中的音频内容审核方法或软件部署方法的步骤。
[0039]从以上技术方案可以看出,本申请实施例具有以下优点:
[0040]基于上述任一实施例,通过关键词识别模型获得待审核音频的置信度,以置信度反映该待审核音频包含关键词的概率大小。再根据该待审核音频所属的置信度区间选择是否要将该待审核音频推送至人工审核。该方法使得只有难以确定是否包含关键词的待审核音频才会推送至人工,而置信度较高或较低的待审核音频将自动被判定为违规或合规,大大减少了人工审核的工作量,提高了审核效率,还节约了流量传输成本。
附图说明
[0041]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0042]图1为本申请实施例提供的一种音频内容审核方法的流程示意图;
[0043]图2为本申请实施例提供的一种关键词识别模型转换出的词格的示意图;
[0044]图3为本申请实施例提供的一种软件部署方法的流程示意图;
[0045]图4为本申请实施例提供的一种音频内容审核装置的模块结构图;
[0046]图5为本申请实施例提供的一种计算机设备的内部结构图。
具体实施方式
[0047]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0048]第一方面,本申请提供一种音频内容审核方法,请参阅图1,该方法包括 S102至步骤S110。
[0049]S102,在音频内容发布前,将音频内容作为待审核音频输入关键词识别模型,得到待审核音频的置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频内容审核方法,其特征在于,所述方法包括:在音频内容发布前,将所述音频内容作为待审核音频输入关键词识别模型,得到所述待审核音频的置信度;所述置信度越高,则所述待审核音频中包含关键词的概率越大;确定所述置信度所属的置信度区间;在所述置信度属于第一置信度区间的情况下,判定所述待审核音频违规,禁止所述待审核音频发布;在所述置信度属于第二置信度区间的情况下,将所述待审核音频发送至审核端进行人工复核;所述第二置信度区间中的所述置信度均小于所述第一置信度区间中的所述置信度;在所述置信度属于第三置信度区间的情况下,判定所述待审核音频合规,允许所述待审核音频发布;所述第三置信度区间中的所述置信度均小于所述第二置信度区间中的所述置信度。2.根据权利要求1所述的方法,其特征在于,所述关键词识别模型通过以下步骤得到所述置信度:将所述待审核音频转换为词格;将关键词库与所述词格的各节点对应的待选词进行匹配;根据匹配结果,得到所述置信度。3.根据权利要求2所述的方法,其特征在于,所述将关键词库与所述词格的各节点对应的待选词进行匹配,包括:依次选择所述关键词库中的关键词作为待匹配关键词;判断各所述待选词中是否存在与所述待匹配关键词匹配的所述待选词;若存在,则以与所述待匹配关键词匹配的所述待选词为目标待选词。4.根据权利要求3所述的方法,其特征在于,所述根据匹配结果,得到所述待审核音频的置信度,包括:以目标待选词对应的节点为目标节点,获取所述目标节点的后验概率;根据所述目标节点的后验概率,得到所述置信度。5.根据权利要求4所述的方法,其特征在于,在所述关键词识别模型得到所述置信度的过程中还包括:提取所述目标节点对应的时间信息;所述时间信息反映所述目标待选词在所述待审核音频中的位置;所述将所述待审核音频发送至审核端进行人工复核包括:将所述时间信息和所述待审核音频发送至所述审核端进行人工...

【专利技术属性】
技术研发人员:王伟喆焦南凯马金龙吴文亮盘子圣邓其春黎子骏张政统曾锐鸿熊佳黄祥康兰翔徐志坚谢睿陈光尧
申请(专利权)人:广州趣丸网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1