音频的异常监控方法、装置、设备和存储介质制造方法及图纸

技术编号:21774518 阅读:19 留言:0更新日期:2019-08-03 22:22
本发明专利技术实施例公开了一种音频的异常监控方法、装置、设备和存储介质。该方法包括:获取与实时播放的目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本;对所述分段文本进行异常识别,并根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,以进行异常审核。本发明专利技术实施例的技术方案在实时识别出与实时播放的目标音频类节目对应的异常文本,满足了监控时效性的要求的同时,还可以在后续针对待审核记录的人工审核过程中,使得审核用户快速定位并听取与异常文本对应的音频内容,达到了快速排查出违规音频的目的,大大提高了审核效率,节省了人力成本。

Audio anomaly monitoring methods, devices, devices and storage media

【技术实现步骤摘要】
音频的异常监控方法、装置、设备和存储介质
本专利技术实施例涉及音频信息处理技术,尤其涉及一种音频的异常监控方法、装置、设备和存储介质。
技术介绍
随着信息技术的不断发展,多媒体播放形式,例如,直播网站或者视频网站以其形式新颖、内容丰富受到人们广泛的关注。但是,多媒体播放形式可能会掺杂有许多违规内容,因此需要对多媒体播放形式中实时出现的视频以及音频内容进行有效的监管。以直播网站为例,现有技术中,对直播间中主播或粉丝的语音以及短视频中的语音的监管还不是很到位,一种方式是通过人工抽查的方式对选中的直播间进行监听;另一种方式是在直播结束后,将直播过程中生成的音频文件发送至对应的审核平台进行审核。专利技术人在实现本专利技术的过程中发现:第一种监管方式由于人工抽查的随机性,难免后漏掉重要的违规语音,不能及时处罚或者封禁违规直播;第二种方式由于需要人工听取大量的音频文件,人力成本高、效率低,即使准确定位出了违规的音频,因为这种审核方式的滞后性,违规的音频已经在网络上传播开来,同样不能及时处罚或者封禁违规直播,进而造成不良的社会影响。
技术实现思路
本专利技术实施例提供一种音频的异常监控方法、装置、设备和存储介质,以优化现有的音频的监控方式,提高对异常音频发现的时效性。第一方面,本专利技术实施例提供了一种音频的异常监控方法,包括:获取与实时播放的目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本;对所述分段文本进行异常识别,并根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,以进行异常审核。第二方面,本专利技术实施例还提供了一种音频的异常监控装置,该装置包括:分段文本识别模块,用于获取与实时播放的目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本;待审核记录生成模块,用于对所述分段文本进行异常识别,并根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,以进行异常审核。第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所述的音频的异常监控方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所述的音频的异常监控方法。本专利技术实施例的技术方案通过使用音频转文本技术,将实时播放的目标音频类节目中的实时的音频内容转换为分段文本后,自动识别出大量分段文本中包括的异常文本,满足了监控时效性的要求;此外,通过在待审核记录中标识出异常文本与目标音频类节目的音频文件之间的关联关系,可以在后续针对该待审核记录的人工审核过程中,使得审核用户快速定位并听取与异常文本对应的音频内容,以快速排查出违规音频,大大提高了审核效率,节省了人力成本。附图说明图1是本专利技术实施例一提供的一种音频的异常监控方法的流程图;图2是本专利技术实施例二提供的一种音频的异常监控方法的流程图;图3是本专利技术实施例三提供的一种音频的异常监控方法的流程图;图4是本专利技术实施例四提供的一种音频的异常监控方法的流程图;图5是本专利技术实施例五提供的一种音频的异常监控方法的流程图图6a是本专利技术各实施例提供的音频的异常监控方法所适用的一种异常监控系统结构示意图;图6b是本专利技术各实施例提供的音频的异常监控方法所适用的一种审核界面的示意图;图6c是本专利技术各实施例提供的音频的异常监控方法所适用的一种处罚界面的示意图;图7是本专利技术实施例六提供的一种音频的异常监控装置的结构图;图8是本专利技术实施例七提供的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1是本专利技术实施例一提供的一种音频的异常监控方法的流程图,本实施例可适用于对与实时播放的目标音频类节目对应的音频进行实时监控的情况,该方法可以由本专利技术任意实施例提供的音频的异常监控装置来执行,该装置可由硬件和/或软件组成,并一般可集成在用于提供异常监控服务的一个或者多个服务器或者一个或者多个服务器集群中。如图1所述,本实施例提供的音频的异常监控方法包括以下步骤:S110、获取与实时播放的目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本。在本实施例中,所述目标音频类节目具体是指当前播放的,且包含有音频内容的节目。该目标音频类节目可以为直播间中的实时播放的直播内容(音视频直播内容或者纯音频直播内容),也可以为用户已经录制好的,并上传于直播间进行实时播放的视频文件或者音频文件等,还可以为视频网站中当前播放的视频,特别的,该目标音频类节目可以为视频网站中首次播放的某一个新发布的视频。在本实施例中,为了提高对该目标音频类节目中异常音频识别的实时性,可以将实时播放的目标音频类节目分解为多个小的分段音频,对每一个分段音频进行相应的异常识别。一般来说,现有的音频识别方式,主要是将音频数据转换为文本数据后,获取该文本中的异常信息,因此,在获取与实时播放的目标音频类节目对应的至少一个分段音频之后,首先需要将所述分段音频识别为分段文本。其中,可以使用各种内置的语音转文本组件实现将所述分段音频识别为分段文本,也可以通过预设的语音转文本算法,实时计算出与所述分段音频对应的分段文本,这里并不进行限制。S120、对所述分段文本进行异常识别,并根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,以进行异常审核。在本实施例中,可以通过关键词识别的方式,对所述分段文本进行异常识别,获取与所述目标音频类节目对应的异常文本,例如,预先构造一个敏感词库,该敏感词库中包括有禁止在音频播放过程中播放的各种关键词。进而,可以通过将所述分段文本与该敏感词库进行比对的方式,识别出所述异常文本。在本实施例中,考虑到自动识别过程中的误识别情况的发生,需要将上述异常文本的识别结果最终交由审核平台进行异常审核(典型的,人工审核)。也即,需要基于该异常文本,生成与所述目标音频类节目对应的待审核记录。以使得审核用户根据该待审核记录,对应听取与目标音频类节目对应的音频文件,以最终确定该目标音频类节目中的音频中是否确实出现了上述异常文本中的内容。本专利技术实施例的技术方案通过使用音频转文本技术,将实时播放的目标音频类节目中的实时的音频内容转换为分段文本后,自动识别出大量分段文本中包括的异常文本,满足了监控时效性的要求;此外,通过在待审核记本文档来自技高网...

【技术保护点】
1.一种音频的异常监控方法,其特征在于,包括:获取与实时播放的目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本;对所述分段文本进行异常识别,并根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,以进行异常审核。

【技术特征摘要】
1.一种音频的异常监控方法,其特征在于,包括:获取与实时播放的目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本;对所述分段文本进行异常识别,并根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,以进行异常审核。2.根据权利要求1所述的方法,其特征在于,所述目标音频类节目包括:直播间的直播内容,和/或视频网站中的新发布视频。3.根据权利要求2所述的方法,获取与目标音频类节目对应的至少一段分段音频,并将所述分段音频识别为分段文本,包括:根据直播间的直播方式,获取与所述直播间的直播内容对应的至少一个分段音频,并将所述分段音频识别为分段文本。4.根据权利要求3所述的方法,其特征在于,根据直播间的直播方式,获取与所述直播间的直播内容对应的至少一个分段音频,包括:根据检测到的所述直播间的开播事件通知,获取所述直播间的直播地址;根据所述直播地址,从所述直播间的实时音频流中实时截取设定时长的音频流作为所述分段音频。5.根据权利要求3所述的方法,其特征在于,根据直播间的直播方式,获取与所述直播间的直播内容对应的至少一个分段音频,包括:根据检测到的所述直播间的录制视频上传事件通知,获取所述直播间上传的录制视频文件;获取与所述录制视频文件匹配的音频抽取结果;对所述音频抽取结果进行分段处理,得到所述分段音频。6.根据权利要求1所述的方法,其特征在于,根据识别出的异常文本,与所述目标音频类节目的音频文件之间的关联关系,生成与所述目标音频类节目对应的待审核记录,包括:获取与所述异常文本对应的异常音频在所述音频文件中的起止时间;根据所述异常文本、所述起止时间以及所述目标音频类节目的属性描述信息,生成所述待审核记录。7.根据权利要求1-6任一项所述的方法,其特征在于,将所述分段音频识别为分段文本,包括:对所述分段音频进行预处理后,提取所述分段音频中的各音频帧的声学特征向量;将所述各音频帧的声学特征向量顺序输入至预先训练的声学模型中,得到所述分段音频对应的有序音素序列;将所述有序音素序列顺序输入至预先训练的文本语言模型中,得到与所述分段音频对应的分段文本。8.根据权利要求1-6任一项所述的方法,其特征在于,在生成与所述目标音频类节目对应的待审核记录之后,还包括:根据接收的审核请求,获取所述待审核记录中包括的异常文本、起止时间以及目标音频类节目的属性描述信息;根据所述目标音频类节目的属性描述信息,获取所述目标音频类节目的音频文件;根据所述起止时间,确定截取时间段,并根据所述截取时间段,在所述目标音...

【专利技术属性】
技术研发人员:蔡旭森
申请(专利权)人:广州虎牙信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1