一种智能审查自媒体音视频内容的方法技术

技术编号:34395335 阅读:57 留言:0更新日期:2022-08-03 21:28
本发明专利技术公开了一种智能审查自媒体音视频内容的方法,包括:步骤S10:检测用户上传的自媒体文件使用的格式和编码;步骤S20:对音频流进行识别,并转换为字幕文本;步骤S30:根据预设敏感词库,对字幕文本进行敏感词检测;步骤S40:对音频流进行实时检测,检测是否存在异常声音的音频时间点;步骤S50:利用预设消音方式对目标位置上的音频流进行干预,同时生成一个音频文件;步骤S60:对临时音频文件进行语音识别并转换为文字信息;步骤S70:对文字信息进行检查是否存在敏感词汇;步骤S80:将审查干预后的音频帧和视频帧进行同步;步骤S90:返回检测结果。本发明专利技术通过智能识别目标直播数据流中的敏感词,完成敏感词的提取和替换,有利于净化网络环境。网络环境。网络环境。

【技术实现步骤摘要】
一种智能审查自媒体音视频内容的方法


[0001]本专利技术涉及计算机
,特别涉及一种智能审查自媒体音视频内容的方法。

技术介绍

[0002]随着互联网经济的飞速发展,自媒体异军突起,闯入了人们的视野中,自媒体又称“公民媒体”或“个人媒体”,是指私人化、平民化、普泛化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称。目前的自媒体平台有很多,包括各种短视频平台和直播平台等网络社区,当前很多直播和短视频平台对于内容的审查较为严格,对于直播主体来说,将一些违规的信息提前干预,规避敏感信息再播放是非常有必要的。
[0003]目前,对于自媒体违规信息的审查方法通常有两种:一种是采用传统审查型干预系统进行审查干预,这类审查系统虽然能够通过技术手段让审查人员可以随时随地审查的更加方便,并且提供一些技术手段对违规的码流替换后播出,但由于需要安排审查员进行审查,对于提供直播平台的机构来说大量的直播活动需要投入大量的人工审查员,成本较高;而另一种则是采用技术封禁型系统进行审查干预,这类审查干预系统是利用计算机技术对直播流中的视频和音频数据进行违规内容的检测,以及结合历史大数据,比如直播间的异常流量、用户评论的违规情况等信息进行违规判断,但这类系统会对判断属于违规的直播进行技术提醒或直接封禁,虽然减少了审查人员的投入,但是也忽略了主播在某些场合只是无意识的说出违规内容,直接封禁对直播活动影响较大。

技术实现思路

[0004]本专利技术的目的在于提供一种智能审查自媒体音视频内容的方法,解决现有自媒体违规信息的审查方法工作量大,智能程度较低的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种智能审查自媒体音视频内容的方法,包括以下步骤:
[0007]步骤S10:检测用户上传的自媒体文件使用的格式和编码,并对目标直播数据流进行预处理,分离出所述目标直播数据流中的音频流和视频流进行缓存;
[0008]步骤S20:对音频流进行语音识别,并将识别结果转换为标准字幕格式的字幕文本;
[0009]步骤S30:根据预设敏感词库,对字幕文本进行敏感词检测,确定所述敏感词并进行标记,得到字幕文本中包含的敏感词以及敏感词对应的标记信息;
[0010]对字幕文件的内容进行全文扫描,查看内容中是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤S90;如果不存在敏感词汇,继续步骤S40;
[0011]步骤S40:对音频流进行实时检测,检测是否存在异常声音的音频时间点,根据敏感词对应的标记信息,确定敏感词在音频流中出现的目标位置;
[0012]步骤S50:预设消音方式为静音或哔音,从音频时间点起截取一段时间的音频内
容,利用预设消音方式对目标位置上的音频流进行干预,得到审查干预后的音频流,同时生成一个音频文件,并进行临时存储;
[0013]步骤S60:对临时音频文件进行语音识别,并将识别结果转换为相应的文字信息;
[0014]步骤S70:对文字信息进行检查,看是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤S90;如果不存在敏感词汇,继续步骤S80;
[0015]步骤S80:根据审查干预后的音频流中音频帧的时间戳信息,从缓存的视频流中检索对应的视频帧,并将审查干预后的音频帧和视频帧进行同步,以及将同步后的视频流进行播放;表示自媒体内容已经通过平台机器人的智能审查,初审通过;
[0016]步骤S90:返回检测结果;此步骤为返回到违规内容的结果。
[0017]优选地,所述在步骤S10中,包括通过预设音视频采集设备获取待审查的目标直播数据流;根据网络实时消息传输协议RTMP拉流地址获取待审查的目标直播数据流;从本地视频文件获取待审查的目标直播数据流;检测方式是指以数据流的方式读取用户上传的自媒体文件的内容,并根据各种视频、音频、字幕的格式标准定义进行比对,获得用户上传的自媒体文件使用的格式和编码。
[0018]优选地,所述在步骤S20中,包括识别子单元,该识别子单元用于音频流进行语音识别,并将识别结果转换为标准字幕格式的字幕文本。
[0019]优选地,所述在步骤S30中,预设敏感词库能根据国家和广电总局的要求实时更新和扩展,其中步骤S30中还包括确定子单元,该确定子单元根据预设敏感词库,对所述字幕文本进行敏感词检测,确定所述敏感词并进行标记,得到所述字幕文本中包含的敏感词以及所述敏感词对应的标记信息。
[0020]优选地,所述在步骤S40中,检测是否存在异常声音,实时检测音频的采样频率,找出变化的音频的时间点;根据敏感词对应的标记信息,确定敏感词在音频流中出现的开始时间和结束时间;根据开始时间和结束时间,标记出敏感词在所述音频流中出现的目标位置。
[0021]优选地,所述在步骤S50中,音频文件的编码格式为MP3、WAV、OGG、PCM编码格式,音频采样率不低于44.1KHz;临时存储的音频临时文件的文件名的编码规则,是以下字段的组合,包括:节目内容名、编码顺序号、时间长度、随机数的字段信息。
[0022]优选地,所述在步骤S60中,音频文件是通过语音识别引擎对的语音内容进行识别,以此获得语音内容的文字信息。
[0023]优选地,所述在步骤S80中,审查干预后的音频流中当前时刻音频帧的时间戳信息,从缓存的所述视频流中检索出开始播放时间不大于所述音频帧的开始播放时间的视频帧,以及从脱敏处理后的字幕文本中检索出开始播放时间不大于所述音频帧的开始播放时间的字幕帧;将当前时刻音频帧和检索出的视频帧以及字幕帧编码成预设格式的视频流,作为当前时刻同步后的视频流进行播放。
[0024]与现有技术相比,本专利技术的有益效果:本专利技术利用计算机的计算能力,智能地解决检测自媒体音视频内容中的违规信息的工作,基于语音识别技术,实时识别目标直播数据流中的敏感词,再利用预设消音方式,实时检测和干预敏感词,完成敏感词的提取和替换以及音视频的同步播出,节省了大量人力劳动,并有利于净化网络环境。
附图说明
[0025]图1是本专利技术一种智能审查自媒体音视频内容的方法的流程示意图。
具体实施方式
[0026]为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术做进一步地详细描述。
[0027]如图1所示,为本专利技术实施例提供的一种智能审查自媒体音视频内容的方法的流程示意图,该方法主要包括以下步骤:
[0028]步骤S10:检测用户上传的自媒体文件使用的格式和编码,并对目标直播数据流进行预处理,分离出所述目标直播数据流中的音频流和视频流进行缓存。
[0029]具体地,通过预设音视频采集设备获取待审查的目标直播数据流;根据网络实时消息传输协议RTMP拉流地址获取待审查的目标直播数据流;从本地视频文件获取待审查的目标直播数据流;检测方式是指以数据流的方式读取用户上传的自媒体文件的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能审查自媒体音视频内容的方法,其特征在于,包括以下步骤:步骤S10:检测用户上传的自媒体文件使用的格式和编码,并对目标直播数据流进行预处理,分离出目标直播数据流中的音频流和视频流进行缓存;步骤S20:对音频流进行语音识别,并将识别结果转换为标准字幕格式的字幕文本;步骤S30:根据预设敏感词库,对字幕文本进行敏感词检测,确定所述敏感词并进行标记,得到字幕文本中包含的敏感词以及敏感词对应的标记信息;对字幕文件的内容进行全文扫描,查看内容中是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤S90;如果不存在敏感词汇,继续步骤S40;步骤S40:对音频流进行实时检测,检测是否存在异常声音的音频时间点,根据敏感词对应的标记信息,确定敏感词在音频流中出现的目标位置;步骤S50:预设消音方式为静音或哔音,从音频时间点起截取一段时间的音频内容,利用预设消音方式对目标位置上的音频流进行干预,得到审查干预后的音频流,同时生成一个音频文件,并进行临时存储;步骤S60:对临时音频文件进行语音识别,并将识别结果转换为相应的文字信息;步骤S70:对文字信息进行检查,看是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤S90;如果不存在敏感词汇,继续步骤S80;步骤S80:根据审查干预后的音频流中音频帧的时间戳信息,从缓存的视频流中检索对应的视频帧,并将审查干预后的音频帧和视频帧进行同步,以及将同步后的视频流进行播放;表示自媒体内容已经通过平台机器人的智能审查,初审通过;步骤S90:返回检测结果;此步骤为返回到违规内容的结果。2.根据权利要求1所述的一种智能审查自媒体音视频内容的方法,其特征在于,所述步骤S10中,包括通过预设音视频采集设备获取待审查的目标直播数据流;根据网络实时消息传输协议RTMP拉流地址获取待审查的目标直播数据流;从本地视频文件获取待审查的目标直播数据流;检测方式是指以数据流的方式读取用户上传的自媒体文件的内容,并根据各种视频、音频、字幕的格式标准定义进行比对,获得用户上...

【专利技术属性】
技术研发人员:郝章宏王东洋易新
申请(专利权)人:武汉景冠科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1