一种基于语音识别的直播视频敏感内容过滤方法及装置制造方法及图纸

技术编号:13999128 阅读:107 留言:0更新日期:2016-11-15 12:54
本发明专利技术涉及一种内容过滤方法及装置,属于视频直播领域,具体是涉及一种基于语音识别的直播视频敏感内容过滤方法及装置。包括:步骤1,用户打开直播后,录制用户的直播音视频数据;步骤2,判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;步骤3,将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。总体而言,本发明专利技术所构思的以上技术方案与现有技术相比,为删除敏感视频内容提供了可能,能在不间断直播的情况下及时保护隐私数据不外泄,确保内容的健康。

【技术实现步骤摘要】

本专利技术涉及一种内容过滤方法及装置,属于视频直播领域,具体是涉及一种基于语音识别的直播视频敏感内容过滤方法及装置。
技术介绍
随时网络通信技术的进步和宽带网络的提速,网络视频应用在各个行业得到了越来越广泛的开展。直观而生动的高清视频应用,可以极大地拉近用户之间的距离,并达到最好的交流效果,而且成本相对最低,所以得到了各行业用户的普遍欢迎。互联网用户已经达到5亿,互联网的蓬勃发展,受众面很大。以前,我们搞活动往往通过电视台进行直播,占用卫星通道,费用高昂。然而,通过互联网进行直播活动发布,可以有效节省运营费用,并且可以覆盖到全国互联网用户,而且可以实时发布,方便灵活。但是,如何在视频直播时有效保护用户隐私或应对突发状况是目前所面临的一个重要问题。直播时候实时推送音视频数据到服务器,当在直播的过程中突然出现一些不适应观众观看的画面和声音,例如直播过程中主播可能会说一些敏感话,脏话或者隐私话,这样会对观看者造成一点的影响。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于语音识别的直播视频敏感内容过滤方法,其目的在于保护用户隐私以及直播内容的健康。为了解决上述问题,根据本专利技术的一个方面,提供了一种基于语音识别的直播视频敏感内容过滤方法,包括:步骤1,用户打开直播后,客户端录制用户的直播音视频数据;步骤2,客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;若不涉及敏感内容,则不对音视频数据进行处理;步骤3,客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。优选的,一种基于语音识别的直播视频敏感内容过滤方法,所述步骤2中,判断音频数据是否涉及敏感内容的步骤如下:步骤201,客户端利用语音识别技术将原始音频数据转化为文字;步骤202,客户端将文字发送至服务器,服务器利用预先设置的敏感内容匹配规则将转换后的文字和预先设置的敏感内容库中的词语进行匹配,若所匹配成功则判断所述音频数据涉及敏感内容,否则判断所述音频数据未涉及敏感内容。优选的,一种基于语音识别的直播视频敏感内容过滤方法,所述匹配规则包括:全词匹配、部分词匹配、拼音匹配 、字母匹配中的一种或多种。优选的,一种基于语音识别的直播视频敏感内容过滤方法,当判断所述音频数据涉及敏感内容后,提示直播用户直播内容涉及敏感内容。优选的,一种基于语音识别的直播视频敏感内容过滤方法,所述敏感内容包括:不文明用语、涉及隐私用语、涉及政治用语中的一种或多种。为了解决上述问题,根据本专利技术的另一个方面,提供了一种基于语音识别的直播视频敏感内容过滤装置,包括:直播开启模块,用户打开直播后,客户端录制用户的直播音视频数据;敏感内容判断模块,客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;若不涉及敏感内容,则不对音视频数据进行处理;数据上传模块,客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。优选的,一种基于语音识别的直播视频敏感内容过滤装置,敏感内容判断模块进一步包括:语音识别单元,客户端利用语音识别技术将原始音频数据转化为文字;敏感内容判断单元,客户端将文字发送至服务器,服务器利用预先设置的敏感内容匹配规则将转换后的文字和预先设置的敏感内容库中的词语进行匹配,若所匹配成功则判断所述音频数据涉及敏感内容,否则判断所述音频数据未涉及敏感内容。优选的,一种基于语音识别的直播视频敏感内容过滤装置,所述匹配规则包括:全词匹配、部分词匹配、拼音匹配 、字母匹配中的一种或多种。优选的,一种基于语音识别的直播视频敏感内容过滤装置,当判断所述音频数据涉及敏感内容后,提示直播用户直播内容涉及敏感内容。优选的,一种基于语音识别的直播视频敏感内容过滤装置,所述敏感内容包括:不文明用语、涉及隐私用语、涉及政治用语中的一种或多种。总体而言,本专利技术所构思的以上技术方案与现有技术相比,为删除敏感视频内容提供了可能,能在不间断直播的情况下及时保护隐私数据不外泄,确保内容的健康。附图说明附图1是本专利技术的流程图;附图2是本专利技术的语音识别流程图;附图3是本专利技术的结构图;具体实施方式下面通过实施例,并结合附图,对本专利技术的技术方案作进一步具体的说明。一种基于语音识别的直播视频敏感内容过滤方法,包括:步骤1,用户打开直播后,客户端录制用户的直播音视频数据;步骤2,客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;若不涉及敏感内容,则不对音视频数据进行处理;其中,所述步骤2中,判断音频数据是否涉及敏感内容的步骤如下:步骤201,客户端利用语音识别技术将原始音频数据转化为文字;步骤202,客户端将文字发送至服务器,服务器利用预先设置的敏感内容匹配规则将转换后的文字和预先设置的敏感内容库中的词语进行匹配,若所匹配成功则判断所述音频数据涉及敏感内容,否则判断所述音频数据未涉及敏感内容。其中,匹配规则包括:全词匹配、部分词匹配、拼音匹配 、字母匹配中的一种或多种。敏感内容包括:不文明用语、涉及隐私用语、涉及政治用语中的一种或多种。其中,匹配规则可以由用户根据需求自主设置。步骤3,客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。其中,当判断所述音频数据涉及敏感内容后,提示直播用户直播内容涉及敏感内容。一种基于语音识别的直播视频敏感内容过滤装置,包括:直播开启模块,用户打开直播后,客户端录制用户的直播音视频数据;敏感内容判断模块,客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;若不涉及敏感内容,则不对音视频数据进行处理;敏感内容判断模块进一步包括:语音识别单元,客户端利用语音识别技术将原始音频数据转化为文字;敏感内容判断单元,客户端将文字发送至服务器,服务器利用预先设置的敏感内容匹配规则将转换后的文字和预先设置的敏感内容库中的词语进行匹配,若所匹配成功则判断所述音频数据涉及敏感内容,否则判断所述音频数据未涉及敏感内容。其中,匹配规则包括:全词匹配、部分词匹配、拼音匹配 、字母匹配中的一种或多种。敏感内容包括:不文明用语、涉及隐私用语、涉及政治用语中的一种或多种。数据上传模块,客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。其中,当判断所述音频数据涉及敏感内容后,提示直播用户直播内容涉及敏感内容。实施例1:如图1所示,一种基于语音识别的直播视频敏感内容过滤方法,详细步骤如下:步骤1:用户开始直播。步骤2:步骤2采集音视频。步骤3:语音识别。采集的音频数据调用语音识别借口识别出是否是隐私数据,隐私数据是由服务器预先设置好。步骤4:判断是否是隐私数据:若是,则获取默认音频数据;若否,则使用原始数据步骤5:进入音视频缓存队列。步骤6:推送数据。推送由步骤5传递下来的数据到本文档来自技高网...

【技术保护点】
一种基于语音识别的直播视频敏感内容过滤方法,其特征在于,包括:步骤1,用户打开直播后,客户端录制用户的直播音视频数据;步骤2,客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;若不涉及敏感内容,则不对音视频数据进行处理;步骤3,客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。

【技术特征摘要】
1.一种基于语音识别的直播视频敏感内容过滤方法,其特征在于,包括:步骤1,用户打开直播后,客户端录制用户的直播音视频数据;步骤2,客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容,若所述音频数据涉及敏感内容,则利用预先存储的默认音频数据替换直播音视频数据中的音频数据;若不涉及敏感内容,则不对音视频数据进行处理;步骤3,客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。2.根据权利要求1所述的一种基于语音识别的直播视频敏感内容过滤方法,其特征在于,所述步骤2中判断音频数据是否涉及敏感内容的步骤如下:步骤201,客户端利用语音识别技术将原始音频数据转化为文字;步骤202,客户端将文字发送至服务器,服务器利用预先设置的敏感内容匹配规则将转换后的文字和预先设置的敏感内容库中的词语进行匹配,若所匹配成功则判断所述音频数据涉及敏感内容,否则判断所述音频数据未涉及敏感内容。3.根据权利要求2所述的一种基于语音识别的直播视频敏感内容过滤方法,其特征在于,所述匹配规则包括:全词匹配、部分词匹配、拼音匹配、字母匹配中的一种或多种。4.根据权利要求1所述的一种基于语音识别的直播视频敏感内容过滤方法,其特征在于,在步骤2中,当判断所述音频数据涉及敏感内容后,提示直播用户直播内容涉及敏感内容。5.根据权利要求1所述的一种基于语音识别的直播视频敏感内容过滤方法,其特征在于,所述敏感内容包括:不文明用语、涉及隐私用语、涉及政治用语中的一种或多种。6.一种...

【专利技术属性】
技术研发人员:张朝兵
申请(专利权)人:武汉斗鱼网络科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1