一种基于语音识别的直播视频敏感内容过滤方法及装置制造方法及图纸

技术编号：13999128 阅读：107 留言：0更新日期：2016-11-15 12:54

本发明专利技术涉及一种内容过滤方法及装置，属于视频直播领域，具体是涉及一种基于语音识别的直播视频敏感内容过滤方法及装置。包括：步骤1，用户打开直播后，录制用户的直播音视频数据；步骤2，判断所述音视频数据中的音频数据是否涉及敏感内容，若所述音频数据涉及敏感内容，则利用预先存储的默认音频数据替换直播音视频数据中的音频数据；步骤3，将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。总体而言，本发明专利技术所构思的以上技术方案与现有技术相比，为删除敏感视频内容提供了可能，能在不间断直播的情况下及时保护隐私数据不外泄，确保内容的健康。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种内容过滤方法及装置，属于视频直播领域，具体是涉及一种基于语音识别的直播视频敏感内容过滤方法及装置。
技术介绍
随时网络通信技术的进步和宽带网络的提速，网络视频应用在各个行业得到了越来越广泛的开展。直观而生动的高清视频应用，可以极大地拉近用户之间的距离，并达到最好的交流效果，而且成本相对最低，所以得到了各行业用户的普遍欢迎。互联网用户已经达到5亿，互联网的蓬勃发展，受众面很大。以前,我们搞活动往往通过电视台进行直播，占用卫星通道，费用高昂。然而，通过互联网进行直播活动发布，可以有效节省运营费用，并且可以覆盖到全国互联网用户，而且可以实时发布，方便灵活。但是，如何在视频直播时有效保护用户隐私或应对突发状况是目前所面临的一个重要问题。直播时候实时推送音视频数据到服务器，当在直播的过程中突然出现一些不适应观众观看的画面和声音，例如直播过程中主播可能会说一些敏感话，脏话或者隐私话，这样会对观看者造成一点的影响。
技术实现思路
针对现有技术的以上缺陷或改进需求，本专利技术提供了一种基于语音识别的直播视频敏感内容过滤方法，其目的在于保护用户隐私以及直播内容的健康。为了解决上述问题，根据本专利技术的一个方面，提供了一种基于语音识别的直播视频敏感内容过滤方法，包括：步骤1，用户打开直播后，客户端录制用户的直播音视频数据；步骤2，客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容，若所述音频数据涉及敏感内容，则利用预先存储的默认音频数据替换直播音视频数据中的音频数据；若不涉及敏感内容，则不对音视频数据进行处理；步骤3，客户端将经过或未经...

【技术保护点】
一种基于语音识别的直播视频敏感内容过滤方法，其特征在于，包括：步骤1，用户打开直播后，客户端录制用户的直播音视频数据；步骤2，客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容，若所述音频数据涉及敏感内容，则利用预先存储的默认音频数据替换直播音视频数据中的音频数据；若不涉及敏感内容，则不对音视频数据进行处理；步骤3，客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。

【技术特征摘要】
1.一种基于语音识别的直播视频敏感内容过滤方法，其特征在于，包括：步骤1，用户打开直播后，客户端录制用户的直播音视频数据；步骤2，客端利用服务器端的敏感内容库判断所述音视频数据中的音频数据是否涉及敏感内容，若所述音频数据涉及敏感内容，则利用预先存储的默认音频数据替换直播音视频数据中的音频数据；若不涉及敏感内容，则不对音视频数据进行处理；步骤3，客户端将经过或未经过处理的直播音视频数据经直播音视频数据队列推送至服务器。2.根据权利要求1所述的一种基于语音识别的直播视频敏感内容过滤方法，其特征在于，所述步骤2中判断音频数据是否涉及敏感内容的步骤如下：步骤201，客户端利用语音识别技术将原始音频数据转化为文字；步骤202，客户端将文字发送至服务器，服务器利用预先设置的敏感内容匹配规则将转换后的文字和预先设置的敏感内容库中的词语进行匹配，若所匹配成功则判断所述音频数据涉及敏感内容，否则判断所述音频数据未涉及敏感内容。3.根据权利要求2所述的一种基于语音识别的直播视频敏感内容过滤方法，其特征在于，所述匹配规则包括：全词匹配、部分词匹配、拼音匹配、字母匹配中的一种或多种。4.根据权利要求1所述的一种基于语音识别的直播视频敏感内容过滤方法，其特征在于，在步骤2中，当判断所述音频数据涉及敏感内容后，提示直播用户直播内容涉及敏感内容。5.根据权利要求1所述的一种基于语音识别的直播视频敏感内容过滤方法，其特征在于，所述敏感内容包括：不文明用语、涉及隐私用语、涉及政治用语中的一种或多种。6.一种...

【专利技术属性】
技术研发人员：张朝兵，
申请(专利权)人：武汉斗鱼网络科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人