Including the method, the invention discloses a detection of illegal information from the media audio and video content in the media: files using the format and encoding steps, detecting user upload; step two, scan subtitle file, check whether there is a sensitive vocabulary; step three, to decode the output from the media, the corresponding data stream; real-time detection of step four, the data stream and audio time points to detect the presence of abnormal sound; step five, from the time point to audio audio content interception for a period of time, and generates an audio file; step six, the audio file of voice recognition into the corresponding text information; step seven the text message and check to see if there is sensitive words; step eight, return to the media content from a legal result; step nine, return the test results. The invention can intelligently detect the illegal information in the audio and video content of the self media, save a large amount of human labor, and is beneficial to purify the network environment.
【技术实现步骤摘要】
一种检测自媒体音视频内容中的违规信息的方法
本专利技术涉及数字电视
,具体涉及一种检测自媒体音视频内容中的违规信息的方法。
技术介绍
自媒体是近几年产生的新生事物,自媒体又称“公民媒体”或“个人媒体”,是指私人化、平民化、普泛化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称。目前的自媒体平台有很多,包括各种博客平台、微博、微信、贴吧、短视频平台、直播平台等网络社区。由于自媒体来自于广大人民群众自行制作的内容,一些人在制作自媒体的同时,出于某些别有用心的动机,往往会在自媒体内容中加入不符合广电总局要求的文字或音频内容信息。而对于各个自媒体平台而言,通过人工审核用户上传的自媒体信息,往往工作量较大,尤其是对于用户基数庞大的自媒体平台而言,人工审核的工作量非常大。有鉴于此,我们设计并实现了一种检测自媒体音视频内容中的违规信息的方法,可以利用计算机的计算能力,智能地解决检测自媒体音视频内容中的违规信息的工作,节省了大量人力劳动,并有利于净化网络环境。
技术实现思路
本专利技术克服了现有技术的不足,提供了一种检测自媒体音视频内容中的违规信息的方法。为解决上述的技术问题,本专利技术以下技术方案:一种检测自媒体音视频内容中的违规信息的方法,包括如下步骤:步骤一、检测用户上传的自媒体文件使用的格式和编码;步骤二、扫描字幕文件的内容,查看是否存在敏感词汇;对字幕文件的内容进行全文扫描,查看内容中是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续下一步骤;步骤三、 ...
【技术保护点】
一种检测自媒体音视频内容中的违规信息的方法,其特征在于包括如下步骤:步骤一、检测用户上传的自媒体文件使用的格式和编码;步骤二、扫描字幕文件的内容,查看是否存在敏感词汇;对字幕文件的内容进行全文扫描,查看内容中是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续下一步骤;步骤三、调用音视频解码器对自媒体进行解码,输出相应的数据流;步骤四、对数据流进行实时检测,检测是否存在异常声音的音频时间点;步骤五、从步骤四的音频时间点开始截取一段时间的音频内容,并生成一个音频文件,并进行临时存储;步骤六、对音频文件进行语音识别,转为相应的文字信息;步骤七、对文字信息进行检查,看是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续步骤八;步骤八、返回自媒体内容合法的结果;表示自媒体内容已经通过平台机器人的智能审查,初审通过;步骤九、返回检测结果;此步骤为返回检测到违规内容的结果。
【技术特征摘要】
1.一种检测自媒体音视频内容中的违规信息的方法,其特征在于包括如下步骤:步骤一、检测用户上传的自媒体文件使用的格式和编码;步骤二、扫描字幕文件的内容,查看是否存在敏感词汇;对字幕文件的内容进行全文扫描,查看内容中是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续下一步骤;步骤三、调用音视频解码器对自媒体进行解码,输出相应的数据流;步骤四、对数据流进行实时检测,检测是否存在异常声音的音频时间点;步骤五、从步骤四的音频时间点开始截取一段时间的音频内容,并生成一个音频文件,并进行临时存储;步骤六、对音频文件进行语音识别,转为相应的文字信息;步骤七、对文字信息进行检查,看是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续步骤八;步骤八、返回自媒体内容合法的结果;表示自媒体内容已经通过平台机器人的智能审查,初审通过;步骤九、返回检测结果;此步骤为返回检测到违规内容的结果。2.根据权利要求1所述检测自媒体音视频内容中的违规信息的方法,其特征在于:步骤一中,检测是指以数据流的方式,读取用户上传的自媒体文件的内容,并根据各种视频、音频、字幕的格式标准定义进行比对,获得用户上传的自媒体文件使用的格式和编码。3.根据权利要求1所述检测自媒体音视频内容中的违规信息的方法,其特征在于:步骤二所述敏感词汇的判定...
【专利技术属性】
技术研发人员:李强,王凤琴,
申请(专利权)人:四川长虹电器股份有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。