【技术实现步骤摘要】
一种稿件内容安全审核方法、装置、电子设备及介质
[0001]本专利技术属于数据审核
,特别涉及一种稿件内容安全审核方法
、
装置
、
电子设备及介质
。
技术介绍
[0002]随着移动互联网行业发展,全网内容资源爆发式增长,包括信息流内容
、
短视频
、
图片等内容,同时,对各类平台的内容监管要求也越来越严,为此带来的是海量内容资源管控风险及审核难度的增加
。
因此,内容安全审核成为以短视频
、
新闻资讯媒资平台优先级最高的运营需求
。
[0003]现有技术中,通过人工审核或者以系统性的机器审核
。
[0004]然而现有技术中,没有对审核内容进行细致的分类,在内容审核过程中,存在识别误判情况
。
技术实现思路
[0005]本专利技术提供了一种稿件内容安全审核方法
、
装置
、
设备及介质,旨在解决上述现有技术中存在的没有对审核内容进行细致的分类,在内容审核过程中,存在识别误判情况的技术问题
。
[0006]本专利技术解决上述技术问题的技术方案如下:一种稿件内容安全审核方法,该方法包括:
[0007]S1
,基于不同部门的不同领域分类获取待检测数据并进行处理,生成文本检测数据;
[0008]S2
,调用安全审核接口,基于本地敏感词数据库对所述文本检测数据进行安全审核,得到敏感词 ...
【技术保护点】
【技术特征摘要】
1.
一种稿件内容安全审核方法
,
其特征在于,包括:
S1
,基于不同部门的不同领域分类获取待检测数据并进行处理,生成文本检测数据;
S2
,调用安全审核接口,基于本地敏感词数据库对所述文本检测数据进行安全审核,得到敏感词数据结果,所述敏感词数据结果存储着安全审核得到的敏感词;
S3
,对所述敏感词数据结果匹配本地白名单表,得到第一敏感词数据和第二敏感词数据,所述第一敏感词数据是敏感词数据结果中与本地白名单表匹配成功的敏感词,所述第二敏感词数据是敏感词数据结果中与本地白名单表匹配不成功的敏感词;
S4
,将所述第一敏感词数据添加到本地白名单表中,将所述第二敏感词数据添加到本地黑名单表中
。2.
根据权利要求1所述的一种稿件内容安全审核方法,其特征在于,所述待检测数据包括文本数据
、
图片数据和视频数据,生成文本检测数据的具体过程为:将所述视频数据分解为图像数据和音频数据;对所述图片数据和所述图像数据进行文本识别处理,得到图源文本;对所述音频数据进行文本识别处理,得到音频文本;通过自然语言处理方法对所述文本数据
、
所述图源文本和所述音频文本进行处理,得到文本检测数据
。3.
根据权利要求2所述的一种稿件内容安全审核方法,其特征在于,对所述图片数据和所述图像数据进行文本识别处理具体为,通过基于全卷积神经网络的图像处理方法对所述图像数据和所述图片数据进行预处理,基于光学字符识别方法对预处理后的所述图片数据和所述图像数据进行分析处理,得到图源文本
。4.
根据权利要求2所述的一种稿件内容安全审核方法,其特征在于,基于
Word2Vec
,对所述文本数据
、
图片文本和音频文本进行处理,得到文本检测数据
。5.
根据权利要求1所述的一种稿件内容安全审核方法,其特征在于,基于不同部门的不同领域,通过本地黑...
【专利技术属性】
技术研发人员:赵永飞,史峰霖,郑妍,
申请(专利权)人:中国经济信息社有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。