一种信息内容监测方法及系统技术方案

技术编号:29984504 阅读:17 留言:0更新日期:2021-09-08 10:23
本发明专利技术提供了一种信息内容监测方法及系统,包括:获取用户设置的监测业务配置信息;根据所述监测业务配置信息进行解析后得到对应的采集任务,并将所述采集任务分配给对应的爬虫集群对目标网络数据进行数据采集,获得对应的数据集;通过风险指纹库对所述数据集进行分类审核,分析所述数据集中各类数据的违规风险,并根据所述违规风险将各类数据存入对应的风险数据库中;所述风险数据库包括风险库、无风险库和疑似风险库;将所述疑似风险库中的数据发送给人工审核系统进行复审并根据复审结果更新所述风险数据库,并同步数据至所述风险指纹库;将更新后的所述风险数据库中的信息进行可视化展示;降低了网络违规信息审核量的同时提高了审核效率。时提高了审核效率。时提高了审核效率。

【技术实现步骤摘要】
一种信息内容监测方法及系统


[0001]本专利技术涉及网络信息安全
,具体而言,涉及一种信息内容监测方法及系统。

技术介绍

[0002]目前,目前的各种针对各类有害低俗等节目内容的自动分析于此情况,一般都是采用如下的技术措施:维护关键词库:通过维护一个巨大的关键词库,当文本内含有关键词库中的1:1关键词才可以检测出来。
[0003]针对相关信息是嵌入平台中做直接的信息过滤与拦截。
[0004]人工检测:通过招聘内容审核员等职位人员进行人工处理并且人工花费大量时间进行数据统计生成检测报告。
[0005]监管“黑名单”:监管系统多采用“黑名单”的方式,通过建立“有害节目内容库”,将涉嫌违规视听内容与库中关键帧对比完成识别。
[0006]但随着新媒体时代信息源的丰富性和数字化技术的便捷性,互联网中每时每刻都在产生形形色色的内容,由于分析手段单一,缺乏智能内容审核技术手段,导致人工参与审核的工作量大、效率低下、对严重违规内容发现处置不及时等问题。因此,需要提供一种方案以提高网络违规内容审核效率,降低审核者的工作量。

技术实现思路

[0007]本专利技术的目的在于提供一种信息内容监测方法及系统,用以实现提高网络违规内容审核效率并降低审核者的工作量的技术效果。
[0008]第一方面,本专利技术提供了一种信息内容监测方法,包括:S1.获取用户设置的监测业务配置信息;S2.根据所述监测业务配置信息进行解析后得到对应的采集任务,并将所述采集任务分配给对应的爬虫集群对目标网络数据进行数据采集,获得对应的数据集;S3.通过风险指纹库对所述数据集进行分类审核,分析所述数据集中各类数据的违规风险,并根据所述违规风险将各类数据存入对应的风险数据库中;所述风险数据库包括风险库、无风险库和疑似风险库;S4.将所述疑似风险库中的数据发送给人工审核系统进行复审并根据复审结果更新所述风险数据库,并同步数据至所述风险指纹库;S5.将更新后的所述风险数据库中的信息进行可视化展示。
[0009]进一步地,所述方法还包括:获取用户上传的指定内容并根据所述指定内容进行分类审核,分析所述指定内容中是否存在违规内容;若所述指定内容中存在违规内容,则将违规内容存入对应的风险指纹库,并对数
据进行清洗处理后生成对应的审核报告。
[0010]进一步地,所述指定内容至少包括指定内网数据、指定互联网内容、指定政府网数据和通过FTP上传的本地数据中的一种。
[0011]进一步地,所述方法还包括:S6. 获取用户的数据审查请求;S7. 根据所述数据审查请求将所述风险数据库中的数据通过数据列表进行展示。
[0012]进一步地,所述方法还包括:S8. 获取用户对所述数据列表的操作指令并根据所述操作指令对所述数据列表中的数据进行处理;所述操作指令至少包括筛选操作、导出操作和共享操作。
[0013]进一步地,所述S3包括:S31.将所述数据集中的数据划分为文本数据、视频数据和图像数据;S32.分析所述文本数据、视频数据和图像数据是否与对应的风险指纹库中的信息相匹配;S33.若所述文本数据、视频数据和图像数据与对应的风险指纹库中的信息相匹配,则将所述文本数据、视频数据和图像数据存入风险库中,并同步数据至所述风险指纹库中。
[0014]进一步地,所述方法还包括:S34.若所述文本数据、视频数据和图像数据与对应的风险指纹库中的信息不匹配,则通过对应的AI识别模型分析各类数据中是否存在违规内容,根据所述违规内容将各类数据存入对应的风险数据库中,并同步数据至所述风险指纹库中。
[0015]第二方面,本专利技术还提供了一种信息内容监测系统,包括:业务配置模块,用于获取用户设置的监测业务配置信息;信息采集模块,用于根据所述监测业务配置信息进行解析后得到对应的采集任务,并将所述采集任务分配给对应的爬虫集群对目标网络数据进行数据采集,获得对应的数据集;审核模块,用于通过风险指纹库对所述数据集进行分类审核,分析所述数据集中各类数据的违规风险,并根据所述违规风险将各类数据存入对应的风险数据库中;所述风险数据库包括风险库、无风险库和疑似风险库;更新模块,用于将所述疑似风险库中的数据发送给人工审核系统进行复审并根据复审结果更新所述风险数据库,并同步数据至所述风险指纹库;展示模块,用于将更新后的所述风险数据库中的信息进行可视化展示。
[0016]进一步地,所述系统还包括:指定内容分析模块,用于获取用户上传的指定内容并根据所述指定内容进行分类审核,分析所述指定内容中是否存在违规内容;若所述指定内容中存在违规内容,则将违规内容存入对应的风险指纹库,并对数据进行清洗处理后生成对应的审核报告。
[0017]本专利技术能够实现的有益效果是:本专利技术提供的信息内容监测方法及系统在对色情、低俗、灌水、及商业广告、敏感人物名讳、反动、暴力、枪支等文本内容进行准确的标引和检测与色情、低俗、敏感人脸、血腥暴力、枪支暴恐、标致旗帜等图像内容进行准确识别的基础上,降低了网络违规信息的审核工作量,提高了审核效率。
附图说明
[0018]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使
用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0019]图1为本专利技术实施例提供的一种信息内容监测方法的总体流程示意图;图2为本专利技术实施例提供的一种信息采集流程示意图;图3为本专利技术实施例提供的一种分类审核流程示意图;图4为本专利技术实施例提供的一种指纹库配置流程示意图;图5为本专利技术实施例提供的一种关键词库配置流程示意图;图6为本专利技术实施例提供的一种数据审查流程示意图;图7为本专利技术实施例提供的一种人工复核流程示意图;图8为本专利技术实施例提供的一种指定内容审核流程示意图;图9为本专利技术实施例提供的一种信息内容监测系统的拓扑结构示意图。
[0020]图标:10

信息内容监测系统;100

业务配置模块;200

信息采集模块;300

审核模块;400

更新模块;500

展示模块;600

指定内容分析模块。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。
[0022]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0023]请参看图1、图2和图3,图1为本专利技术实施例提供的一种信息内容监测方法的总体流程示意图;图2为本专利技术实施例提供的一种信息采集流程示意图;图3为本专利技术实施例提供的一种分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息内容监测方法,其特征在于,包括:S1.获取用户设置的监测业务配置信息;S2.根据所述监测业务配置信息进行解析后得到对应的采集任务,并将所述采集任务分配给对应的爬虫集群对目标网络数据进行数据采集,获得对应的数据集;S3.通过风险指纹库对所述数据集进行分类审核,分析所述数据集中各类数据的违规风险,并根据所述违规风险将各类数据存入对应的风险数据库中;所述风险数据库包括风险库、无风险库和疑似风险库;S4.将所述疑似风险库中的数据发送给人工审核系统进行复审并根据复审结果更新所述风险数据库,并同步数据至所述风险指纹库;S5.将更新后的所述风险数据库中的信息进行可视化展示。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取用户上传的指定内容并根据所述指定内容进行分类审核,分析所述指定内容中是否存在违规内容;若所述指定内容中存在违规内容,则将违规内容存入对应的风险指纹库,并对数据进行清洗处理后生成对应的审核报告。3.根据权利要求2所述的方法,其特征在于,所述指定内容至少包括指定内网数据、指定互联网内容、指定政府网数据和通过FTP上传的本地数据中的一种。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:S6. 获取用户的数据审查请求;S7. 根据所述数据审查请求将所述风险数据库中的数据通过数据列表进行展示。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:S8. 获取用户对所述数据列表的操作指令并根据所述操作指令对所述数据列表中的数据进行处理;所述操作指令至少包括筛选操作、导出操作和共享操作。6.根据权利要求1所述的方法,其特征在于,所述S3包括:S31.将所述数据集中的数据划分为文本数据、视频数据和...

【专利技术属性】
技术研发人员:肖雪松严骊严帅冷昱汉龙胜海
申请(专利权)人:成都明途科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1