信息自动审核方法与系统技术方案

技术编号:7091117 阅读:667 留言:1更新日期:2012-04-11 18:40
本发明专利技术公开了一种信息自动审核方法与系统。其中,该方法包括接收用户上传的信息;信息审核服务器查询规则数据库,利用规则数据库中的审核规则匹配上传信息,如果匹配确定上传信息不满足审核规则,则在匹配完毕后对上传信息执行禁止审核通过操作,否则,确定自动审核通过并进入人工待审状态。本发明专利技术的系统和方法,由信息审核服务器按照审核规则逐条审核用户上传的信息,从而可以将审核人员从繁重的人工审核任务中解放出来。同时,在审核完成后,可以释放服务器中无用信息所占用的大量存储空间。

【技术实现步骤摘要】
信息自动审核方法与系统
本专利技术涉及信息审核领域,更具体地,涉及一种信息自动审核方法与系统。
技术介绍
目前,我国信息发布所采用的是“先审核后发布”机制,即,只有审核通过的信息才能在网络上发布。当用户创建或编辑内容开放、自由的网络百科全书时,服务器通常直接接受用户提交的创建信息或编辑信息,并不对用户所提交的信息做任何处理,这样服务器中将存储大量无用的(例如,广告信息)或重复的信息。为了支撑该服务,要求具备非常高的人工配置以通过人工完成信息的审核。另外,在人工审核过程中,如果由于某个原因未能通过审核,则由审核人员告知用户不能发布,并直接结束当前的审核过程,不再继续审核该信息是否符合其他规定,这样使得每次审核的效率非常低,即,用户待发布的信息可能需要多次审核,与审核人员进行多次交互才能实现信息的发布。
技术实现思路
本专利技术要解决的一个技术问题是提供一种信息自动审核方法,能够由信息审核服务器自动地对用户上传的信息进行审核,以降低审核时间并避免占用服务器的大量存储空间来存储无用信息。本专利技术提供了一种信息自动审核方法,包括接收用户上传的信息;信息审核服务器查询规则数据库,利用规则数据库中的审核规则匹配上传信息,如果匹配确定上传信息不满足审核规则,则在匹配完毕后对上传信息执行禁止审核通过操作,否则,确定自动审核通过并进入人工待审状态。根据本专利技术方法的一个实施例,在上传信息包括词条正文、图注文字或修改原因时,审核规则包括反广告信息的过滤策略,利用规则数据库中的审核规则匹配上传信息的步骤包括:查询上传信息中是否包含联系方式,如果包含联系方式,则确定上传信息不满足审核规则,并记录不满足规则的原因;查询词条正文的新增部分是否包含统一资源定位符URL,如果包含URL,则确定上传信息不满足审核规则,并记录不满足规则的原因。根据本专利技术方法的另一实施例,在上传信息包括词条的参考资料或扩展阅读时,审核规则包括反广告信息的过滤策略加用户保护策略,利用规则数据库中的审核规则匹配上传信息的步骤包括:查询上传信息中出现的URL是否符合不信任站点删除策略并且用户的编辑记录是否符合用户保护策略,如果URL符合不信任站点删除策略并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因;判断上传信息是否符合URL特征累积删除策略并且用户的编辑记录是否符合用户保护策略,如果上传信息符合URL特征累积删除策略并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因;判断上传信息是否符合广告词删除策略并且用户的编辑记录是否符合用户保护策略,如果上传信息符合广告词删除策略并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因。根据本专利技术方法的又一实施例,利用规则数据库中的审核规则匹配上传信息的步骤还包括:在用户首次提交的上传信息因不信任站点删除策略和用户保护策略被禁止审核通过后,如果用户自禁止审核通过操作后在预定时间内第二次提交的同名版本上传信息又符合不信任站点删除策略并且用户的编辑记录不符合用户保护策略,则跳过自动审核,并进入人工待审状态;在用户提交的上传信息因URL特征累积删除策略和用户保护策略被禁止审核通过后,如果用户自禁止审核通过操作后在预定时间内第二次提交的同名版本上传信息又符合URL特征累积删除策略并且用户的编辑记录不符合用户保护策略,则跳过自动审核,并进入人工待审状态。根据本专利技术方法的再一实施例,在上传信息包括图片或词条正文时,审核规则包括低质量过滤策略加用户保护策略,利用规则数据库中的审核规则匹配上传信息的步骤包括:判断用户编辑后的上传信息中的图片数量与用户编辑前的版本中的图片数量相比是否小于预定个数并且用户的编辑记录是否符合用户保护策略,如果小于预定个数并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因;判断用户新建的上传信息所包含的字节数是否小于第一预定字节数,如果小于第一预定字节数,则确定上传信息不满足审核规则,并记录不满足规则的原因;判断上传信息所包含的字节数是否介于第一预定字节数和第二预定字节数之间、上传信息中数字与字母的字节数是否超过预定比例并且用户的编辑记录是否符合用户保护策略,如果上传信息所包含的字节数介于第一预定字节数和第二预定字节数之间、上传信息中数字与字母的字节数超过预定比例并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因。根据本专利技术方法的再一实施例,在上传信息包括词条名称时,审核规则包括词条名称命名策略,利用规则数据库中的审核规则匹配上传信息的步骤包括:判断上传信息是否符合词条名称命名策略,如果不符合词条名称命名策略,则确定上传信息不满足审核规则,并记录不满足规则的原因。根据本专利技术方法的再一实施例,该方法还包括:在对上传信息执行禁止审核通过操作后,将不满足规则的原因反馈给用户。本专利技术的信息自动审核方法,由信息审核服务器按照审核规则逐条审核用户上传的信息,从而可以将审核人员从繁重的人工审核任务中解放出来。同时,在审核完成后,可以释放服务器中无用信息所占用的大量存储空间。本专利技术要解决的另一技术问题是提供一种信息自动审核系统,能够由信息审核服务器自动地对用户上传的信息进行审核,以降低审核时间并避免占用服务器的大量存储空间来存储无用信息。本专利技术提供了一种信息自动审核系统,包括信息接收装置,用于接收用户上传的信息;规则数据库,用于存储审核规则;信息审核服务器,与信息接收装置和规则数据库相连,用于从规则数据库中读取审核规则,利用审核规则匹配上传信息,如果匹配确定上传信息不满足审核规则,则在匹配完毕后对上传信息执行禁止审核通过操作,否则,确定自动审核通过并进入人工待审状态。根据本专利技术系统的一个实施例,在上传信息包括词条正文、图注文字或修改原因时,审核规则包括反广告信息的过滤策略,信息审核服务器包括:联系方式匹配模块,用于查询上传信息中是否包含联系方式,如果包含联系方式,则确定上传信息不满足审核规则,并记录不满足规则的原因;URL查询模块,用于查询词条正文的新增部分是否包含统一资源定位符URL,如果包含URL,则确定上传信息不满足审核规则,并记录不满足规则的原因。根据本专利技术系统的另一实施例,在上传信息包括词条的参考资料或扩展阅读时,审核规则包括反广告信息的过滤策略加用户保护策略,信息审核服务器包括:不信任站点删除策略匹配模块,用于查询上传信息中出现的URL是否符合不信任站点删除策略并且用户的编辑记录是否符合用户保护策略,如果URL符合不信任站点删除策略并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因;URL特征累积删除策略匹配模块,用于判断上传信息是否符合URL特征累积删除策略并且用户的编辑记录是否符合用户保护策略,如果上传信息符合URL特征累积删除策略并且用户的编辑记录不符合用户保护策略,则确定上传信息不满足审核规则,并记录不满足规则的原因;广告词删除策略匹配模块,用于判断上传信息是否符合广告词删除策略并且用户的编辑记录是否符合用户保护策略,如果上传信息符合广告词删除策略并且用户的编辑记录不符合用本文档来自技高网...
信息自动审核方法与系统

【技术保护点】
1.一种信息自动审核方法,其特征在于,所述方法包括:接收用户上传的信息;信息审核服务器查询规则数据库,利用所述规则数据库中的审核规则匹配所述上传信息,如果匹配确定所述上传信息不满足所述审核规则,则在匹配完毕后对所述上传信息执行禁止审核通过操作,否则,确定自动审核通过并进入人工待审状态。

【技术特征摘要】
1.一种信息自动审核方法,其特征在于,所述方法包括:接收用户上传的信息;信息审核服务器查询规则数据库,利用所述规则数据库中的审核规则中与上传信息相关的策略匹配所述上传信息,如果上传信息中包含不满足审核规则的内容,则确定所述上传信息不满足所述审核规则,并在所述审核规则中与上传信息相关的策略均匹配完毕后对所述上传信息执行禁止审核通过操作,否则,确定自动审核通过并进入人工待审状态,其中,在所述上传信息包括词条的参考资料或扩展阅读时,所述审核规则包括反广告信息的过滤策略加用户保护策略,所述利用规则数据库中的审核规则中与上传信息相关的策略匹配所述上传信息的步骤包括:查询所述上传信息中出现的URL是否符合不信任站点删除策略并且用户的编辑记录是否符合用户保护策略,如果URL符合不信任站点删除策略并且用户的编辑记录不符合用户保护策略,则确定所述上传信息不满足所述审核规则,并记录不满足规则的原因;判断所述上传信息是否符合URL特征累积删除策略并且用户的编辑记录是否符合用户保护策略,如果所述上传信息符合所述URL特征累积删除策略并且用户的编辑记录不符合用户保护策略,则确定所述上传信息不满足所述审核规则,并记录不满足规则的原因;判断所述上传信息是否符合广告词删除策略并且用户的编辑记录是否符合用户保护策略,如果所述上传信息符合广告词删除策略并且用户的编辑记录不符合用户保护策略,则确定所述上传信息不满足所述审核规则,并记录不满足规则的原因。2.根据权利要求1所述的方法,其特征在于,所述利用规则数据库中的审核规则中与上传信息相关的策略匹配所述上传信息的步骤还包括:在用户首次提交的上传信息因所述不信任站点删除策略和用户保护策略被禁止审核通过后,如果所述用户自禁止审核通过操作后在预定时间内第二次提交的同名版本上传信息又符合所述不信任站点删除策略并且用户的编辑记录不符合所述用户保护策略,则跳过自动审核,并进入人工待审状态;在用户提交的上传信息因所述URL特征累积删除策略和用户保护策略被禁止审核通过后,如果所述用户自禁止审核通过操作后在所述预定时间内第二次提交的同名版本上传信息又符合所述URL特征累积删除策略并且用户的编辑记录不符合所述用户保护策略,则跳过自动审核,并进入人工待审状态。3.根据权利要求1至2中任一项所述的方法,其特征在于,所述方法还包括:在对所述上传信息执行禁止审核通过操作后,将所述不满足规则的原因反馈给所述用户。4.一种信息自动审核方法,其特征在于,所述方法包括:接收用户上传的信息;信息审核服务器查询规则数据库,利用所述规则数据库中的审核规则中与上传信息相关的策略匹配所述上传信息,如果上传信息中包含不满足审核规则的内容,则确定所述上传信息不满足所述审核规则,并在所述审核规则中与上传信息相关的策略均匹配完毕后对所述上传信息执行禁止审核通过操作,否则,确定自动审核通过并进入人工待审状态,其中,在所述上传信息包括图片或词条正文时,所述审核规则包括低质量过滤策略加用户保护策略,所述利用规则数据库中的审核规则中与上传信息相关的策略匹配所述上传信息的步骤包括:判断用户编辑后的上传信息中的图片数量与用户编辑前的版本中的图片数量相比是否小于预定个数并且用户的编辑记录是否符合用户保护策略,如果小于所述预定个数并且用户的编辑记录不符合用户保护策略,则确定所述上传信息不满足所述审核规则,并记录不满足规则的原因;判断用户新建的上传信息所包含的字节数是否小于第一预定字节数,如果小于所述第一预定字节数,则确定所述上传信息不满足所述审核规则,并记录不满足规则的原因;判断所述上传信息所包含的字节数是否介于所述第一预定字节数和第二预定字节数之间、所述上传信息中数字与字母的字节数是否超过预定比例并且用户的编辑记录是否符合用户保护策略,如果所述上传信息所包含的字节数介于所述第一预定字节数和所述第二预定字节数之间、所述上传信息中数字与字母的字节数超过所述预定比例并且用户的编辑记录不符合用户保护策略,则确定所述上传信息不满足所述审核规则,并记录不满足规则的原因。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在对所述上传信息执行禁止审核通过操作后,将所述不满足规则的原因反馈给所述用户。6.一种信息自动审核系统,其特征在于,所述系统包括:信息接收装置,用于接收用户上传的信息;规则数据库,用于存储审核规则;信息审核服务器,与所述信息接收装置和所述规则数据库相连,用于从所述规则数据库中读取所述审核规则,利用所述审核规则中与上传信息相关的策...

【专利技术属性】
技术研发人员:彭川支静耿磊陈恭明
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:11

网友询问留言 已有1条评论
  • 来自[四川省成都市电信] 2014年01月10日 15:18
    此方法很有用啊,比如我单位每日人工审单量很大,如果能用上,就可以节约很大的人力成本啊。
    1
1