【技术实现步骤摘要】
一种违规宣传检测方法和装置、计算机可读存储介质
本专利技术涉及广告传媒
,尤其涉及一种违规宣传检测方法和装置、计算机可读存储介质。
技术介绍
2015年9月1日正式实施的新《广告法》,加大了广告虚假宣传的治理强度,并对诸如“最”、“一”、“级/极”、“首/家/国”、“品牌”、“虚假”、“权威”、“欺诈”、“时间”等相关极限用语作了严格禁令规定。对于使用极限用语的违规商家,将被扣分,并遭到二十万元以上、一百万元以下罚款,情节严重者将被直接封店;顾客投诉极限用语并维权成功后,赔付金额将由商家全部承担。但是,目前各商家对通过互联网发布信息的管控往往都还在比较初级的水平,并没有投放广告时的层层把关,比较容易出现一些违规的情况,例如通过互联网搜索的公司介绍或产品介绍中就比较容易出现广告法中的禁用词。目前市场上还没有相关公司或技术针对互联网的企业宣传数据进行违法识别,相关国家部门或者公司在判别取证时基本上都是专业的法务人员人工搜索引擎搜索和人工判断的方式工作,这种工作方式虽然可以做到比较准确,但是其工作效率低下,搜索覆盖面窄,同时人工成本很高,只有专业的人才能胜任。专利 ...
【技术保护点】
1.一种违规宣传检测方法,其特征在于,包括:对待检测的内容进行命名实体识别,将识别出的含预定义的极限词的命名实体进行替换处理;根据预设的分词词库,进行分词和词性标注;在各分词中查找预定义的极限词;对查找到的极限词,根据标注的词性进行规则化处理。
【技术特征摘要】
1.一种违规宣传检测方法,其特征在于,包括:对待检测的内容进行命名实体识别,将识别出的含预定义的极限词的命名实体进行替换处理;根据预设的分词词库,进行分词和词性标注;在各分词中查找预定义的极限词;对查找到的极限词,根据标注的词性进行规则化处理。2.根据权利要求1所述的方法,其特征在于,所述在各分词中查找预定义的极限词的步骤之前,所述方法还包括:根据预设的同义词词库,对各分词进行同义词替换处理。3.根据权利要求1所述的方法,其特征在于,所述对查找到的极限词,根据标注的词性进行规则化处理,包括:如果所述极限词的词性为时限类极限词,则查找所述极限词前后的N个句子中是否包括相应的活动日期,如果包括相应的活动日期,则标注所述极限词不违规;如果不包括相应的活动日期,则标注所述极限词违规,其中,N为自然数;如果所述极限词的词性是极限类极限词,则直接标注所述极限词违规。4.根据权利要求1所述的方法,其特征在于,所述方法之前还包括:根据公司名称和/或产品名称搜索相关的网页;对搜索到的网页进行解析和过滤,得到待检测的网页;提取待检测的网页的正文内容,并存储到数据库中。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述各分词中,删除预定义的无意义的分词;按照预设的顺序将剩余的分词...
【专利技术属性】
技术研发人员:孙振江,
申请(专利权)人:北京百悟科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。