【技术实现步骤摘要】
广告主分类方法及装置、计算设备
本专利技术涉及互联网
,具体涉及一种广告主分类方法及装置、计算设备。
技术介绍
广告主是广告活动的发布者,任何推广、销售产品或服务的商家都可以作为广告主。对广告主进行分类,能够更好的帮助网站对各广告主进行分析,从而对网站的经营分析提供帮助。目前,现有技术中对广告主进行分类主要是按照行业进行分类,而且大多是人工处理,或者依赖于广告主自己预先填写的行业类别。人工处理主要依据广告主提供的公司名称、主营业务等信息进行分类,或者依据广告主曾经发布的广告类型等信息进行分类。现有技术的这种分类方法得到的分类结果粒度很大,仅仅是行业划分,分类结果不够精细;而且人工操作全凭经验,得到的分类结果准确性较差。另外,针对大数据量的分类处理,人工处理方式耗时、成本高。因此,现有技术缺乏一种精准有效地广告主分类方法。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的广告主分类方法及装置、计算设备。根据本专利技术的一个方面,提供了一种 ...
【技术保护点】
1.一种广告主分类方法,包括:/n根据广告主的属性信息,对广告主进行一级分类,得到每个广告主的一级类别;/n收集每个广告主的广告主购买词和/或广告主网页信息,从所述广告主购买词和/或广告主网页信息中提取得到广告主特征词;/n根据广告主特征词对属于同一一级类别的广告主进行二级分类,得到每个广告主的二级类别;/n根据每个广告主的一级类别和二级类别,确定广告主的类别。/n
【技术特征摘要】
1.一种广告主分类方法,包括:
根据广告主的属性信息,对广告主进行一级分类,得到每个广告主的一级类别;
收集每个广告主的广告主购买词和/或广告主网页信息,从所述广告主购买词和/或广告主网页信息中提取得到广告主特征词;
根据广告主特征词对属于同一一级类别的广告主进行二级分类,得到每个广告主的二级类别;
根据每个广告主的一级类别和二级类别,确定广告主的类别。
2.根据权利要求1所述的方法,其中,所述根据广告主的属性信息,对广告主进行一级分类,得到每个广告主的一级类别进一步包括:
根据广告主的主体名称和/或主页网址信息,对广告主进行一级分类,得到每个广告主的一级类别。
3.根据权利要求1或2所述的方法,其中,所述从广告主网页信息中提取得到广告主特征词进一步包括:
获取广告主相关网页的源码信息;
从所述广告主相关网页的源码信息中提取指定标签对应的内容;
对所述指定标签对应的内容进行分词处理,得到广告主特征词。
4.根据权利要求1-3中任一项所述的方法,其中,在所述根据广告主特征词对属于同一一级类别的广告主进行二级分类之前,所述方法还包括:
针对每个广告主的每个广告主特征词,统计该广告主特征词在对应的广告主的广告主相关信息中出现的第一词频,以及统计该广告主特征词在其它广告主的广告主相关信息中出现的第二词频;
根据广告主特征词的第一词频和第二词频,对各个广告主的各个广告主特征词进行过滤处理。
5.根据权利要求1-4中任一项所述的方法,其中,所述根据广告主特征词对属于同一一级类别的广告主进行二级分类,得到每个广告主的二级类别进一步包括:
根据广告主特征词对属于同一一级类别的广告主进行聚类;...
【专利技术属性】
技术研发人员:耿小亮,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。