一种分销渠道挖掘方法及装置制造方法及图纸

技术编号:33245244 阅读:124 留言:0更新日期:2022-04-27 17:55
本发明专利技术公开了一种分销渠道挖掘方法及装置,所述方法包括:根据不同数据源的特性设定爬虫相应爬虫策略进行分布式爬虫;将分布式爬虫得到的爬取数据过滤解析后入库;将爬取数据进行渠道识别、行业品类映射、标准品牌加工和业务维度加工,提取出各渠道的销售模式标签、产品标签、品牌标签和业务属性;根据所述销售模式标签、所述产品标签、所述品牌标签和所述业务属性,挖掘出目标分销渠道。采用本发明专利技术实施例,能使得产品端更方便了解企业的工商、产品、销售、招聘等基础信息,以及触及关联的联系方式,快速且准确地批量筛选出大量有效分销渠道。道。道。

【技术实现步骤摘要】
一种分销渠道挖掘方法及装置


[0001]本专利技术涉及数据挖掘领域,尤其涉及一种分销渠道挖掘方法及装置。

技术介绍

[0002]分销渠道的筛选和识别是很多供应商在铺货或者招商时候遇到的场景。目前供应商没有相近的系统进行精准查询,只能通过整合不同的电商(垂直电商、综合电商)或者信息平台的商家数据,并进行一系列的人工排查和联系来判断分销渠道的准确度和实力。
[0003]但是由于数据源多而杂乱,人工筛选工作量大,渠道选择工作效率低下;同时分销渠道难以识别,尤其容易出现行业、品类识别错误或是经营方式识别错误的问题,也无法从客观的角度衡量渠道商的资质和实力。

技术实现思路

[0004]本专利技术实施例提供一种分销渠道挖掘方法及装置,通过分布式爬虫抓取各大主流b2b数据源平台企业信息,通过行业映射归类、企业主体映射、提取销售模式标签、关联产品和品牌等处理流程对原始数据进行清洗、加工、聚合,快速且准确地筛选出符合条件的渠道商。
[0005]为实现上述目的,本申请实施例的第一方面提供了一种分销渠道挖掘方法,所述方法包括:
...

【技术保护点】

【技术特征摘要】
1.一种分销渠道挖掘方法,其特征在于,根据不同数据源的特性设定爬虫相应爬虫策略进行分布式爬虫;将分布式爬虫得到的爬取数据过滤解析后入库;将爬取数据进行渠道识别、行业品类映射、标准品牌加工和业务维度加工,提取出各渠道的销售模式标签、产品标签、品牌标签和业务属性;根据所述销售模式标签、所述产品标签、所述品牌标签和所述业务属性,挖掘出目标分销渠道。2.如权利要求1所述的分销渠道挖掘方法,其特征在于,所述渠道识别的过程具体包括:剔除经营模式标签和剔除简介内容中包含生产或制造内容的相关企业信息,并建立正则表达式来提取渠道的销售模式标签。3.如权利要求1所述的分销渠道挖掘方法,其特征在于,所述行业品类映射的具体过程包括:根据国标所属行业到产品端行业映射规则进行基础的映射;对于所述爬取数据中不能被映射的渠道数据进行行业产品词库归类映射;所述行业产品词库是产品端行业下的垂直词库。4.如权利要求1所述的分销渠道挖掘方法,其特征在于,所述标准品牌加工的具体过程包括:过滤品牌名字的杂质并建立品牌标准命名,并将其他非标准的品牌...

【专利技术属性】
技术研发人员:陈开冉黎展黄俊强林仲懿
申请(专利权)人:广州探迹科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1