一种基于产业特征的企业分类方法及装置制造方法及图纸

技术编号:33638560 阅读:57 留言:0更新日期:2022-06-02 01:55
本发明专利技术公开了一种基于产业特征的企业分类方法及装置,所述基于产业特征的企业分类方法,包括:收集企业相关的数据;对所述数据进行埋点以给所述数据打上标签;对所述数据进行基于标签的相关度计算;依据计算结果对企业进行分类。通过产业链节点和产业特征的标记,将匹配上的企业自动分类归属到对应产业链节点下,达到迅速构建产业链条企业的能力;主要解决专家标记或者少量人工标记的主观性,同时减少工作量;使用基于标签的推荐匹配方案,将用户、标签、物品三者的匹配关系转化为产业链节点、产业特征、企业的匹配关系。企业的匹配关系。企业的匹配关系。

【技术实现步骤摘要】
一种基于产业特征的企业分类方法及装置


[0001]本专利技术涉及数据分类管理
,更具体地说,涉及一种基于产业特征的企业分类方法及装置。

技术介绍

[0002]基于标签的推荐系统,用户用标签来描述对物品的看法,因此标签是联系用户和物品的纽带,也是反应用户兴趣的重要数据源,如何利用用户的标签数据提高个性化推荐结果的质量是推荐系统研究的重要课题。
[0003]但是,现有技术一般采用人工标注,工作量大,产业链关联的企业可能从数家到数万家不等,人工标注无法短时间内解决大量的产业链节点对应企业标注工作;其次人工标注主观性强,依赖于个人或者数个人的知识与见解,准确率难以保证;自动化程度低,无法实现多条产业链的实时标注。

技术实现思路

[0004]本专利技术提供了一种基于产业特征的企业分类方法及装置,解决现有人工标注,工作量大,产业链关联的企业可能从数家到数万家不等,人工标注无法短时间内解决大量的产业链节点对应企业标注工作;其次人工标注主观性强,依赖于个人或者数个人的知识与见解,准确率难以保证;自动化程度低,无法实现多条产业链的实时标注的问题。
[0005]为解决上述问题,一方面,本专利技术提供一种基于产业特征的企业分类方法,包括:
[0006]收集企业相关的数据;
[0007]对所述数据进行埋点以给所述数据打上标签;
[0008]对所述数据进行基于标签的相关度计算;
[0009]依据计算结果对企业进行分类。
[0010]所述收集企业相关的数据,包括:r/>[0011]从行业标准网站或者通过专家意见获取相应的产业链数据以及产业特征数据;
[0012]从企业网站或者第三方网站获取企业基本信息;其中,企业相关的数据包括产业链数据、产业特征数据和企业特征标记数据;企业特征标记数据包括企业基本信息。
[0013]所述对所述数据进行埋点以给所述数据打上标签,包括:
[0014]在企业或相似网站页面进行数据埋点,埋点动作为用户为企业进行产业链数据和产业特数据进行标记以使标记至少形成三元组数据,所述三元组数据包括企业名称、产业名称及产业特征;
[0015]将埋点好的企业或者相似网站进行发布,从而由用户自由标记;
[0016]输出包括标记信息的企业特征标记数据。
[0017]所述对所述数据进行基于标签的相关度计算,包括:
[0018]统计第N个产业链节点对应的第C个产业特征,则对应的第N个产业链节点的第C个产业特征被标记过的次数为m
n,c
,第E个企业被打过第C个产业特征的次数为m
c,e

[0019]统计第C个产业特征与不同的产业链节点同时标记过的次数m
c,n

[0020]计算相关度:
[0021][0022]其中,P(n,e)为第N个产业链节点与第E个企业的相关度。
[0023]所述依据计算结果对企业进行分类,包括:
[0024]将相关度大于预设阈值的企业与产业链节点进行绑定;
[0025]将企业的分类归属于所绑定的产业链节点。
[0026]一方面,提供一种基于产业特征的企业分类装置,包括:
[0027]收集模块,用于收集企业相关的数据;
[0028]埋点模块,用于对所述数据进行埋点以给所述数据打上标签;
[0029]计算模块,用于对所述数据进行基于标签的相关度计算;
[0030]分类模块,用于依据计算结果对企业进行分类。
[0031]所述收集模块包括:
[0032]第一获取子模块,用于从行业标准网站或者通过专家意见获取相应的产业链数据以及产业特征数据;
[0033]第二获取子模块,用于从企业网站或者第三方网站获取企业基本信息;其中,企业相关的数据包括产业链数据、产业特征数据和企业特征标记数据;企业特征标记数据包括企业基本信息。
[0034]所述埋点模块包括:
[0035]数据埋点子模块,用于在企业或相似网站页面进行数据埋点,埋点动作为用户为企业进行产业链数据和产业特数据进行标记以使标记至少形成三元组数据,所述三元组数据包括企业名称、产业名称及产业特征;
[0036]标记子模块,用于将埋点好的企业或者相似网站进行发布,从而由用户自由标记;
[0037]输出子模块,用于输出包括标记信息的企业特征标记数据。
[0038]所述计算模块包括:
[0039]第一统计子模块,用于统计第N个产业链节点对应的第C个产业特征,则对应的第N个产业链节点的第C个产业特征被标记过的次数为m
n,c
,第E个企业被打过第C个产业特征的次数为m
c,e

[0040]第二统计子模块,用于统计第C个产业特征与不同的产业链节点同时标记过的次数m
c,n

[0041]相关度计算子模块,用于计算相关度:
[0042][0043]其中,P(n,e)为第N个产业链节点与第E个企业的相关度;
[0044]所述分类模块包括:
[0045]绑定子模块,用于将相关度大于预设阈值的企业与产业链节点进行绑定;
[0046]分类子模块,用于将企业的分类归属于所绑定的产业链节点。
[0047]一种计算机可读存储介质,所述存储介质中存储有多条指令,所述指令适于由处理器加载以执行以上所述的一种基于产业特征的企业分类方法。
[0048]本专利技术的有益效果是:通过产业链节点和产业特征的标记,将匹配上的企业自动分类归属到对应产业链节点下,达到迅速构建产业链条企业的能力;主要解决专家标记或者少量人工标记的主观性,同时减少工作量;使用基于标签的推荐匹配方案,将用户、标签、物品三者的匹配关系转化为产业链节点、产业特征、企业的匹配关系。
附图说明
[0049]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0050]图1是本专利技术一实施例提供的一种一种基于产业特征的企业分类方法的流程图。
具体实施方式
[0051]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0052]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于产业特征的企业分类方法,其特征在于,包括:收集企业相关的数据;对所述数据进行埋点以给所述数据打上标签;对所述数据进行基于标签的相关度计算;依据计算结果对企业进行分类。2.根据权利要求1所述的企业分类方法,其特征在于,所述收集企业相关的数据,包括:从行业标准网站或者通过专家意见获取相应的产业链数据以及产业特征数据;从企业网站或者第三方网站获取企业基本信息;其中,企业相关的数据包括产业链数据、产业特征数据和企业特征标记数据;企业特征标记数据包括企业基本信息。3.根据权利要求2所述的企业分类方法,其特征在于,所述对所述数据进行埋点以给所述数据打上标签,包括:在企业或相似网站页面进行数据埋点,埋点动作为用户为企业进行产业链数据和产业特数据进行标记以使标记至少形成三元组数据,所述三元组数据包括企业名称、产业名称及产业特征;将埋点好的企业或者相似网站进行发布,从而由用户自由标记;输出包括标记信息的企业特征标记数据。4.根据权利要求3所述的企业分类方法,其特征在于,所述对所述数据进行基于标签的相关度计算,包括:统计第N个产业链节点对应的第C个产业特征,则对应的第N个产业链节点的第C个产业特征被标记过的次数为m
n,c
,第E个企业被打过第C个产业特征的次数为m
c,e
;统计第C个产业特征与不同的产业链节点同时标记过的次数m
c,n
;计算相关度:其中,P(n,e)为第N个产业链节点与第E个企业的相关度。5.根据权利要求4所述的企业分类方法,其特征在于,所述依据计算结果对企业进行分类,包括:将相关度大于预设阈值的企业与产业链节点进行绑定;将企业的分类归属于所绑定的产业链节点。6.一种基于产业特征的企业分类装置,其特征在于,包括:收集模块,用于收集企业相关的数据;埋点模块,用于对所述数据进行埋点以给所述数据打上标签;计...

【专利技术属性】
技术研发人员:盘浩军奉凡唐明黄尉洵
申请(专利权)人:深圳中科闻歌科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1