基于大数据的企业推荐方法技术

技术编号:39408141 阅读:5 留言:0更新日期:2023-11-19 16:00
本申请涉及基于大数据的企业推荐方法

【技术实现步骤摘要】
基于大数据的企业推荐方法、装置、设备及介质


[0001]本专利技术属于大数据处理
,涉及一种基于大数据的企业推荐方法

装置

设备及介质


技术介绍

[0002]随着互联网技术的发展,在互联网上的信息呈指数级增长,这无疑会增大获取准确有用信息的难度

在企业推荐领域,一些场景中需要根据一个企业名称来获取与其相似的一个或者多个企业,这就需要根据互联网上的企业相关信息进行相应的推荐

现有的企业推荐的相关技术中,通常是根据互联网上的公开信息
(
企业社保人数

工商注册

招投标等信息
)
或人工录入的企业信息
(
财务报表

经营信息等
)
,来得到企业的特征信息,然后根据该特征信息基于推荐算法进行企业推荐

[0003]而由于企业隐私保护的需要,通过人工的方式准确获取并录入企业信息的成本极高,并且根据互联网上公开的企业数据得到企业的特征信息较为单一,无法全面反映企业特征,这也会影响企业推荐的准确性,也即传统的企业推荐技术仍存在着推荐准确性不高的技术问题


技术实现思路

[0004]针对上述传统方法中存在的问题,本专利技术提出了一种基于大数据的企业推荐方法

一种基于大数据的企业推荐装置

一种计算机设备和一种计算机可读存储介质,能够大幅提高企业推荐准确性

[0005]为了实现上述目的,本专利技术实施例采用以下技术方案:
[0006]一方面,提供一种基于大数据的企业推荐方法,包括步骤:
[0007]获取目标企业的名称对应的公开互联网数据并存入第一维度数组;
[0008]获取各官网上公布的各政策文件和各相关公示文件,解析各政策文件和各相关公示文件,得到公示的企业名单及各政策项目的申报条件数据后存入第二维度数组;
[0009]将第一维度数组和第二维度数组中的原始数据进行数据归一化处理,得到归一化后的低维特征向量并利用核函数映射到基于支持向量机的高维特征空间中;
[0010]在高维特征空间中,对低维特征向量对应的高维新数据进行中心化处理,计算中心化后的高维新数据与高维特征空间的支持向量的内积差;
[0011]将内积差为负的高维新数据对应的企业剔除,将内积差为正的高维新数据对应的企业确定为相似企业;
[0012]将各相似企业按照内积差从高到低的顺序进行排序处理,输出目标企业的相似企业推荐数据

[0013]在其中一个实施例中,公开互联网数据包括企业所属行业

成立年限

从业人数

纳税人资质

注册资金

实缴资本

企业性质

注册地址

软件著作权数量

商标数量

证书数量

作品著作权数量

技术专利数

专利技术授权数

外观设计数

专利技术公布数

上市类型维
度和招投标数据

[0014]在其中一个实施例中,数据归一化处理过程中采用的归一化方法包括最小

最大规范化
、Z

score
标准化

均值方差归一化

小数定标标准化或
Log
函数转换

[0015]在其中一个实施例中,核函数为
RBF
核函数

[0016]在其中一个实施例中,上述方法还包括步骤:
[0017]根据相似企业推荐数据利用协同过滤算法输出匹配目标企业的政策项目数据

[0018]在其中一个实施例中,上述方法还包括步骤:
[0019]根据目标企业的推介文案,分别生成匹配于相似企业推荐数据中各相似企业的推介文案

[0020]另一方面,还提供一种基于大数据的企业推荐装置,包括:
[0021]第一获取模块,用于获取目标企业的名称对应的公开互联网数据并存入第一维度数组;
[0022]第二获取模块,用于获取各官网上公布的各政策文件和各相关公示文件,解析各政策文件和各相关公示文件,得到公示的企业名单及各政策项目的申报条件数据后存入第二维度数组;
[0023]归一映射模块,用于将第一维度数组和第二维度数组中的原始数据进行数据归一化处理,得到归一化后的低维特征向量并利用核函数映射到基于支持向量机的高维特征空间中;
[0024]得分计算模块,用于在高维特征空间中,对低维特征向量对应的高维新数据进行中心化处理,计算中心化后的高维新数据与高维特征空间的支持向量的内积差;
[0025]企业确定模块,用于将内积差为负的高维新数据对应的企业剔除,将内积差为正的高维新数据对应的企业确定为相似企业;
[0026]推荐输出模块,用于将各相似企业按照内积差从高到低的顺序进行排序处理,输出目标企业的相似企业推荐数据

[0027]在其中一个实施例中,公开互联网数据包括企业所属行业

成立年限

从业人数

纳税人资质

注册资金

实缴资本

企业性质

注册地址

软件著作权数量

商标数量

证书数量

作品著作权数量

技术专利数

专利技术授权数

外观设计数

专利技术公布数

上市类型维度和招投标数据

[0028]又一方面,还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的基于大数据的企业推荐方法的步骤

[0029]再一方面,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的基于大数据的企业推荐方法的步骤

[0030]上述技术方案中的一个技术方案具有如下优点和有益效果:
[0031]上述基于大数据的企业推荐方法

装置

设备及介质,通过先获取目标企业的公开互联网数据后,再获取网上目标企业所属行业的各种政策文件和相关公示文件,进而解析出所属行业的各企业并组成企业名单,同时获取企业名单中各企业申报政策项目所满足的申报条件数据,然后对前述获取的所有原始数据进行数据归一化处理,形成低维特征向量数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于大数据的企业推荐方法,其特征在于,包括步骤:获取目标企业的名称对应的公开互联网数据并存入第一维度数组;获取各官网上公布的各政策文件和各相关公示文件,解析各所述政策文件和各所述相关公示文件,得到公示的企业名单及各政策项目的申报条件数据后存入第二维度数组;将所述第一维度数组和所述第二维度数组中的原始数据进行数据归一化处理,得到归一化后的低维特征向量并利用核函数映射到基于支持向量机的高维特征空间中;在所述高维特征空间中,对所述低维特征向量对应的高维新数据进行中心化处理,计算中心化后的所述高维新数据与所述高维特征空间的支持向量的内积差;将所述内积差为负的所述高维新数据对应的企业剔除,将所述内积差为正的所述高维新数据对应的企业确定为相似企业;将各所述相似企业按照所述内积差从高到低的顺序进行排序处理,输出所述目标企业的相似企业推荐数据
。2.
根据权利要求1所述的基于大数据的企业推荐方法,其特征在于,所述公开互联网数据包括企业所属行业

成立年限

从业人数

纳税人资质

注册资金

实缴资本

企业性质

注册地址

软件著作权数量

商标数量

证书数量

作品著作权数量

实用新型专利数

发明授权数

外观设计数

发明公布数

上市类型维度和招投标数据
。3.
根据权利要求1或2所述的基于大数据的企业推荐方法,其特征在于,数据归一化处理过程中采用的归一化方法包括最小

最大规范化
、Z

score
标准化

均值方差归一化

小数定标标准化或
Log
函数转换
。4.
根据权利要求3所述的基于大数据的企业推荐方法,其特征在于,所述核函数为
RBF
核函数
。5.
根据权利要求3所述的基于大数据的企业推荐方法,其特征在于,还包括步骤:根据所述相似企业推荐数据利用协同过滤算法输出匹配所述目标企业的政策项目数据
...

【专利技术属性】
技术研发人员:刘宪锋阳晓杨阿磊彭俊潘妮娜肖涛
申请(专利权)人:湖南省拾牛网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1