【技术实现步骤摘要】
基于大数据的企业推荐方法、装置、设备及介质
[0001]本专利技术属于大数据处理
,涉及一种基于大数据的企业推荐方法
、
装置
、
设备及介质
。
技术介绍
[0002]随着互联网技术的发展,在互联网上的信息呈指数级增长,这无疑会增大获取准确有用信息的难度
。
在企业推荐领域,一些场景中需要根据一个企业名称来获取与其相似的一个或者多个企业,这就需要根据互联网上的企业相关信息进行相应的推荐
。
现有的企业推荐的相关技术中,通常是根据互联网上的公开信息
(
企业社保人数
、
工商注册
、
招投标等信息
)
或人工录入的企业信息
(
财务报表
、
经营信息等
)
,来得到企业的特征信息,然后根据该特征信息基于推荐算法进行企业推荐
。
[0003]而由于企业隐私保护的需要,通过人工的方式准确获取并录入企业信息的成本极高,并且根据互联网上公开的企业数据得到企业的特征信息较为单一,无法全面反映企业特征,这也会影响企业推荐的准确性,也即传统的企业推荐技术仍存在着推荐准确性不高的技术问题
。
技术实现思路
[0004]针对上述传统方法中存在的问题,本专利技术提出了一种基于大数据的企业推荐方法
、
一种基于大数据的企业推荐装置
、
一种计算机设备和一种计算机可读存储介质,能够大 ...
【技术保护点】
【技术特征摘要】
1.
一种基于大数据的企业推荐方法,其特征在于,包括步骤:获取目标企业的名称对应的公开互联网数据并存入第一维度数组;获取各官网上公布的各政策文件和各相关公示文件,解析各所述政策文件和各所述相关公示文件,得到公示的企业名单及各政策项目的申报条件数据后存入第二维度数组;将所述第一维度数组和所述第二维度数组中的原始数据进行数据归一化处理,得到归一化后的低维特征向量并利用核函数映射到基于支持向量机的高维特征空间中;在所述高维特征空间中,对所述低维特征向量对应的高维新数据进行中心化处理,计算中心化后的所述高维新数据与所述高维特征空间的支持向量的内积差;将所述内积差为负的所述高维新数据对应的企业剔除,将所述内积差为正的所述高维新数据对应的企业确定为相似企业;将各所述相似企业按照所述内积差从高到低的顺序进行排序处理,输出所述目标企业的相似企业推荐数据
。2.
根据权利要求1所述的基于大数据的企业推荐方法,其特征在于,所述公开互联网数据包括企业所属行业
、
成立年限
、
从业人数
、
纳税人资质
、
注册资金
、
实缴资本
、
企业性质
、
注册地址
、
软件著作权数量
、
商标数量
、
证书数量
、
作品著作权数量
、
实用新型专利数
、
发明授权数
、
外观设计数
、
发明公布数
、
上市类型维度和招投标数据
。3.
根据权利要求1或2所述的基于大数据的企业推荐方法,其特征在于,数据归一化处理过程中采用的归一化方法包括最小
‑
最大规范化
、Z
‑
score
标准化
、
均值方差归一化
、
小数定标标准化或
Log
函数转换
。4.
根据权利要求3所述的基于大数据的企业推荐方法,其特征在于,所述核函数为
RBF
核函数
。5.
根据权利要求3所述的基于大数据的企业推荐方法,其特征在于,还包括步骤:根据所述相似企业推荐数据利用协同过滤算法输出匹配所述目标企业的政策项目数据
...
【专利技术属性】
技术研发人员:刘宪锋,阳晓,杨阿磊,彭俊,潘妮娜,肖涛,
申请(专利权)人:湖南省拾牛网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。