基于工业产品供需平台构建企业画像的方法、系统及介质技术方案

技术编号:27582678 阅读:14 留言:0更新日期:2021-03-09 22:40
本发明专利技术涉及企业画像技术领域,公开一种基于工业产品供需平台构建企业画像的方法,包括:获取数据,对获取的数据进行预处理后得到第一数据集并存储在关系型数据库中;调用所述关系型数据库,对数据进行二次处理得到第二数据集,利用专家规则和统计学方法从所述第二数据集中提取核心特征数据,根据所述核心特征数据初步建立第一企业画像标签;利用半监督方法建立标签预测模型,对企业经营状况进行预测获得企业经营状况标签;根据所述第一企业画像标签和企业经营状况标签,生成企业画像。本发明专利技术通过数据整合和基于半监督模型对企业数据进行深层次数据挖掘进而建立完善的企业画像,为工业产品供需平台的业务建设提供决策支撑。工业产品供需平台的业务建设提供决策支撑。工业产品供需平台的业务建设提供决策支撑。

【技术实现步骤摘要】
基于工业产品供需平台构建企业画像的方法、系统及介质


[0001]本专利技术属于企业画像
,具体涉及一种基于工业产品供需平台构建企业画像的方法、系统及介质。

技术介绍

[0002]近年来,随着工业互联网的发展,用户画像逐渐被应用到工业上来为用户服务。用户画像作为一种快速、精准分析用户行为模式、习惯等信息的数据分析工具,为工业上进行精准营销、内容推荐、提升用户体验奠定了基础。企业画像作为用户画像的一种,是指基于特定的场景,对企业的信息进行研究提取出企业的特征标签,以实现对企业的精准分析。例如在工业产品供需平台的应用中,需要对企业进行精准画像,才能为用户进行精准化的信息推荐。
[0003]现有技术中,工业产品供需平台的应用需要个人用户注册、关联企业的用户模式,企业用户的性质十分复杂;此外,工业供需平台的推荐系统效果受限于企业用户的经营状况、企业所在行业的整体市场环境以及企业商品情况等众多因素,数据结构复杂、涉及的内容繁多,现有的企业画像方法形式较为单一,无法进行深层的数据挖掘,进而无法为用户提供有价值的智能信息推荐。

技术实现思路

[0004]本专利技术的目的在于提供一种基于工业产品供需平台构建企业画像的方法、系统及介质,用以解决现有技术中的企业画像方法形式较为单一,无法进行深层的数据挖掘的技术问题。
[0005]为了实现上述目的,本专利技术采用以下的技术方案:
[0006]一种基于工业产品供需平台构建企业画像的方法,所述方法包括:
[0007]步骤1:从所述工业产品供需平台和第三方平台获取待画像企业的用户属性数据、用户行为数据、商品数据和企业工商数据,对获取的数据进行预处理后得到第一数据集,并将所述第一数据集存储在关系型数据库中;
[0008]步骤2:调用所述关系型数据库,对所述第一数据集中的数据进行二次处理得到第二数据集,利用专家规则和统计学方法从所述第二数据集中提取核心特征数据,根据所述核心特征数据初步建立用户属性标签、商品属性标签和用户行为标签;
[0009]步骤3:利用半监督方法从所述第二数据集中提取企业经营数据,建立标签预测模型,利用所述标签预测模型对企业经营状况进行预测,以获得企业经营状况标签;
[0010]步骤4:根据所述用户属性标签、产品属性标签、用户行为标签和企业经营状况标签,生成企业画像;其中,所述企业画像包括用户属性画像、商品属性画像、企业经营画像以及用户行为画像。
[0011]进一步的,所述用户属性数据包括企业信息数据、个人信息数据、企业属性数据和个人属性数据;所述商品数据包括需求数据和产品数据;所述用户行为数据包括企业行为
数据和个人行为数据。
[0012]进一步的,所述步骤1包括:
[0013]步骤1.1:从所述工业产品获取平台和第三方平台获取待画像企业的用户属性数据、用户行为数据、商品数据和企业工商数据;
[0014]步骤1.2:将所述用户属性数据、用户行为数据、商品数据和企业工商数据中的半结构化数据根据数据转化规则转化为结构化数据;
[0015]步骤1.3:遍历所有结构化数据,对所述结构化数据进行数据清洗以得到第一数据集,并将所述第一数据集以结构化数据形式存储在关系型数据库中。
[0016]进一步的,所述步骤1.3包括:
[0017]步骤1.31:遍历所有结构化数据,对所述结构化数据的数据状态进行初步评估;
[0018]步骤1.32:当评估结果为存在重要信息缺失、错误或重复时,将存在重要信息缺失、错误或重复部分的数据剔除;当评估结果为高质量数据时,将所述高质量数据加入到模糊匹配数据集中;当评估结果为存在次要信息缺失、错误或乱码时,根据所述模糊匹配数据集对所述次要信息缺失、错误或乱码的数据进行修正;
[0019]步骤1.33:将所有高质量数据以及经过所述模糊匹配数据集修正后的数据整合并作为第一数据集,然后以结构化形式存储在关系型数据库中。
[0020]进一步的,所述步骤2包括:
[0021]步骤2.1:调用所述关系型数据库,对所述第一数据集中的关联数据进行合并或转化处理后加入到所述第一数据集中以形成第二数据集;
[0022]步骤2.2:利用专家规则和统计学方法,从所述第二数据集中提取核心特征数据,并根据所述核心特征数据初步建立用户属性标签、商品属性标签和用户行为标签。
[0023]进一步的,所述步骤3包括:
[0024]步骤3.1:按照行业类别从所述第二数据集中分别随机选取一定比例的企业经营数据作为企业样本,并利用行业专家规则确定所述企业样本的数据特征权重和第一经营评分,并建立建立数据特征与评分矩阵,包括:
[0025][A
ij
,b
i
](a1,a2,a3,...,a
j
,b
i
);其中,A
ij
表示i企业的第j个特征数据,B
i
表示i 企业的专家评分;
[0026]步骤3.2:再次按照行业类别从所述第二数据集中的剩余企业中,随机选取一定比例的企业经营数据,并利用该企业经营数据与所述数据特征与评分矩阵,计算该企业经营数据与所述企业样本的海明距离,基于所述海明距离采用最近邻规则方法预测该企业对应的第二经营评分,利用专家规则对所述数据特征权重、第一经营评分以及第二经营评分分别进行调整,并基于调整后的数据特征权重、第一经营评分以及第二经营评分建立标签预测模型;
[0027]步骤3.3:利用所述标签预测模型,从所述第二数据集中提取新的企业经营数据,计算所述新的企业经营数据与所述标签预测模型的海明距离,并基于所述海明距离采用最近邻规则方法预测新企业的经营评分;
[0028]其中,海明距离的计算方式为:
[0029]D
gi
=∑w
j
×
(A
ij
*A
gj
);
ꢀꢀ
(1)
[0030]企业预测经营评分的计算方式为:
[0031][0032]其中,A

gj
(a
′1,a
′2,a
′3,...,a

j
)为g企业的j个特征,D
gi
为g企业与i企业的海明距离,w
j
离为专家定义的j权重;b
k
为基于海明距离的最邻近规则对企业预测的评分集合,M为综合评分值。
[0033]进一步的,所述基于海明距离采用最邻近规则预测企业的经营评分包括:
[0034]计算剩余新企业数据与所述标签预测模型的海明距离,并获取最小海明距离值;
[0035]根据所述最小海明距离值,确定备选的企业训练样本;
[0036]当所述备选企业训练样本中存在一家备选企业,将该备选企业的经营评分预测值赋予所述新企业;当所述备选样本中存在多家备选企业,则对多家备选企业的经营本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于工业产品供需平台构建企业画像的方法,其特征在于,所述方法包括:步骤1:从所述工业产品供需平台和第三方平台获取待画像企业的用户属性数据、用户行为数据、商品数据和企业工商数据,对获取的数据进行预处理后得到第一数据集,并将所述第一数据集存储在关系型数据库中;步骤2:调用所述关系型数据库,对所述第一数据集中的数据进行二次处理得到第二数据集,利用专家规则和统计学方法从所述第二数据集中提取核心特征数据,根据所述核心特征数据初步建立用户属性标签、商品属性标签和用户行为标签;步骤3:利用半监督方法从所述第二数据集中提取企业经营数据,建立标签预测模型,利用所述标签预测模型对企业经营状况进行预测,以获得企业经营状况标签;步骤4:根据所述用户属性标签、产品属性标签、用户行为标签和企业经营状况标签,生成企业画像;其中,所述企业画像包括用户属性画像、商品属性画像、企业经营画像以及用户行为画像。2.根据权利要求1所述的基于工业产品供需平台构建企业画像的方法,其特征在于,所述用户属性数据包括企业信息数据、个人信息数据、企业属性数据和个人属性数据;所述商品数据包括需求数据和产品数据;所述用户行为数据包括企业行为数据和个人行为数据。3.根据权利要求1所述的基于工业产品供需平台构建企业画像的方法,其特征在于,所述步骤1包括:步骤1.1:从所述工业产品获取平台和第三方平台获取待画像企业的用户属性数据、用户行为数据、商品数据和企业工商数据;步骤1.2:将所述用户属性数据、用户行为数据、商品数据和企业工商数据中的半结构化数据根据数据转化规则转化为结构化数据;步骤1.3:遍历所有结构化数据,对所述结构化数据进行数据清洗以得到第一数据集,并将所述第一数据集以结构化数据形式存储在关系型数据库中。4.根据权利要求3所述的基于工业产品供需平台构建企业画像的方法,其特征在于,所述步骤1.3包括:步骤1.31:遍历所有结构化数据,对所述结构化数据的数据状态进行初步评估;步骤1.32:当评估结果为存在重要信息缺失、错误或重复时,将存在重要信息缺失、错误或重复部分的数据剔除;当评估结果为高质量数据时,将所述高质量数据加入到模糊匹配数据集中;当评估结果为存在次要信息缺失、错误或乱码时,根据所述模糊匹配数据集对所述次要信息缺失、错误或乱码的数据进行修正;步骤1.33:将所有高质量数据以及经过所述模糊匹配数据集修正后的数据整合并作为第一数据集,然后以结构化形式存储在关系型数据库中。5.根据权利要求1所述的基于工业产品供需平台构建企业画像的方法,其特征在于,所述步骤2包括:步骤2.1:调用所述关系型数据库,对所述第一数据集中的关联数据进行合并或转化处理后加入到所述第一数据集中以形成第二数据集;步骤2.2:利用专家规则和统计学方法,从所述第二数据集中提取核心特征数据,并根据所述核心特征数据初步建立用户属性标签、商品属性标签和用户行为标签。6.根据权利要求1所述的基于工业产品供需平台构建企业画像的方法,其特征在于,所
述步骤3包括:步骤3.1:按照行业类别从所述第二数据集中分别随机选取一定比例的企业经营数据作为企业样本,并利用行业专家规则确定所述企业样本的数据特征权重和第一经营评分,并建立建立数据特征与评分矩阵,包括:[A
ij
,b
i
](a1,a2,a3,...,a
j
,b
i
);其中,A
ij
表示i企业的第j个特征数据,B
i
表示i企业的专家评分;步骤3.2:再次按照行业类别从所述第二数据集中的剩余企业中,随机选取一定比例的企业经营数据,并利用该企业经营数据与所述数据特征与评分矩...

【专利技术属性】
技术研发人员:朱芝孺马波涛樊妍睿范波何芝瑶
申请(专利权)人:成都航天科工大数据研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1