平台画像的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:27819745 阅读:19 留言:0更新日期:2021-03-30 10:32
本发明专利技术涉及大数据技术领域,公开了一种平台画像的生成方法、装置、设备及存储介质,用于将平台画像系统与快递行业各软件系统相结合,提升了数据互联和匹配的速度。平台画像的生成方法包括:接收终端发送的初始数据,初始数据包括终端采集得到的平台数据;调用预置的日志分析器对初始数据进行分析,得到分析数据;调用预置的特征提取器对分析数据进行提取,生成特征数据;根据预置的标签规则库,确定特征数据对应的标签,得到目标数据,预置的标签规则库为平台专有特征标签库;调用预置的平台画像生成器对目标数据进行解析,生成多维度平台画像,并将多维度平台画像发送至终端。并将多维度平台画像发送至终端。并将多维度平台画像发送至终端。

【技术实现步骤摘要】
平台画像的生成方法、装置、设备及存储介质


[0001]本专利技术涉及大数据
,尤其涉及一种平台画像的生成方法、装置、设备及存储介质。

技术介绍

[0002]电商是现代化物流与信息发展的产物,我国的快递行业早已和电商形成了密不可分的关系。电商平台作为快递行业和电商行业非常重要的一个角色,连接采购、供应、销售和存储各供应链环节,连接人货场,连接人财物。电商平台画像根据与平台相关的平台信息、平台特色、平台活力和平台客群,构建出标签化的模型,并进而获取平台、卖家、消费者和商品全貌信息。
[0003]由于电商行业的迅速发展以及行业的需求,对快递行业的要求在不断提升。在保障用户数据安全的情况下,鼓励电商平台与快递公司进行数据互联和共享,有利于促进电商行业的发展及提升物流配送的效率。
[0004]在现有的技术中,快递行业仍处于根据各个电商平台被动对接系统的阶段,电商平台和快递公司之间不能实现数据互联,导致采购、供应、销售和存储各环节运转效率和服务质量低下。

技术实现思路

[0005]本专利技术提供了一种平台画像的生成方法,用于将平台画像系统与快递行业各软件系统相结合,提升了数据互联和匹配的速度,提高了采购、供应、销售和存储各环节的运转效率。
[0006]本专利技术第一方面提供了一种平台画像的生成方法,包括:接收终端发送的初始数据,所述初始数据包括所述终端采集得到的平台数据;调用预置的日志分析器对所述初始数据进行分析,得到分析数据,所述分析数据为结构化的数据;调用预置的特征提取器对所述分析数据进行提取,生成特征数据,所述特征数据为经过降维处理后得到的数据;根据预置的标签规则库,确定所述特征数据对应的标签,得到目标数据,所述预置的标签规则库为平台专有特征标签库;调用预置的平台画像生成器对所述目标数据进行解析,生成多维度平台画像,并将所述多维度平台画像发送至所述终端。
[0007]可选的,在本专利技术第一方面的第一种实现方式中,所述调用预置的平台画像生成器对所述目标数据进行解析,生成多维度平台画像,并将所述多维度平台画像发送至所述终端包括:调用预置的平台画像生成器读取所述目标数据;基于预置的平台画像生成器,将所述目标数据输入决策树模型中,得到画像数据;基于所述画像数据生成多维度平台画像,所述多维度平台画像包括平台信息维度、平台特色维度、平台活力维度和平台客群维度;将所述多维度平台画像发送至所述终端。
[0008]可选的,在本专利技术第一方面的第二种实现方式中,所述基于预置的平台画像生成器,将所述目标数据输入决策树模型中,得到画像数据包括:从根结点开始,对所述根结点
计算所述目标数据的特征信息增益,选择信息增益最大的特征作为结点特征;基于所述结点特征建立子结点,将所述子结点按照递归的方式划分,生成决策树模型;对所述决策树模型进行剪枝处理,得到剪枝后的决策树模型;将所述目标数据输入所述剪枝后的决策树模型,得到画像数据。
[0009]可选的,在本专利技术第一方面的第三种实现方式中,所述基于所述画像数据生成多维度平台画像,所述多维度平台画像包括平台信息维度、平台特色维度、平台活力维度和平台客群维度包括:将所述画像数据按照四个维度进行划分,得到四个维度数据集,所述四个维度包括平台信息、平台特色、平台活力和平台客群,其中,所述平台信息包括基本信息、运营模式、平台用语和支付方式,所述平台特色包括盈利模式、平台类型、平台服务和仓配情况,所述平台活力包括用户、会员、卖家、商品和平台活动,所述平台客群包括客群定位、客群分布和客群统计;基于所述四个维度数据集生成多维度平台画像。
[0010]可选的,在本专利技术第一方面的第四种实现方式中,所述调用预置的日志分析器对所述初始数据进行分析,得到分析数据,所述分析数据为结构化的数据包括:调用预置的日志分析器读取所述初始数据;对所述初始数据进行特征字符分析和数据过滤处理,得到结构化的分析数据;将所述分析数据传输到预置的消息队列。
[0011]可选的,在本专利技术第一方面的第五种实现方式中,所述调用预置的特征提取器对所述分析数据进行提取,生成特征数据,所述特征数据为经过降维处理后得到的数据包括:调用预置的特征提取器,读取所述分析数据;对所述分析数据进行归一化处理,得到标准数据;基于预置的主成分分析PCA算法对所述标准数据进行降维处理,得到特征数据。
[0012]可选的,在本专利技术第一方面的第六种实现方式中,所述根据预置的标签规则库,确定所述特征数据对应的标签,得到目标数据,所述预置的标签规则库为平台专有特征标签库包括:从预置的标签规则库获取预置的标签,所述预置的标签规则库为平台专有特征标签库;按照预置的标签匹配规则,将所述特征数据与所述预置的标签进行匹配,确定所述特征数据对应的标签;对所述特征数据对应的标签中的敏感信息进行脱敏处理,得到目标数据。
[0013]本专利技术第二方面提供了一种平台画像的生成装置,包括:接收模块,用于接收终端发送的初始数据,所述初始数据包括所述终端采集得到的平台数据;分析模块,用于调用预置的日志分析器对所述初始数据进行分析,得到分析数据,所述分析数据为结构化的数据;提取模块,调用预置的特征提取器对所述分析数据进行提取,生成特征数据,所述特征数据为经过降维处理后得到的数据;确定模块,根据预置的标签规则库,确定所述特征数据对应的标签,得到目标数据,所述预置的标签规则库为平台专有特征标签库;解析模块,用于调用预置的平台画像生成器对所述目标数据进行解析,生成多维度平台画像,并将所述多维度平台画像发送至所述终端。
[0014]可选的,在本专利技术第二方面的第一种实现方式中,所述解析模块包括:第一读取单元,用于调用预置的平台画像生成器读取所述目标数据;输入单元,用于基于预置的平台画像生成器,将所述目标数据输入决策树模型中,得到画像数据;生成单元,用于基于所述画像数据生成多维度平台画像,所述多维度平台画像包括平台信息维度、平台特色维度、平台活力维度和平台客群维度;发送单元,用于将所述多维度平台画像发送至所述终端。
[0015]可选的,在本专利技术第二方面的第二种实现方式中,所述输入单元具体用于:从根结
点开始,对所述根结点计算所述目标数据的特征信息增益,选择信息增益最大的特征作为结点特征;基于所述结点特征建立子结点,将所述子结点按照递归的方式划分,生成决策树模型;对所述决策树模型进行剪枝处理,得到剪枝后的决策树模型;将所述目标数据输入所述剪枝后的决策树模型,得到画像数据。
[0016]可选的,在本专利技术第二方面的第三种实现方式中,所述生成单元具体用于:将所述画像数据按照预置的四个维度进行划分,得到四个维度数据集,所述预置的四个维度包括平台信息、平台特色、平台活力和平台客群,其中,所述平台信息包括基本信息、运营模式、平台用语和支付方式,所述平台特色包括盈利模式、平台类型、平台服务和仓配情况,所述平台活力包括用户、会员、卖家、商品和平台活动,所述平台客群包括客群定位、客群分布和客群统计;基于所述四个维度数据集生成多维度平台画像。
[0017]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种平台画像的生成方法,其特征在于,包括:接收终端发送的初始数据,所述初始数据包括所述终端采集得到的平台数据;调用预置的日志分析器对所述初始数据进行分析,得到分析数据,所述分析数据为结构化的数据;调用预置的特征提取器对所述分析数据进行提取,生成特征数据,所述特征数据为经过降维处理后得到的数据;根据预置的标签规则库,确定所述特征数据对应的标签,得到目标数据,所述预置的标签规则库为平台专有特征标签库;调用预置的平台画像生成器对所述目标数据进行解析,生成多维度平台画像,并将所述多维度平台画像发送至所述终端。2.根据权利要求1所述的平台画像的生成方法,其特征在于,所述调用预置的平台画像生成器对所述目标数据进行解析,生成多维度平台画像,并将所述多维度平台画像发送至所述终端包括:调用预置的平台画像生成器读取所述目标数据;基于预置的平台画像生成器,将所述目标数据输入决策树模型中,得到画像数据;基于所述画像数据生成多维度平台画像,所述多维度平台画像包括平台信息维度、平台特色维度、平台活力维度和平台客群维度;将所述多维度平台画像发送至所述终端。3.根据权利要求2所述的平台画像的生成方法,其特征在于,所述基于预置的平台画像生成器,将所述目标数据输入决策树模型中,得到画像数据包括:从根结点开始,对所述根结点计算所述目标数据的特征信息增益,选择信息增益最大的特征作为结点特征;基于所述结点特征建立子结点,将所述子结点按照递归的方式划分,生成决策树模型;对所述决策树模型进行剪枝处理,得到剪枝后的决策树模型;将所述目标数据输入所述剪枝后的决策树模型,得到画像数据。4.根据权利要求2所述的平台画像的生成方法,其特征在于,所述基于所述画像数据生成多维度平台画像,所述多维度平台画像包括平台信息维度、平台特色维度、平台活力维度和平台客群维度包括:将所述画像数据按照预置的四个维度进行划分,得到四个维度数据集,所述预置的四个维度包括平台信息、平台特色、平台活力和平台客群,其中,所述平台信息包括基本信息、运营模式、平台用语和支付方式,所述平台特色包括盈利模式、平台类型、平台服务和仓配情况,所述平台活力包括用户、会员、卖家、商品和平台活动,所述平台客群包括客群定位、客群分布和客群统计;基于所述四个维度数据集生成多维度平台画像。5.根据权利要求1所述的平台画像的生成方法,其特征在于...

【专利技术属性】
技术研发人员:陈玉芬夏扬李培吉
申请(专利权)人:上海东普信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1