快递用户的行为分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35423736 阅读：12 留言：0更新日期：2022-11-03 11:25

本发明专利技术公开了一种快递用户的行为分析方法、装置、电子设备及存储介质，一方面，本发明专利技术基于Hbase数据库和kudu数据库，能够长期持久的存储海量的快递数据和快递业务画像，且能够实时响应对用户行为分析的查询请求，具有较高的可靠性，同时，还可以在业务量增加时快速扩容，具有良好的扩展性；另一方面，本发明专利技术能够基于用户的业务行为数据，来生成各个用户的快递业务画像，同时，在接收到行为分析请求时，可读取Hbase数据库的业务行为数据，并生成行为统计数据，由此，结合用户的快递业务画像，可实现用户快递行为的分析，得知用户的快递需求，从而能够为快递行业进行个性化服务提供数据支撑。撑。撑。

全部详细技术资料下载

【技术实现步骤摘要】
快递用户的行为分析方法、装置、电子设备及存储介质

[0001]本专利技术属于信息处理
，具体涉及一种快递用户的行为分析方法、装置、电子设备及存储介质。

技术介绍

[0002]智能快递柜、快递app以及各种快递服务网页是随着快递业务不断发展而新生的事物，其中，智能快递柜的功能主要是协助快递员收寄快递，面对的用户是广大的快递员和收件人，其作为24小时无人值守的快递暂存柜，通过物联卡与服务端交互，是物联网技术在现代物流行业中的应用；智能快递柜是电子商务末端物流最后一公里最有效的解决方法，其提高了快递员的派送效率，降低了派送成本，保障了用户的隐私和安全，逐步得到了人们的广泛认可和推广；而快递app和快递服务网页等线上快递工具，则是用于快递的线上查询，便于用户了解物流进度，同时，也可在线上进行快递业务的下单（如寄件），并结合各个快递公司的终端，来实现线上下单，快递员上门取件的服务，其提高了用户的体验，得到了人们的广泛使用。
[0003]智能快递柜、快递app以及各种快递服务网页作为快递的服务工具，伴随着海量用户的存取件和查询等行为，每天会产生巨大的数据量，而如何有效地对这些存取件行为进行存储、查询、分析是一个巨大的挑战；目前，传统的数据库虽然具有支持完整性约束、支持事务等优点，但是在海量数据面前无法进行长久存储，且不能满足对海量数据的高效率存储要求，同时，在各个服务工具使用过程中，仅是对数据进行存储，而未对存储的数据进行分析，不能得出每个用户的快递业务需求，从而无法为快递行业进行个性化服务提供数据支撑；因此，提供...

【技术保护点】

【技术特征摘要】
1.一种快递用户的行为分析方法，其特征在于，包括：获取各个用户在快递业务端进行业务操作时产生的业务行为数据，并将所述各个用户的业务行为数据存储至Hbase数据库；获取预设时间段内，各个用户的每条业务行为数据对应的快递订单数据，以作为各个用户的行为分析数据；对所述各个用户的行为分析数据进行关键信息提取处理，以基于提取的关键信息得到所述各个用户的快递业务数据；基于各个用户的快递业务数据，生成所述各个用户的快递业务标签；根据各个用户的快递业务标签，构建各个用户的快递业务画像，并将各个用户的快递业务画像存储至kudu数据库中；接收行为分析请求，以基于所述行为分析请求，在所述kudu数据库中，匹配出目标用户的快递业务画像，以及在所述Hbase数据库中，匹配出所述目标用户的业务行为数据，其中，所述目标用户为所述行为分析请求中待行为分析的用户；基于所述目标用户的业务行为数据，生成所述目标用户的行为统计数据；将所述目标用户的快递业务画像和行为统计数据进行可视化展示，以完成对所述目标用户的快递行为分析。2.如权利要求1所述的方法，其特征在于，对所述各个用户的行为分析数据进行关键信息提取处理，以基于提取的关键信息得到所述各个用户的快递业务数据，包括：对于所述各个用户的每条行为分析数据，对每条行为分析数据进行分词处理，得到各个用户的每条行为分析数据的分词集；计算各个用户的每个分词集中各个词语的重要度因子值，其中，任一词语的重要度因子值包括该任一词语的词频值、词长值以及词性值；基于各个用户的每个分词集中各个词语的重要度因子值，计算得到各个用户的每个分词集中各个词语的权重值；根据各个用户的每个分词集中各个词语的权重值，得到各个用户的每条行为分析数据对应的第一关键词集；基于各个用户的每条行为分析数据对应的第一关键词集，对各个用户的每条行为分析数据进行词语组合，得到各个用户的每条行为分析数据对应的第二关键词集；合并各个用户的每条行为分析数据对应的第一关键词集以及第二关键词集，得到各个用户的每条行为分析数据的实际关键词集；剔除各个用户的每个实际关键词集中的重复关键词，以基于每个实际关键词集中剩余的关键词，得到各个用户的快递业务数据。3.如权利要求2所述的方法，其特征在于，基于各个用户的每条行为分析数据对应的第一关键词集，对各个用户的每条行为分析数据进行词语组合，得到各个用户的每条行为分析数据对应的第二关键词集，包括：对于任一用户的任一行为分析数据，判断所述任一行为分析数据对应分词集中的第i个词语是否属于所述第一关键词集，其中，i从1开始；若是，判断第i
‑
1个词语是否满足第一预设条件，其中，所述第一预设条件为第i
‑
1个词语存在于所述任一行为分析数据对应的分词集中，且不属于所述第一关键词集；
若是，则依次合并所述第i
‑
1个词语与所述第i个词语，得到第一组合词，并判断所述第一组合词是否符合词语组合规则；若所述第一组合词符合词语组合规则，则将所述第一组合词作为第二候选关键词，且所述第二候选关键词的权重值为所述第i个词语的权重值；判断第i+1个词语是否满足第二预设条件，其中，所述第二预设条件为第i+1个词语存在于所述任一行为分析数据对应的分词集中，且属于所述第一关键词集；若满足所述第二预设条件，则依次合并所述第i个词语与所述第i+1个词语，得到第二组合词，并判断所述第二组合词是否符合所述词语组合规则；若所述第二组合词符合所述词语组合规则，则将所述第二组合词也作为第二候选关键词，且第二组合词对应的第二候选关键词的权重值为第i个词语与第i+1个词语的权重值之和；将i自加1，并重新判断第i个词语是否在所述第一关键词集中，以在i大于n时，得到第二候选关键词集，其中，n为所述任一行为分析数据对应分词集中词语的总个数；对所述第二候选关键词集进行关键词筛选，筛选出存在子集关系的第二候选关键词，并提取出作为子集的第二候选关键词；利用作为子集的第二候选关键词以及筛选后的第二候选关键词集，组成所述任一用户的任一行为分析数据的第二关键词集。4.如权利要求3所述的方法，其特征在于，若所述第i个词语不属于所述第一关键词集，则所述方法还包括：判断所述第i
‑
1个词语和所述第i+1个词语是否均属于所述第一关键词集，且均存在于任一行为分析数据对应的分词集中；若是，则依次合并第i
‑
1个词语、第i个词语以及第i+1个词语，得到第三组合词；判断所述第三组合词是否符合所述词语组合规则；若是，则将所述第三组合词也作为第二候选关键词，其中，第三组合词对应的第二候选关键词的权重值为第i
‑
1个词语与第i+1个词语的权重值之和；将i自加1，并重新判断第i个词语是否在...

【专利技术属性】
技术研发人员：王彪，张友平，
申请(专利权)人：南京云柜网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人