快递用户的行为分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35423736 阅读:12 留言:0更新日期:2022-11-03 11:25
本发明专利技术公开了一种快递用户的行为分析方法、装置、电子设备及存储介质,一方面,本发明专利技术基于Hbase数据库和kudu数据库,能够长期持久的存储海量的快递数据和快递业务画像,且能够实时响应对用户行为分析的查询请求,具有较高的可靠性,同时,还可以在业务量增加时快速扩容,具有良好的扩展性;另一方面,本发明专利技术能够基于用户的业务行为数据,来生成各个用户的快递业务画像,同时,在接收到行为分析请求时,可读取Hbase数据库的业务行为数据,并生成行为统计数据,由此,结合用户的快递业务画像,可实现用户快递行为的分析,得知用户的快递需求,从而能够为快递行业进行个性化服务提供数据支撑。撑。撑。

【技术实现步骤摘要】
快递用户的行为分析方法、装置、电子设备及存储介质


[0001]本专利技术属于信息处理
,具体涉及一种快递用户的行为分析方法、装置、电子设备及存储介质。

技术介绍

[0002]智能快递柜、快递app以及各种快递服务网页是随着快递业务不断发展而新生的事物,其中,智能快递柜的功能主要是协助快递员收寄快递,面对的用户是广大的快递员和收件人,其作为24小时无人值守的快递暂存柜,通过物联卡与服务端交互,是物联网技术在现代物流行业中的应用;智能快递柜是电子商务末端物流最后一公里最有效的解决方法,其提高了快递员的派送效率,降低了派送成本,保障了用户的隐私和安全,逐步得到了人们的广泛认可和推广;而快递app和快递服务网页等线上快递工具,则是用于快递的线上查询,便于用户了解物流进度,同时,也可在线上进行快递业务的下单(如寄件),并结合各个快递公司的终端,来实现线上下单,快递员上门取件的服务,其提高了用户的体验,得到了人们的广泛使用。
[0003]智能快递柜、快递app以及各种快递服务网页作为快递的服务工具,伴随着海量用户的存取件和查询等行为,每天会产生巨大的数据量,而如何有效地对这些存取件行为进行存储、查询、分析是一个巨大的挑战;目前,传统的数据库虽然具有支持完整性约束、支持事务等优点,但是在海量数据面前无法进行长久存储,且不能满足对海量数据的高效率存储要求,同时,在各个服务工具使用过程中,仅是对数据进行存储,而未对存储的数据进行分析,不能得出每个用户的快递业务需求,从而无法为快递行业进行个性化服务提供数据支撑;因此,提供一种可长久以及高效的快递数据存储,且能够进行数据分析的快递用户的行为分析方法迫在眉睫。

技术实现思路

[0004]本专利技术的目的是提供一种快递用户的行为分析方法、装置、电子设备及存储介质,以解决现有数据库无法进行快递数据长久且高效的存储,以及在应用中未进行数据分析,从而无法为快递行业进行个性化服务提供数据支撑的问题。
[0005]为了实现上述目的,本专利技术采用以下技术方案:第一方面,本专利技术提供了一种快递用户的行为分析识别方法,包括:获取各个用户在快递业务端进行业务操作时产生的业务行为数据,并将所述各个用户的业务行为数据存储至Hbase数据库;获取预设时间段内,各个用户的每条业务行为数据对应的快递订单数据,以作为各个用户的行为分析数据;对所述各个用户的行为分析数据进行关键信息提取处理,以基于提取的关键信息得到所述各个用户的快递业务数据;基于各个用户的快递业务数据,生成所述各个用户的快递业务标签;
根据各个用户的快递业务标签,构建各个用户的快递业务画像,并将各个用户的快递业务画像存储至kudu数据库中;接收行为分析请求,以基于所述行为分析请求,在所述kudu数据库中,匹配出目标用户的快递业务画像,以及在所述Hbase数据库中,匹配出所述目标用户的业务行为数据,其中,所述目标用户为所述行为分析请求中待行为分析的用户;基于所述目标用户的业务行为数据,生成所述目标用户的行为统计数据;将所述目标用户的快递业务画像和行为统计数据进行可视化展示,以完成对所述目标用户的快递行为分析。
[0006]基于上述公开的内容,本专利技术在用户操作快递业务端时,可实时获取每次操作产生的业务行为数据,并存储至Hbase数据库中,其中,Hbase数据库采用HDFS(分布式文件)实现数据的存储,其具有超强的扩展性和吞吐量,因此,其能够长时间存储海量数据,且在面临海量数据的增长时,也不会导致查询性能下降,由此,即可满足快递数据的高效存储要求。
[0007]同时,本专利技术基于用户的业务行为数据来获取对应的快递订单数据,将其作为各个用户的行为分析数据,并进行关键信息的提取,接着,即可基于提取的关键信息得到各个用户的快递业务数据,并基于快递业务数据来生成快递业务标签,以便利用快递业务标签构建出各个用户的快递业务画像,最后,在接收到快递运维人员发送的行为分析请求后,即可从Hbase数据库中查询相应用户的业务行为数据,并进行数据统计,得到该用户的行为统计数据,以及在kudu数据库中查询该用户的快递业务画像,查询完毕后,即可将行为统计数据以及快递业务画像展示给运维人员,而运维人员则可基于展示的数据得知该用户的快递需求,从而实现个性化服务。
[0008]另外,本专利技术使用kudu数据库存储分析得到的各个用户的快递业务画像,其中,kudu数据库能够支持分区查看,具有高扩容性,支持更新操作以及sql语句查询操作,因此,可满足海量的快递业务画像的存储需求,且在分析时,能够进行快速读取。
[0009]通过上述设计,一方面,本专利技术基于Hbase数据库和kudu数据库,能够长期持久的存储海量的快递数据和快递业务画像,且能够实时响应对用户行为分析的查询请求,具有较高的可靠性,同时,还可以在业务量增加时快速扩容,具有良好的扩展性;另一方面,本专利技术能够基于用户的业务行为数据,来生成各个用户的快递业务画像,同时,在接收到行为分析请求时,可读取Hbase数据库的业务行为数据,并生成行为统计数据,由此,结合用户的快递业务画像,可实现用户快递行为的分析,得知用户的快递需求,从而能够为快递行业进行个性化服务提供数据支撑。
[0010]在一个可能的设计中,对所述各个用户的行为分析数据进行关键信息提取处理,以基于提取的关键信息得到所述各个用户的快递业务数据,包括:对于所述各个用户的每条行为分析数据,对每条行为分析数据进行分词处理,得到各个用户的每条行为分析数据的分词集;计算各个用户的每个分词集中各个词语的重要度因子值,其中,任一词语的重要度因子值包括该任一词语的词频值、词长值以及词性值;基于各个用户的每个分词集中各个词语的重要度因子值,计算得到各个用户的每个分词集中各个词语的权重值;
根据各个用户的每个分词集中各个词语的权重值,得到各个用户的每条行为分析数据对应的第一关键词集;基于各个用户的每条行为分析数据对应的第一关键词集,对各个用户的每条行为分析数据进行词语组合,得到各个用户的每条行为分析数据对应的第二关键词集;合并各个用户的每条行为分析数据对应的第一关键词集以及第二关键词集,得到各个用户的每条行为分析数据的实际关键词集;剔除各个用户的每个实际关键词集中的重复关键词,以基于每个实际关键词集中剩余的关键词,得到各个用户的快递业务数据。
[0011]基于上述公开的内容,本专利技术公开了关键信息提取的具体过程,即对于任一行为分析数据,先对其进行分词处理,得到任一行为分析数据的分词集,然后计算分词集中各个词语的词频值、词长值以及词性值,并利用前述计算出的各个参数来得出各个词语的权重值,由此,基于权重值,即可得出任一行为分析数据的第一关键词集,同时,为避免分词导致出现非完整的词串,本专利技术还设置有词语组合步骤,也就是基于第一关键词集,对分词集中的各个词语进行组合,得到第二关键词集,最后,合并第一关键词集以及第二关键词集,并删除重复的关键词,即可最终得到任一行为分析数据的关键词,以此方法,来对各个用户的每条行为分析数据进行关键词的提取,而基于最终的关键词,即可得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种快递用户的行为分析方法,其特征在于,包括:获取各个用户在快递业务端进行业务操作时产生的业务行为数据,并将所述各个用户的业务行为数据存储至Hbase数据库;获取预设时间段内,各个用户的每条业务行为数据对应的快递订单数据,以作为各个用户的行为分析数据;对所述各个用户的行为分析数据进行关键信息提取处理,以基于提取的关键信息得到所述各个用户的快递业务数据;基于各个用户的快递业务数据,生成所述各个用户的快递业务标签;根据各个用户的快递业务标签,构建各个用户的快递业务画像,并将各个用户的快递业务画像存储至kudu数据库中;接收行为分析请求,以基于所述行为分析请求,在所述kudu数据库中,匹配出目标用户的快递业务画像,以及在所述Hbase数据库中,匹配出所述目标用户的业务行为数据,其中,所述目标用户为所述行为分析请求中待行为分析的用户;基于所述目标用户的业务行为数据,生成所述目标用户的行为统计数据;将所述目标用户的快递业务画像和行为统计数据进行可视化展示,以完成对所述目标用户的快递行为分析。2.如权利要求1所述的方法,其特征在于,对所述各个用户的行为分析数据进行关键信息提取处理,以基于提取的关键信息得到所述各个用户的快递业务数据,包括:对于所述各个用户的每条行为分析数据,对每条行为分析数据进行分词处理,得到各个用户的每条行为分析数据的分词集;计算各个用户的每个分词集中各个词语的重要度因子值,其中,任一词语的重要度因子值包括该任一词语的词频值、词长值以及词性值;基于各个用户的每个分词集中各个词语的重要度因子值,计算得到各个用户的每个分词集中各个词语的权重值;根据各个用户的每个分词集中各个词语的权重值,得到各个用户的每条行为分析数据对应的第一关键词集;基于各个用户的每条行为分析数据对应的第一关键词集,对各个用户的每条行为分析数据进行词语组合,得到各个用户的每条行为分析数据对应的第二关键词集;合并各个用户的每条行为分析数据对应的第一关键词集以及第二关键词集,得到各个用户的每条行为分析数据的实际关键词集;剔除各个用户的每个实际关键词集中的重复关键词,以基于每个实际关键词集中剩余的关键词,得到各个用户的快递业务数据。3.如权利要求2所述的方法,其特征在于,基于各个用户的每条行为分析数据对应的第一关键词集,对各个用户的每条行为分析数据进行词语组合,得到各个用户的每条行为分析数据对应的第二关键词集,包括:对于任一用户的任一行为分析数据,判断所述任一行为分析数据对应分词集中的第i个词语是否属于所述第一关键词集,其中,i从1开始;若是,判断第i

1个词语是否满足第一预设条件,其中,所述第一预设条件为第i

1个词语存在于所述任一行为分析数据对应的分词集中,且不属于所述第一关键词集;
若是,则依次合并所述第i

1个词语与所述第i个词语,得到第一组合词,并判断所述第一组合词是否符合词语组合规则;若所述第一组合词符合词语组合规则,则将所述第一组合词作为第二候选关键词,且所述第二候选关键词的权重值为所述第i个词语的权重值;判断第i+1个词语是否满足第二预设条件,其中,所述第二预设条件为第i+1个词语存在于所述任一行为分析数据对应的分词集中,且属于所述第一关键词集;若满足所述第二预设条件,则依次合并所述第i个词语与所述第i+1个词语,得到第二组合词,并判断所述第二组合词是否符合所述词语组合规则;若所述第二组合词符合所述词语组合规则,则将所述第二组合词也作为第二候选关键词,且第二组合词对应的第二候选关键词的权重值为第i个词语与第i+1个词语的权重值之和;将i自加1,并重新判断第i个词语是否在所述第一关键词集中,以在i大于n时,得到第二候选关键词集,其中,n为所述任一行为分析数据对应分词集中词语的总个数;对所述第二候选关键词集进行关键词筛选,筛选出存在子集关系的第二候选关键词,并提取出作为子集的第二候选关键词;利用作为子集的第二候选关键词以及筛选后的第二候选关键词集,组成所述任一用户的任一行为分析数据的第二关键词集。4.如权利要求3所述的方法,其特征在于,若所述第i个词语不属于所述第一关键词集,则所述方法还包括:判断所述第i

1个词语和所述第i+1个词语是否均属于所述第一关键词集,且均存在于任一行为分析数据对应的分词集中;若是,则依次合并第i

1个词语、第i个词语以及第i+1个词语,得到第三组合词;判断所述第三组合词是否符合所述词语组合规则;若是,则将所述第三组合词也作为第二候选关键词,其中,第三组合词对应的第二候选关键词的权重值为第i

1个词语与第i+1个词语的权重值之和;将i自加1,并重新判断第i个词语是否在...

【专利技术属性】
技术研发人员:王彪张友平
申请(专利权)人:南京云柜网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1