数据流分析方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24289665 阅读:38 留言:0更新日期:2020-05-26 20:03
本发明专利技术实施例公开了一种数据流分析方法、装置、计算机设备及存储介质,该方法包括下述步骤:获取用于表示用户会话信息的数据链,其中,所述数据链为多个;将所述数据链分别与预设的漏斗链进行比对得到所述数据链相对于所述漏斗链的完成度,其中,所述完成度用于表征所述数据链和所述漏斗链中比对一致且连续的最大数据单元的个数;针对所述漏斗链统计多个所述数据链中具有相同完成度的所述数据链的个数。通过上述方法将数据单元进行比对,不相关的数据不会发生相互交叉和干扰,排除了不相关数据的冗余计算,增强了相关数据的计算效率。此外,该方法还具有较强的数据处理稳定性、漏斗分析业务普适性。

Data flow analysis methods, devices, computer equipment and storage media

【技术实现步骤摘要】
数据流分析方法、装置、计算机设备及存储介质
本专利技术实施例涉及计算机应用
,尤其是一种数据流分析方法、装置、计算机设备及存储介质。
技术介绍
随着计算机技术的发展,涌现出越来越多的大数据处理方案。但是,现有的大数据流分析方案更多的依赖于对用户行为数据的分析,然而对于漏斗分析模型更加侧重于理论性分析,多数漏斗分析算法或者基于少量数据进行处理则缺乏大数据处理的场景考虑,此外,对于数据场景进行简化难以在互联网更多维度与漏斗链的场景下具有普适性的应用。目前,为了提高应用性和稳定性,一般会结合了第三方大数据处理软件的方案,但是该方案缺乏对更细粒度层面的处理,在效率、实效等方面仍需进一步优化,同时方案将漏斗分析的计算逻辑实现独立于漏斗分析的前后处理模块从而容易缺乏方案统筹性考虑,对整体效率又有负面影响。
技术实现思路
本专利技术实施例提供一种数据流分析方法、装置、计算机设备及存储介质。为解决上述技术问题,本专利技术创造的实施例采用的一个技术方案是:提供一种数据流分析方法,包括下述步骤:获取用于表示用户会话信息的数据链,其中,所述数据链为多个;将所述数据链分别与预设的漏斗链进行比对得到所述数据链相对于所述漏斗链的完成度,其中,所述完成度用于表征所述数据链和所述漏斗链中比对一致且连续的最大数据单元的个数;针对所述漏斗链统计多个所述数据链中具有相同完成度的所述数据链的个数。可选地,所述获取表示用户会话信息的数据链,包括下述步骤:提取多次所述用户会话信息产生的多个数据单元;将所述多个数据单元按照时间排序并打包得到所述数据链。可选地,所述将所述数据链分别与预设的多个漏斗链进行比对得到所述数据链相对于每个所述漏斗链的完成度,包括下述步骤:按照顺序将所述数据链中的多个数据单元按照顺序分别与所述预设的多个漏斗链中的数据单元进行比对;按照比对结果更新所述数据链相对于每个所述漏斗链的完成度。可选地,所述按照顺序将所述数据链中的多个数据单元分别与所述预设的漏斗链中的数据单元进行比对,包括下述步骤:从所述数据链中提取处于首位的数据单元;从所述漏斗链中提取处于首位的数据单元;将所述数据链中处于首位的数据单元与所述每个漏斗链中处于首位的数据单元进行比对,其中,所述数据链相对于所述漏斗链当前的完成度为0;则,所述按照比对结果更新所述数据链相对于每个所述漏斗链的完成度,具体为:当所述数据链与漏斗链中处于首位的数据单元比对一致时,更新当前的完成度为1。可选地,所述按照顺序将所述数据链中的多个数据单元按照顺序分别与所述预设的多个漏斗链中的数据单元进行比对,包括下述步骤:从所述数据链中提取处于m位的数据单元;从所述漏斗链中提取处于n位的数据单元;将所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元进行比对;则,所述按照比对结果更新所述数据链相对于每个所述漏斗链的完成度,包括下述步骤:当所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元不一致时,对比n与对比之前的完成度f的数值大小;当n的数值大于f数值时,将当前的完成度更新为n。可选地,所述方法还包括下述步骤:当所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元不一致时,将所述数据链中处于m位的数据单元与所述漏斗链中处于首位的数据单元进行比对。可选地,所述方法还包括下述步骤:当所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元一致时,将所述数据链中处于m+1位的数据单元与所述漏斗链中处于n+1位的数据单元进行比对,并更新当前的完成度为f+1。为解决上述技术问题,本专利技术实施例还提供一种数据流分析装置,包括:获取模块,用于获取用于表示用户会话信息的数据链,其中,所述数据链为多个;处理模块,用于将所述数据链分别与预设的漏斗链进行比对得到所述数据链相对于所述漏斗链的完成度,其中,所述完成度用于表征所述数据链和所述漏斗链中比对一致且连续的最大数据单元的个数;执行模块,用于针对所述漏斗链统计多个所述数据链中具有相同完成度的所述数据链的个数。可选地,所述获取模块包括:第一获取子模块,用于提取多次所述用户会话信息产生的多个数据单元;第一处理子模块,用于将所述多个数据单元按照时间排序并打包得到所述数据链。可选地,所述处理模块包括:第二处理子模块,用于按照顺序将所述数据链中的多个数据单元按照顺序分别与所述预设的多个漏斗链中的数据单元进行比对;第一执行子模块,用于按照比对结果更新所述数据链相对于每个所述漏斗链的完成度。可选地,所述处理模块包括:第二获取子模块,用于从所述数据链中提取处于首位的数据单元;第三获取子模块,用于从所述漏斗链中提取处于首位的数据单元;第三处理子模块,用于将所述数据链中处于首位的数据单元与所述每个漏斗链中处于首位的数据单元进行比对,其中,所述数据链相对于所述漏斗链当前的完成度为0;则,所述第一执行子模块包括:第二执行子模块,用于当所述数据链与漏斗链中处于首位的数据单元比对一致时,更新当前的完成度为1。可选地,所述处理模块包括:第四获取子模块,用于从所述数据链中提取处于m位的数据单元;第五获取子模块,用于从所述漏斗链中提取处于n位的数据单元;第四处理子模块,用于将所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元进行比对;则,所述执行模块包括:第五处理子模块,用于当所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元不一致时,对比n与对比之前的完成度f的数值大小;第三执行子模块,用于当n的数值大于f数值时,将当前的完成度更新为n。可选地,还包括:第四执行子模块,用于当所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元不一致时,将所述数据链中处于m位的数据单元与所述漏斗链中处于首位的数据单元进行比对。可选地,还包括:第五执行子模块,用于当所述数据链中处于m位的数据单元与所述漏斗链中处于n位的数据单元一致时,将所述数据链中处于m+1位的数据单元与所述漏斗链中处于n+1位的数据单元进行比对,并更新当前的完成度为f+1。为解决上述技术问题,本专利技术实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述数据流分析方法的步骤。为解决上述技术问题,本专利技术实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述数据流分析方法的步骤。本专利技术实施例的有益效果是:由于预设的漏斗链为线性排序,大数据处理是以业务数据为基本的处理单位,通过上述方法将数据单元进行比本文档来自技高网...

【技术保护点】
1.一种数据流分析方法,其特征在于,包括下述步骤:/n获取用于表示用户会话信息的数据链,其中,所述数据链为多个;/n将所述数据链分别与预设的漏斗链进行比对得到所述数据链相对于所述漏斗链的完成度,其中,所述完成度用于表征所述数据链和所述漏斗链中比对一致且连续的最大数据单元的个数;/n针对所述漏斗链统计多个所述数据链中具有相同完成度的所述数据链的个数。/n

【技术特征摘要】
1.一种数据流分析方法,其特征在于,包括下述步骤:
获取用于表示用户会话信息的数据链,其中,所述数据链为多个;
将所述数据链分别与预设的漏斗链进行比对得到所述数据链相对于所述漏斗链的完成度,其中,所述完成度用于表征所述数据链和所述漏斗链中比对一致且连续的最大数据单元的个数;
针对所述漏斗链统计多个所述数据链中具有相同完成度的所述数据链的个数。


2.根据权利要求1所述的数据流分析方法,其特征在于,所述获取表示用户会话信息的数据链,包括下述步骤:
提取多次所述用户会话信息产生的多个数据单元;
将所述多个数据单元按照时间排序并打包得到所述数据链。


3.根据权利要求1所述的数据流分析方法,其特征在于,所述将所述数据链分别与预设的多个漏斗链进行比对得到所述数据链相对于每个所述漏斗链的完成度,包括下述步骤:
按照顺序将所述数据链中的多个数据单元按照顺序分别与所述预设的多个漏斗链中的数据单元进行比对;
按照比对结果更新所述数据链相对于每个所述漏斗链的完成度。


4.根据权利要求3所述的数据流分析方法,其特征在于,所述按照顺序将所述数据链中的多个数据单元分别与所述预设的漏斗链中的数据单元进行比对,包括下述步骤:
从所述数据链中提取处于首位的数据单元;
从所述漏斗链中提取处于首位的数据单元;
将所述数据链中处于首位的数据单元与所述每个漏斗链中处于首位的数据单元进行比对,其中,所述数据链相对于所述漏斗链当前的完成度为0;
则,所述按照比对结果更新所述数据链相对于每个所述漏斗链的完成度,具体为:
当所述数据链与漏斗链中处于首位的数据单元比对一致时,更新当前的完成度为1。


5.根据权利要求3所述的数据分流方法,其特征在于,所述按照顺序将所述数据链中的多个数据单元按照顺序分别与所述预设的多个漏斗链中的数据单元进行比对,包括下述步骤:
从所述数据链中提取处于m位的数据单元;
从...

【专利技术属性】
技术研发人员:许尧温亮生蒋滨泽
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1