一种基于贝叶斯分类算法的用户行为分析方法技术

技术编号:19965145 阅读:24 留言:0更新日期:2019-01-03 13:17
本发明专利技术公开了一种基于贝叶斯分类算法的用户行为分析方法,包括以下步骤:S1采集用户操作记录;S2分析用户操作记录,计算各个用户操作的发生概率以及各个用户操作间的条件概率,以训练用于根据当前用户操作判断用户的下一操作的贝叶斯分类器;S3向贝叶斯分类器所述输入一用户当前操作判断用户的下一操作;S4以所述用户的下一操作用户当前操作,重复步骤S3,直至用户下一操作为指定结束操作,得到用户行为序列。具有发挥了大量数据样本的优势,提高分析准确性和分析效率的技术效果。

A User Behavior Analysis Method Based on Bayesian Classification

The invention discloses a user behavior analysis method based on Bayesian classification algorithm, which includes the following steps: S1 collects user operation records; S2 analyses user operation records, calculates the occurrence probability of each user operation and the conditional probability of each user operation, so as to train Bayesian classifier for judging user's next operation according to current user operation; and S3 directs Bayesian classifier for judging user's next operation according to current user operation. The classifier inputs a user's current operation to determine the user's next operation; S4 repeats the user's current operation with the user's next operation until the user's next operation is a designated end operation and obtains the user's behavior sequence. It has brought into play the advantages of a large number of data samples and improved the accuracy and efficiency of analysis.

【技术实现步骤摘要】
一种基于贝叶斯分类算法的用户行为分析方法
本专利技术涉及数据分析
,具体涉及一种基于贝叶斯分类算法的用户行为分析方法
技术介绍
当今的服务业非常重视服务流程的优化,其中常会利用到用户行为分析的结果作为优化的依据。传统做用户行为分析多数靠人工进行分析,效率低下,在用户行为数据量较小的时候,尚能满足需求,但同时也带来了结果不够精确的问题;然而随着我国电子商务的发展,越来越多的用户采取通过网页、手机APP等便捷形式接受服务,这其行为数据也更容易被获取和记录,这就使得用户行为数据的来源以及数据量都得以海量增加,而人工分析的方式根本无法很好的利用好大量数据样本,现亟需可以充分发挥大量数据样本的优势,提高分析效率和分析准确性的用户行为分析方法。
技术实现思路
本专利技术意在提供一种用户行为分析方法,发挥大量数据样本的优势,提高分析效率和分析准确性。本专利技术中的基于贝叶斯分类算法的用户行为分析方法,包括以下内容:S1采集用户操作记录;S2分析用户操作记录,计算各个用户操作的发生概率以及各个用户操作间的条件概率,以训练用于根据当前用户操作判断用户的下一操作的贝叶斯分类器;S3向贝叶斯分类器所述输入一用户当前操作判断用户的下一操作;S4以所述用户的下一操作为用户当前操作,重复步骤S3,直至用户下一操作为指定结束操作,得到用户行为序列。通过本方法,以已知的用户操作行为作为样本,可以计算出每个用户操作的发生概率和条件概率,这两类概率是贝叶斯分类器用于预测用户下一操作的基础,本专利中的“训练”即通过对所有样本的概率计算最终得到贝叶斯分类器,该分类器可以在得知当前概率的情况下计算出接下来可能发生的所有操作的概率,而概率最高者则作为分类器的预测输出,利用训练好的分类器,可以输入一个起始的用户操作,预测出其下一操作,再以该下一操作作为当前操作进行预测,以此类推,当预测出的下一操作是一个可以视为结束的操作时,停止预测,如此便可以得到一个完整的用户行为序列,采取不同的起点和终点,可以得到多条用户行为序列,用于帮助如服务流程优化等依赖于用户行为预测的工作。本专利技术通过训练贝叶斯分类器发挥大量数据样本的优势,提高分析准确性,可以通过计算机系统智能的执行,算法简单易行,减少了人工介入,从而提高了分析效率。进一步,步骤S1中,通过应用性能管理系统调取用户使用应用程序时所调取的接口,以表征用户操作记录。应用性能管理(APM)系统,对线上运行的应用进行了全方位的监控,特别是记录了用户每次操作所调用的接口,每一接口在应用程序中则对应有特定的操作功能,于是通过识别调用的结果就可以得知用户进行了何种操作,是一种方便易行的且高效的获取用户操作记录的方法。进一步,步骤S2中,通过分析同一组别的数据中的所述用户操作记录,得到用户操作行为队列,并以该队列中的操作及该操作的下一操作计算用户操作概率。本方法需要采集用户连续的多个操作才可更为准确的训练分类器,而用户连续的多个接口调用在APM系统中会通过同一个组别(Groupid)来标识,应此通过组别来获取用户操作行为队列比较可靠,有利于分类器的训练。进一步,所述贝叶斯算法采用高斯贝叶斯算法。高斯贝叶斯算法,也称贝叶斯算法的高斯表示,对于连续概率值的预测更为准确,适合于本专利技术的应用场景。进一步,所述用户操作行为队列通过MYSQL,HADOOP,HIVE,REDIS中的一种或多种数据库进行存储。APM系统通常会使用自己的数据库形式往往采用ES等非关联关系类的数据库,将其转存为MYSQL,HADOOP,HIVE,REDIS中的一种或多种关联关系类数据库,方便数据调取的计算。进一步,在S2中还包括,去掉预先定义为无效的用户操作记录。用户的一些异常操作往往也会被采集下来,例如登录后即可离开等,此类操作有碍于概率的准确计算,在进行概率计算前将其去掉,得到的分类器更为准确。进一步,还包括,持续采集用户操作记录,并用扩充后的用户操作记录更新贝叶斯分类器的步骤。随着数据量的增加,预测概率更为准确。附图说明图1为本专利技术实施例中的基于贝叶斯分类算法的用户行为分析方法的流程示意图。具体实施方式下面通过具体实施方式进一步详细说明:实施例基本如附图1所示:首先通过应用性能管理系统调取用户使用应用程序时所调取的接口,以表征用户操作记录。应用性能管理(APM)系统,对线上运行的应用进行了全方位的监控,特别是记录了用户每次操作所调用的接口,每一接口在应用程序中则对应有特定的操作功能,于是通过识别调用的结果就可以得知用户进行了何种操作,是一种方便易行的且高效的获取用户操作记录的方法。用户操作记录从APM系统的ES数据库中被抽出,通过分析同一组别的数据中的所述用户操作记录,得到用户操作行为队列。本实施例需要采集用户连续的多个操作才可更为准确的训练分类器,而用户连续的多个接口调用在APM系统中会通过同一个组别(Groupid)来标识,应此通过组别来获取用户操作行为队列比较可靠,有利于分类器的训练。得到所有的用户操作行为队列后,首先去掉预先定义为无效的用户操作记录。用户的一些异常操作往往也会被采集下来,例如登录后即可离开等,此类操作有碍于概率的准确计算,在进行概率计算前将其去掉,得到的分类器更为准确。经处理后的用户操作行为队列被转换为关联型数据格式存放在关联型数据库,可采用MYSQL,HADOOP,HIVE,REDIS中的一种或多种数据库;通过这些已知的操作作为样本,计算各个用户操作的发生概率以及各个用户操作间的条件概率,这两类概率是贝叶斯分类器用于预测用户下一操作的基础,通过对所有样本的概率计算最终得到贝叶斯分类器,该分类器可以在得知当前概率的情况下计算出接下来可能发生的所有操作的概率,而概率最高者则作为分类器的预测输出。本实施里中的贝叶斯算法采用高斯贝叶斯算法。高斯贝叶斯算法,也称贝叶斯算法的高斯表示,对于连续概率值的预测更为准确,适合于本专利技术的应用场景。需要进行预测时,向训练好的贝叶斯分类器输入一用户当前操作,以判断用户的下一操作;然后以所述用户的下一操作用户当前操作,重复步骤S3,直至用户下一操作为指定结束操作,得到用户的行为序列。通过本方法,以已知的用户行为作为样本,计算出可以每个用户操作的发生概率和条件概率,这两类概率是贝叶斯分类器用于预测用户下一操作的基础,通过对所有样本的概率计算最终得到贝叶斯分类器,该分类器可以在得知当前概率的情况下计算出接下来可能发生的所有操作的概率,而概率最高者则作为分类器的预测输出,利用训练好的分类器,可以输入一个起始的用户操作,预测出其下一操作,再以该下一操作作为当前操作进行预测,以此类推,当预测出的下一操作是一个可以视为结束的操作时,停止预测,如此便可以得到一个完整的用户行为序列,采取不同的起点和终点,可以得到多条用户行为序列,用于帮助如服务流程优化等依赖于用户行为预测的工作。例如,以一个手机银行APP为例,以用户“登录”操作为起点,预测下一操作为“我的账户”,再下一个为“转账”,再下一个操作为“退出”,而“退出”是本次于此事先指定的终点操作,于是得到了一个行为序列“登录”→查看“我的账户”→“转账”→“退出”,如同前文所述,这些操作是根据其调用的特定接口被界定出来的。随着应用程序的不断被使用,还需持续采集用本文档来自技高网...

【技术保护点】
1.一种基于贝叶斯分类算法的用户行为分析方法,其特征在于:包括以下步骤:S1采集用户操作记录;S2分析用户操作记录,计算各个用户操作的发生概率以及各个用户操作间的条件概率,以训练用于根据当前用户操作判断用户的下一操作的贝叶斯分类器;S3向贝叶斯分类器所述输入一用户当前操作判断用户的下一操作;S4以所述用户的下一操作用户当前操作,重复步骤S3,直至用户下一操作为指定结束操作,得到用户行为序列。

【技术特征摘要】
1.一种基于贝叶斯分类算法的用户行为分析方法,其特征在于:包括以下步骤:S1采集用户操作记录;S2分析用户操作记录,计算各个用户操作的发生概率以及各个用户操作间的条件概率,以训练用于根据当前用户操作判断用户的下一操作的贝叶斯分类器;S3向贝叶斯分类器所述输入一用户当前操作判断用户的下一操作;S4以所述用户的下一操作用户当前操作,重复步骤S3,直至用户下一操作为指定结束操作,得到用户行为序列。2.根据权利要求1所述的基于贝叶斯分类算法的用户行为分析方法,其特征在于:步骤S1中,通过应用性能管理系统调取用户使用应用程序时所调取的接口,以表征用户操作记录。3.根据权利要求2所述的基于贝叶斯分类算法的用户行为分析方法,其特征在于:步骤S2中,通过...

【专利技术属性】
技术研发人员:杨斌
申请(专利权)人:重庆富民银行股份有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1