一种融合频繁项集的油田业务服务推荐方法技术

技术编号:20487676 阅读:29 留言:0更新日期:2019-03-02 20:13
本发明专利技术提供一种融合频繁项集的油田业务服务推荐方法。主要原理是:对油田业务服务数据进行预处理,将数据按用户进行组织;结合时间信息进行用户行为分析,挖掘用户的行为习惯或工作模式;传统推荐模型与关联规则算法相结合,对用户工作需求进行建模;将用户名输入模型获得推荐结果。本发明专利技术提供的方法能够有效考虑油田业务服务用户的工作需求,具有较好得准确率。

An Oilfield Business Service Recommendation Method Based on Frequent Item Set

The invention provides an oilfield business service recommendation method integrating frequent itemsets. The main principles are as follows: pre-processing the oilfield business service data, organizing the data according to users; analyzing the user's behavior with time information, mining the user's behavior habits or working patterns; combining the traditional recommendation model with association rule algorithm, modeling the user's work needs; and getting the recommendation results with the user name input model. The method provided by the invention can effectively consider the work needs of the service users of oil field business, and has good accuracy.

【技术实现步骤摘要】
一种融合频繁项集的油田业务服务推荐方法
本专利技术属于推荐方法应用领域,特别是将其应用于油田企业业务服务的领域。
技术介绍
随着油田企业集成服务云平台的不断发展和完善,业务服务数量也不断增多。在油田企业集成服务云平台中每天都会产生大量的数据,使得信息过载问题日益严重。无论是业务服务的使用者在大量业务服务中定位最能满足自己当前需求的业务服务还是开发者在海量的行为数据发掘使用者的需求都面临巨大的挑战和困难。为了有效解决信息过载问题,关于推荐方法的技术迅速发展起来,为此国内外也进行了大量的研究。近年来,随着大数据时代的到来,推荐技术正向着传统方法和机器学习结合的方向发展。目前,各种新的推荐技术方法仍是各国的前沿研究方向。传统的推荐方法是基于用户历史评分数据建立推荐模型,计算用户对物品的喜爱程度,而在油田企业集成服务云平台中,用户对业务服务的评分数据不仅是反应用户喜爱度还有用户工作过程中的需求。若仅考虑用户的喜爱度则会使推荐的结果会具有一定的偏差,如果在传统推荐模型的基础上考虑用户工作需求的因素,推荐的准确率和用户满意度将会有很大提高。由于用户评分数据的稀疏性,即用户不可能对所有的油田业务服务进行评分。在缺少评分数据的情况下,现有常用的随机算法、众数法、平均法等评分补充方法都是根据其他极少的评分数据进行推算,这就导致最终的推荐效果不是十分理想。因此迫切需要一种在评分数据稀疏的情况下能够考虑工作需求对用户进行推荐的方法。针对传统推荐方法在油田业务服务上面临的问题,本专利技术提供一种新的融合频繁项集的油田业务服务推荐方法。本专利技术提供的方法以油田业务服务数据为基础,通过用户行为分析,能有效挖掘用户的行为习惯或工作模式,将用户工作模式与传统推荐技术相结合,使推荐方法具有较高的准确率,从而有助于能提高用户的工作效率,提高用户对云平台的满意度。
技术实现思路
由于用户工作需求对推荐结果的影响,采用传统常规的推荐模型存在推荐效果不理想的情况,本专利技术从传统推荐模型与关联规则算法相结合的角度出发,提供一种融合频繁项集的油田业务服务推荐方法,结合时间信息对用户的工作需求进行建模,能有效提高推荐的准确率和用户的满意度。由于用户评分数据稀疏,采用传统算法在少量的评分数据下计算存在推荐结果不准确的问题,结合时间信息进行用户行为分析能有效挖掘用户的工作模式并为生成虚拟评分数据提供依据,因此本专利技术结合时间信息进行用户行为轨迹挖掘,从而能较好的解决用户评分数据稀疏的问题。融合频繁项集的油田业务服务推荐方法主要包括以下几个步骤:A.数据预处理利用Python的RE模块对油田业务服务的数据进行数据预处理;B.计算频繁二项集根据Apirori算法原理,计算油田业务服务数据的频繁二项集及支持度,通过计算频繁二项集两项之间的时间间隔,结合时间信息定义赋值函数,赋予时间间隔小的两个业务服务赋予较高的权值,时间间隔大的两个业务服务赋予较小的权值,最终将权值进行累加得到频繁二项集的组合支持度,公式如下:SUP_time=SUP(item)+F(公式2)公式1为赋分函数计算公式,其中F为赋值函数,F’为上一轮计算的赋值函数值,val为时间间隔的值,公式2为组合支持度计算公式,其中SUP_time为组合支持度,SUP(item)为频繁项集的支持度;C.推荐模型的建立采用传统的基于物品的协同过滤算法与频繁项集的组合支持度相结合的方式建立油田业务服务推荐模型。用户对油田业务服务的评分不仅是反应用户喜爱度还有工作过程中的需求,若直接采用传统的推荐算法基于用户的评分来计算用户的喜爱度则忽略了用户的工作需求部分。根据余弦相似度计算油田业务服务之间的余弦相似性,定义评分函数结合时间信息计算油田业务服务之间的相似性,由需求度计算公式计算用户对油田业务服务的需求度,输出需求度最高的三个服务,运算公式如下:公式3是余弦相似度的计算公式,其中|N(i)|表示使用过油田业务服务i的用户数,|N(j)|表示使用过油田业务服务j的用户数,|N(i)|∩|N(j)|表示同时使用过油田业务服务i和j的用户数量,公式4是评分函数,其中wji表示油田业务服务之间的相似度,k表示权重参数,SUP_time表示组合支持度,freq表示频繁项集;D.实际检测获得油田业务服务数据,输入融合频繁项集的油田业务服务推荐方法中,推荐算法的输出即为用户的推荐结果。附图说明图1是本专利技术的模型结构图具体实施方式下面结合附图说明本专利技术的实施方式。图1是本专利技术的融合频繁项集的油田业务服务推荐方法的模型结构图,本专利技术的推荐方法分为三个阶段,具体包括:A.数据预处理利用Python的RE模块对油田业务服务数据进行处理,提取油田业务服务数据中的用户id、业务服务id、时间戳、评分数据等属性数据,并照用户id进行组织,存储在二维列表中;B.模型训练第一步:根据Apriori原理对油田业务服务数据进行频繁项集挖掘,计算频繁项集中每一项的时间间隔,定义赋值函数将时间间隔参数化,赋予时间间隔小的业务服务较大的权值,时间间隔大的业务服务较小的权值,再将出现的频繁项集的权值与支持度进行累加得到组合支持度。赋值函数和组合支持度计算公式如下:SUP_time=SUP(item)+w3(val)其中W3为赋值函数,W3’为上一轮计算的赋值函数值,val为时间间隔的值,SUP_time为组合支持度,SUP(item)为频繁项集的支持度。第二步:根据余弦相似度计算公式计算油田业务服务之间的相似度,定义评分函数,将余弦相似度与组合支持度输入评分函数,评分函数的输出作为基于物品的协同过滤算法的相似度输入,逐个计算用户对油田业务服务的需求度。余弦相似度计算公式和评分函数公式如下:其中k表示权重参数,当k依次取0.01-0.2时,计算出k的取值为0.05时效果最佳,wji表示油田业务服务之间的相似度,SUP_time表示组合支持度,freq表示频繁项集,|N(i)|表示使用过油田业务服务i的用户数,|N(j)|表示使用过油田业务服务j的用户数,|N(i)|∩|N(j)|表示同时使用过油田业务服务i和j的用户数量;C.存储及实际检测根据用户对油田业务服务的需求度,记录每个用户需求度最高的三个业务服务,并写入文件中,对待推荐的用户进行推荐,将用户名输入模型中,模型的输出即为推荐结果。本文档来自技高网
...

【技术保护点】
1.一种融合频繁项集的油田业务服务推荐方法,其特征在于,包括以下步骤:A.数据预处理利用Python的RE模块对油田业务服务的数据进行数据预处理;B.计算频繁项集根据Apirori算法原理,计算油田业务服务数据的频繁二项集及支持度,通过计算频繁二项集两项之间的时间间隔,结合时间信息定义赋值函数,赋予时间间隔小的油田业务服务较高的权值,时间间隔大的油田业务服务较小的权值,最终将权值进行累加得到频繁二项集的组合支持度,赋值函数和组合支持度计算公式如下:

【技术特征摘要】
1.一种融合频繁项集的油田业务服务推荐方法,其特征在于,包括以下步骤:A.数据预处理利用Python的RE模块对油田业务服务的数据进行数据预处理;B.计算频繁项集根据Apirori算法原理,计算油田业务服务数据的频繁二项集及支持度,通过计算频繁二项集两项之间的时间间隔,结合时间信息定义赋值函数,赋予时间间隔小的油田业务服务较高的权值,时间间隔大的油田业务服务较小的权值,最终将权值进行累加得到频繁二项集的组合支持度,赋值函数和组合支持度计算公式如下:SUP_time=SUP(item)+F(公式2)公式1为赋值函数计算公式,其中F为赋值函数,F’为上一轮计算的赋值函数值,val为时间间隔的值,公式2为组合支持度计算公式,其中SUP_time为组合支持度,SUP(item)为频繁项集的支持度;C.推荐模型的建立采用传统的基于物品的协同过滤算法与频繁项集的组合支持度相结合的方式建立油田业务服务推荐模型,...

【专利技术属性】
技术研发人员:李克文马祥博刘文英于明洋
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1