一种融合频繁项集的油田业务服务推荐方法技术

技术编号：20487676 阅读：29 留言：0更新日期：2019-03-02 20:13

本发明专利技术提供一种融合频繁项集的油田业务服务推荐方法。主要原理是：对油田业务服务数据进行预处理，将数据按用户进行组织；结合时间信息进行用户行为分析，挖掘用户的行为习惯或工作模式；传统推荐模型与关联规则算法相结合，对用户工作需求进行建模；将用户名输入模型获得推荐结果。本发明专利技术提供的方法能够有效考虑油田业务服务用户的工作需求，具有较好得准确率。

An Oilfield Business Service Recommendation Method Based on Frequent Item Set

The invention provides an oilfield business service recommendation method integrating frequent itemsets. The main principles are as follows: pre-processing the oilfield business service data, organizing the data according to users; analyzing the user's behavior with time information, mining the user's behavior habits or working patterns; combining the traditional recommendation model with association rule algorithm, modeling the user's work needs; and getting the recommendation results with the user name input model. The method provided by the invention can effectively consider the work needs of the service users of oil field business, and has good accuracy.

全部详细技术资料下载

【技术实现步骤摘要】
一种融合频繁项集的油田业务服务推荐方法
本专利技术属于推荐方法应用领域，特别是将其应用于油田企业业务服务的领域。
技术介绍
随着油田企业集成服务云平台的不断发展和完善，业务服务数量也不断增多。在油田企业集成服务云平台中每天都会产生大量的数据，使得信息过载问题日益严重。无论是业务服务的使用者在大量业务服务中定位最能满足自己当前需求的业务服务还是开发者在海量的行为数据发掘使用者的需求都面临巨大的挑战和困难。为了有效解决信息过载问题，关于推荐方法的技术迅速发展起来，为此国内外也进行了大量的研究。近年来，随着大数据时代的到来，推荐技术正向着传统方法和机器学习结合的方向发展。目前，各种新的推荐技术方法仍是各国的前沿研究方向。传统的推荐方法是基于用户历史评分数据建立推荐模型，计算用户对物品的喜爱程度，而在油田企业集成服务云平台中，用户对业务服务的评分数据不仅是反应用户喜爱度还有用户工作过程中的需求。若仅考虑用户的喜爱度则会使推荐的结果会具有一定的偏差，如果在传统推荐模型的基础上考虑用户工作需求的因素，推荐的准确率和用户满意度将会有很大提高。由于用户评分数据的稀疏性，即用户不可能对所有的油田业务服务进行评分。在缺少评分数据的情况下，现有常用的随机算法、众数法、平均法等评分补充方法都是根据其他极少的评分数据进行推算，这就导致最终的推荐效果不是十分理想。因此迫切需要一种在评分数据稀疏的情况下能够考虑工作需求对用户进行推荐的方法。针对传统推荐方法在油田业务服务上面临的问题，本专利技术提供一种新的融合频繁项集的油田业务服务推荐方法。本专利技术提供的方法以油田业务服务数据为基础，...

【技术保护点】
1.一种融合频繁项集的油田业务服务推荐方法，其特征在于，包括以下步骤：A.数据预处理利用Python的RE模块对油田业务服务的数据进行数据预处理；B.计算频繁项集根据Apirori算法原理，计算油田业务服务数据的频繁二项集及支持度，通过计算频繁二项集两项之间的时间间隔，结合时间信息定义赋值函数，赋予时间间隔小的油田业务服务较高的权值，时间间隔大的油田业务服务较小的权值，最终将权值进行累加得到频繁二项集的组合支持度，赋值函数和组合支持度计算公式如下：

【技术特征摘要】
1.一种融合频繁项集的油田业务服务推荐方法，其特征在于，包括以下步骤：A.数据预处理利用Python的RE模块对油田业务服务的数据进行数据预处理；B.计算频繁项集根据Apirori算法原理，计算油田业务服务数据的频繁二项集及支持度，通过计算频繁二项集两项之间的时间间隔，结合时间信息定义赋值函数，赋予时间间隔小的油田业务服务较高的权值，时间间隔大的油田业务服务较小的权值，最终将权值进行累加得到频繁二项集的组合支持度，赋值函数和组合支持度计算公式如下：SUP_time＝SUP(item)+F(公式2)公式1为赋值函数计算公式，其中F为赋值函数，F’为上一轮计算的赋值函数值，val为时间间隔的值，公式2为组合支持度计算公式，其中SUP_time为组合支持度，SUP(item)为频繁项集的支持度；C.推荐模型的建立采用传统的基于物品的协同过滤算法与频繁项集的组合支持度相结合的方式建立油田业务服务推荐模型，...

【专利技术属性】
技术研发人员：李克文，马祥博，刘文英，于明洋，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人