当前位置: 首页 > 专利查询>济南大学专利>正文

基于邻近海量数据快速分析的电信套餐优化系统与方法技术方案

技术编号:10053956 阅读:254 留言:0更新日期:2014-05-16 02:40
本发明专利技术公开了基于邻近海量数据快速分析的电信套餐优化系统与方法,系统包括参数输入模块,参数输入模块将参数信息分别传输给数据生成模块和套餐优化模块,数据生成模块将数据传输给套餐优化模块,参数输入模块和数据生成模块均从客户信息数据库中提取数据;套餐优化模块用于根据参考历史数据、目标历史数据以及参数设置进行套餐优化;所述进化算法模块用于根据适应值不断产生新的可行套餐并对套餐进行优化;所述套餐适应值评估模块采用基于邻近数据的快速分析法,用于评价每一款可行套餐的好坏;所述相似度计算模块用于度量两个向量之间的向量相似度。本发明专利技术能够实现对海量电信数据的自动化高速处理,得到与目标用户群体需求高度匹配的套餐方案。

【技术实现步骤摘要】
基于邻近海量数据快速分析的电信套餐优化系统与方法
本专利技术涉及电信技术以及数据挖掘领域,具体的讲,涉及基于邻近海量数据快速分析的电信套餐优化系统与方法。
技术介绍
电信行业在国民经济中占有重要地位,并且渗透到人们生活的方方面面。一方面,电信运营商在推出新业务套餐时,不同的用户群体具有不同的需求,导致用户需求的多样性和复杂性。另一方面,由于电信运营商的高渗透率以及信息交换与采集的高频繁度,其拥有的数据量极为庞大。电信运营商拥有海量的用户数据、信令数据、日志数据、流量数据、位置数据等。因此,急需一种自动化的优化设计技术,使得可以根据已有的海量数据,针对目标用户群生成具有针对性的可靠的套餐组合。然而,由于电信数据的数据量庞大、数据关系复杂、数据属性多样化,数据之间的隐含关系难以通过常规技术发现。此外,海量数据带来的严重弊端是,其建模与仿真的时间复杂度较高,运算时间很长,在有限的时间内难以得到令人满意的结果。目前基于复杂算法的建模方法因其高时间复杂度,难以被直接应用到套餐优化;而人工分析法、基于线性回归法与指数平滑法等简单模型得到的结果则与用户群体需求的匹配度不高。因此,需要解决的问题是如何对海量电信数据进行快速分析处理,才能最短的时间内实现套餐的优化设计,并得到与目标用户群体需求高度匹配的可靠的套餐方案。
技术实现思路
本专利技术的目的就是为了解决上述问题,提供一种基于邻近海量数据快速分析的电信套餐优化系统与方法,它具有能够实现对海量电信数据的自动化高速处理,得到与目标用户群体需求高度匹配的套餐方案,避免因采用复杂模型来建模海量数据所引起的高时间复杂度难题,并提高优化结果的可靠性优点。为了实现上述目的,本专利技术采用如下技术方案:基于邻近海量数据快速分析的电信套餐优化系统,包括参数输入模块,所述参数输入模块将参数信息分别传输给数据生成模块和套餐优化模块,所述数据生成模块将数据传输给套餐优化模块,所述参数输入模块和数据生成模块均从数据库中提取数据;所述参数输入模块用于接收、存储及传输使用者输入的参数;所述数据生成模块用于生成进行套餐优化所必需的参考历史数据和目标历史数据;所述套餐优化模块用于根据参考历史数据、目标历史数据以及参数设置进行套餐优化;所述套餐优化模块包括彼此通信的进化算法模块和套餐适应值评估模块,所述套餐适应值评估模块内包括相似度计算模块;所述进化算法模块用于根据适应值不断产生新的可行套餐并对套餐进行优化;所述套餐适应值评估模块用于评价每一款可行套餐的好坏;所述套餐适应值评估模块采用基于邻近数据的快速分析法,通过向量相似度测量筛选参考用户来预测目标用户接收可行套餐的概率,从而实现对用户套餐选择概率的快速分析;所述相似度计算模块用于度量两个向量之间的向量相似度。所述参数输入模块包括目标用户选择模块、数据参数输入模块和算法参数输入模块;所述目标用户选择模块用于接收、存储及传输系统使用者从数据库中选择的代表性目标用户;所述数据参数输入模块,用于接受、存储及传输系统使用者设置的时间长度及数据大小;所述算法参数输入模块,用于接受、存储及传输系统使用者设置的进化算法参数及套餐。所述数据生成模块包括参考历史数据生成模块、目标历史数据生成模块和特征向量提取模块。所述参考历史数据生成模块用于接收参数输入模块传输来的参数,生成并传输参考历史数据。所述目标历史数据生成模块用于接收参数输入模块传输来的参数,生成并传输目标历史数据。所述特征向量提取模块,接收参考历史数据生成模块和目标历史数据生成模块的数据,用于从客户信息数据库中提取特征向量。所述参数输入模块允许是计算机、手机、平板电脑和掌上上网设备。所述数据库中存储有用户数据信息、套餐数据信息。基于邻近海量数据快速分析的电信套餐优化系统的工作方法,包括如下步骤:步骤(1):通过输入设备输入数据参数和算法参数,根据目标用户群体选定代表性目标用户、设定套餐的搜索范围、设定时间长度、设定参考数据大小、设定进化算法的计算参数;所述输入设备包括计算机、手机、平板电脑和掌上上网设备;步骤(2):根据步骤(1)中选定的代表性目标用户,计算机以应用时间点之前设定时间长度内的用户数据及其对应的套餐数据形成原始目标数据;计算机进一步针对原始目标数据,提取每个用户特征向量,形成目标历史数据;步骤(3):根据步骤(1)中设定的参考数据大小,计算机随机地从整个数据库范围内提取距离应用时间点之前设定时间长度内的用户数据及其对应的套餐数据作为参考,形成原始参考数据;计算机进一步针对原始参考数据,提取每个用户特征向量,形成参考历史数据;步骤(4):第一步,计算机首先对进化算法的种群进行初始化;第二步,对当前种群中的所有个体执行适应值评估来评价每一款可行套餐的好坏,其中采用相似度测量发现邻近数据来预测用户接收可行套餐的概率并据此进一步计算可行套餐的适应值;第三步,基于得到的适应值,根据进化算法中的种群更新策略对种群进行更新;第四步,返回第二步继续执行,直到寻找到一款使得适应值针对目标用户群体达到最大值的套餐方案。所述步骤(1)所提及的套餐搜索范围包括套餐配置中各个项的期望范围、及套餐资费的期望范围。所述步骤(2)和步骤(3)所提及的用户特征向量均由用户月度通信习惯、用户月度消费、用户所用套餐配置、用户所用套餐资费组成;所述用户月度通信习惯是用户按月统计的特征,包括用户月均通话时长、用户月均短信数目、用户月均上网流量;所述用户所用套餐配置特征为套餐中包含的各个项的配置情况,包括月通话时长、月短信数目、月上网流量。所述步骤(2)和步骤(3)的各特征向量在提取时需进行标准化。所述步骤(1)和步骤(4)的进化算法包括进化计算家族的各种优化算法,包括遗传算法、粒子群算法、分布式估计算法等。所述步骤(4)包括如下步骤:步骤A1:随机初始化进化算法的种群,种群中每一个体对应一个可行套餐;步骤A2:计算每一个可行套餐的适应值;步骤A3:根据当前采用的进化算法中的种群更新策略重新生成新的可行套餐种群;步骤A4:若满足结束条件则退出并输出最优套餐方案;否则返回步骤A2;所述步骤A2包括如下步骤:步骤B1:针对每一个目标用户,执行下述步骤:B1.1:计算参考数据中通信习惯、月度消费形成的向量和该目标用户的通信习惯、月度消费形成的向量之间的向量相似度;筛选出相似度优于设定阈值的参考用户记录,并记录下筛选后的参考用户的记录数M;B1.2:计算筛选后数据中所有所用套餐配置、所用套餐资费形成的向量与当前可行套餐的套餐配置、套餐资费形成的向量之间的向量相似度;从M条记录范围中筛选出相似度优于设定阈值的参考用户记录,记录筛选后的记录数N;B1.3:计算N/M作为该目标用户使用该可行套餐的概率P。步骤B2:汇总每个目标用户使用该可行套餐的概率。将每个目标用户使用该款套餐的概率乘以每个目标用户的月均花费C,然后针对所有目标用户进行求和,得到并返回该可行套餐的适应值。设目标用户数为TDN,则适应值计算公式如下:其中,Pi代表第i个目标用户选择该可行套餐的概率,Ci代表第i个目标用户的月均花费,TDN代表目标用户数,Fitness代表适应值。所述步骤B1.1和B1.2中所提及的向量相似度包括各种向量相似度的测量方法:向量距离、Jaccard系数、本文档来自技高网...
基于邻近海量数据快速分析的电信套餐优化系统与方法

【技术保护点】

【技术特征摘要】
1.基于邻近海量数据快速分析的电信套餐优化系统,其特征是,包括参数输入模块,所述参数输入模块将参数信息分别传输给数据生成模块和套餐优化模块,所述数据生成模块将数据传输给套餐优化模块,所述参数输入模块和数据生成模块均从数据库中提取数据;所述参数输入模块用于接收、存储及传输用户输入的参数;所述数据生成模块用于生成进行套餐优化所必需的参考历史数据和目标历史数据;所述套餐优化模块用于根据参考历史数据、目标历史数据以及参数设置进行套餐优化;所述套餐优化模块包括彼此通信的进化算法模块和套餐适应值评估模块,所述套餐适应值评估模块内包括相似度计算模块;所述进化算法模块用于根据适应值不断产生新的可行套餐并对套餐进行优化;所述套餐适应值评估模块用于评价每一款可行套餐的好坏;所述套餐适应值评估模块通过以下步骤实现适应值的计算及根据适应值进行套餐选取:步骤A1:随机初始化进化算法的种群,种群中每一个体对应一个可行套餐;步骤A2:计算每一个可行套餐的适应值;步骤A3:根据当前采用的进化算法中的种群更新策略重新生成新的可行套餐种群;步骤A4:若满足结束条件则退出并输出最优套餐方案;否则返回步骤A2;所述步骤A2包括如下步骤:步骤B1:针对每一个目标用户,执行下述步骤:B1.1:计算参考数据中通信习惯、月度消费形成的向量和该目标用户的通信习惯、月度消费形成的向量之间的向量相似度;筛选出相似度优于设定阈值的参考用户记录,并记录下筛选后的参考用户的记录数M;B1.2:计算筛选后数据中所有所用套餐配置、所用套餐资费形成的向量与当前可行套餐的套餐配置、套餐资费形成的向量之间的向量相似度;从M条记录范围中筛选出相似度优于设定阈值的参考用户记录,记录筛选后的记录数N;B1.3:计算N/M作为该目标用户使用该可行套餐的概率P;步骤B2:汇总每个目标用户使用该可行套餐的概率;将每个目标用户使用该可行套餐的概率乘以每个目标用户的月均花费C,然后针对所有目标用户进行求和,得到并返回该可行套餐的适应值;设目标用户数为TDN,则适应值计算公式如下:其中,Pi代表第i个目标用户选择该可行套餐的概率,Ci代表第i个目标用户的月均花费,TDN代表目标用户数,Fitness代表适应值;所述相似度计算模块用于度量两个向量之间的向量相似度;所述步骤B1.1和B1.2中所提及的向量相似度包括各种向量相似度的测量方法:向量距离、Jaccard系数、余弦相似度。2.如权利要求1所述的基于邻近海量数据快速分析的电信套餐优化系统,其特征是,所述参数输入模块包括目标用户选择模块、数据参数输入模块和算法参数输入模块;所述目标用户选择模块用于接收、存储及传输系统使用者从数据库中选择的代表性目标用户;所述数据参数输入模块,用于接受、存储及传输系统使用者设置的时间长度及数据大小;所述算法参数输入模块,用于接受、存储及传输系统使...

【专利技术属性】
技术研发人员:王琳杨波
申请(专利权)人:济南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1