用户满意度的分析方法及装置制造方法及图纸

技术编号:18446002 阅读:22 留言:0更新日期:2018-07-14 10:49
本发明专利技术公开了一种用户满意度的分析方法及装置。该用户满意度的分析方法包括:融合BSS域及OSS域的数据,获取用于预测用户满意度的指标数据;对指标数据进行清洗及标记;基于清洗及标记后的所述指标数据,通过改进的随机森林算法,预测用户满意度。本发明专利技术对OSS域、BSS域进行融合分析,提高数据多样性形成多维数据,对多维指标数据进行改进的平衡随机森林算法进行分析,能有效的提高对用户满意度预测的准确率、查全率、查准率。

Analysis method and device of user satisfaction

The invention discloses an analysis method and device for user satisfaction. The analysis methods of the user satisfaction include: combining the data of the BSS domain and the OSS domain to obtain the index data to predict the user satisfaction; cleaning and marking the index data; based on the index data after the cleaning and marking, the improved random forest algorithm is used to predict the user satisfaction. The invention combines the OSS domain and the BSS domain, improves the data diversity to form multidimensional data, and analyzes the balanced random forest algorithm to improve the multidimensional index data. It can effectively improve the accuracy, recall and precision of the user satisfaction prediction.

【技术实现步骤摘要】
用户满意度的分析方法及装置
本专利技术涉及信息技术及数据业务
,尤其涉及一种用户满意度的分析方法及装置。
技术介绍
顾客满意度体现着企业的价值,无论是在战略层面还是在战术层面对企业的市场营销都有非常重要的指导意义,对顾客满意度的调查并将调查的结果与产品/服务属性相联系,已成为市场驱动质量方法的一种工具。另一方面,随着信息技术的发展,电信商庞大的数据库中积累了海量信息,如何将数据挖掘技术运用于经营、管理和决策的各个方面,从海量数据中获取有效信息能对企业进行启发性的指导。因此,如何有效精准评测用户满意度、利用数据挖掘手段对海量数据进行关联分析是通讯行业的迫切需求。目前通信运营商常用的用户满意度分析模型有四分图方法、层次分析法、决策树、随机森林等方法,其中绝大部分都是通过抽取运营支撑系统(Operationsupportsystem,OSS)域或业务支撑系统(Businesssupportsystem,BSS)域关键信息进行简单加权分析,并没有通过数据挖掘等技术手段对用户满意度、OSS域、BSS域信息进行关联关系的分析;而现有的决策树用户满意度分析方法容易造成过拟合的现象,不能较好的适用于普遍场景;现有的随机森林算法对于不平衡数据,优化内容更偏向大类样本,易使得预测结果有偏差。
技术实现思路
本专利技术实施例提供了一种用户满意度的分析方法及装置,能够解决现有技术中如何有效精准评测用户满意度、利用数据挖掘手段对海量数据进行关联分析的问题。一方面,本专利技术实施例提供了一种用户满意度的分析方法,包括:融合业务支撑系统BSS域及运营支撑系统OSS域的数据,获取用于预测用户满意度的指标数据;对指标数据进行清洗及标记;基于清洗及标记后的所述指标数据,通过改进的随机森林算法,预测用户满意度。在一个示例实施例中,对指标数据进行清洗及标记,具体包括:判断指标数据是否在第一预设阈值与第二预设阈值之间;当指标数据在第一预设阈值与第二预设阈值之间时,对指标数据进行标注;在一个示例实施例中,方法还包括:当指标数据不在第一预设阈值与第二预设阈值之间时,将指标数据剔除。在一个示例实施例中,方法还包括:存储指标数据、第一预设阈值、第二预设阈值。在一个示例实施例中,通过改进的随机森林算法,预测用户满意度,具体包括:从指标数据的数据集中进行随机抽样,构造子数据集;对指标数据的待选属性值进行随机抽样,构造子属性集;按照子属性集中的属性遍历所述子数据集,将子数据集分裂为数据子树;通过数量比,计算数据子树的基尼系数及信息增益;根据基尼系数及所述信息增益,在子属性集中选取最优划分属性;按照最优划分属性,将数据子树进行拆分,生成多个子树;判断子树的子节点是否能够继续拆分以及多个子树的数据是否属于同一类型,得出判断结果;根据判断结果对多个子树进行投票,得到用户满意度。在一个示例实施例中,数量比为各个类别在子树中的比例。第二方面,本专利技术实施例提供了一种用户满意度的分析装置,包括:数据获取模块,用于融合业务支撑系统BSS域及运营支撑系统OSS域的数据,获取用于预测用户满意度的指标数据;数据预处理模块,用于对指标数据进行清洗及标记;随机森林算法预测模块,用于基于清洗及标记后的指标数据,通过改进的随机森林算法,预测用户满意度。在一个示例实施例中,数据预处理模块,具体用于:判断指标数据是否在第一预设阈值与第二预设阈值之间;当指标数据在第一预设阈值与第二预设阈值之间时,对指标数据进行标注;在一个示例实施例中,数据预处理模块,还用于当指标数据不在第一预设阈值与第二预设阈值之间时,将指标数据剔除。在一个示例实施例中,数据预处理模块,还用于存储指标数据、第一预设阈值、第二预设阈值。在一个示例实施例中,随机森林算法预测模块,包括:行抽样模块,用于从指标数据的数据集中进行随机抽样,构造子数据集;列抽样模块,用于对指标数据的待选属性值进行随机抽样,构造子属性集;特征选取模块,用于按照子属性集中的属性遍历子数据集,将子数据集分裂为数据子树;通过数量比,计算数据子树的基尼系数及信息增益;根据基尼系数及信息增益,在子属性集中选取最优划分属性;分裂模块,用于按照最优划分属性,将数据子树进行拆分,生成多个子树;子树投票模块,用于判断数据子树是否能够继续拆分以及多个子树的数据是否属于同一类型,得出判断结果;根据判断结果对多个子树进行投票,得到用户满意度。在一个示例实施例中,数量比为各个类别在子树中的比例。本专利技术对运营支撑系统OSS域、业务支撑系统BSS域的数据进行融合分析,提高数据多样性形成多维数据,避免仅对OSS域或BSS域数据进行抽样分析而导致原始数据不全面、缺乏多样性、容易丢失关键信息,避免缺乏对业务支撑系统BSS域、运营支撑系统OSS域以及用户满意度的关联性分析以及加入的人工干涉易使分析结果和实际值产生偏差。本专利技术对多维指标数据进行改进的平衡随机森林算法进行分析,能有效的提高对用户满意度预测的准确率、查全率、查准率,避免简单加权计算缺乏融合各数据的关联分析。本专利技术的平衡随机森林模型通过随机抽样和构建多决策树来避免过拟合现象,并且随机森林模型能处理高维数据、训练速度快容易做成并行化等特征使其能很好的适用于用户满意度预测的场景,避免使训练好的模型并不能较好的适应于新数据。本专利技术的改进平衡随机森林算法能避免倾向性的划分问题,使得划分结果的类别比例和实际的类别比例相一致,避免划分结果产生偏差、划分会偏向于比例大的类别。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术一实施例的用户满意度的分析装置的示意框图;图2是根据本专利技术一实施例的用户满意度的分析方法的流程示意图;图3是根据本专利技术另一实施例的用户满意度的分析方法的流程示意图;图4是根据本专利技术再一实施例的改进的随机森林算法的流程示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1是根据本专利技术一实施例的用户满意度的分析装置100的示意框图。该装置包括:数据获取模块110,用于融合业务支撑系统BSS域及运营支撑系统OSS域的数据,获取用于预测用户满意度的指标数据;数据预处理模块120,用于对指标数据进行清洗及标记;随机森林预测模块130,用于基于清洗及标记后的所述指标数据,通过改进的随机森林算法,预测用户满意度。数据预处理模块120,对数据获取模块得到的指标数据进行清洗,对每个指标设定相应的上下阈值,判断指标是否在有效阈值内,如指标数据在该有效阈值内,则用人工或者其他方法对指标数据进行标注,写入用户满意度值,若指标数据不在该有效阈值内,则将本文档来自技高网...

【技术保护点】
1.一种用户满意度的分析方法,包括:融合业务支撑系统BSS域及运营支撑系统OSS域的数据,获取用于预测用户满意度的指标数据;对所述指标数据进行清洗及标记;基于清洗及标记后的所述指标数据,通过改进的随机森林算法,预测所述用户满意度。

【技术特征摘要】
1.一种用户满意度的分析方法,包括:融合业务支撑系统BSS域及运营支撑系统OSS域的数据,获取用于预测用户满意度的指标数据;对所述指标数据进行清洗及标记;基于清洗及标记后的所述指标数据,通过改进的随机森林算法,预测所述用户满意度。2.根据权利要求1所述的方法,对所述指标数据进行清洗及标记,具体包括:判断所述指标数据是否在第一预设阈值与第二预设阈值之间;当所述指标数据在第一预设阈值与第二预设阈值之间时,对所述指标数据进行标注。3.根据权利要求2所述的方法,所述方法还包括:当所述指标数据不在第一预设阈值与第二预设阈值之间时,将所述指标数据剔除。4.根据权利要求1至3中任一项所述的方法,所述方法还包括:存储所述指标数据、所述第一预设阈值、所述第二预设阈值。5.根据权利要求1所述的方法,通过所述改进的随机森林算法,预测所述用户满意度,具体包括:从所述指标数据的数据集中进行随机抽样,构造子数据集;对所述指标数据的待选属性值进行随机抽样,构造子属性集;按照所述子属性集中的属性遍历所述子数据集,将所述子数据集分裂为数据子树;通过数量比,计算所述数据子树的基尼系数及信息增益;根据所述基尼系数及所述信息增益,在所述子属性集中选取最优划分属性;按照所述最优划分属性,将所述数据子树进行拆分,生成多个子树;判断所述子树的子节点是否能够继续拆分以及所述多个子树的数据是否属于同一类型,得出判断结果;根据所述判断结果对所述多个子树进行投票,得到所述用户满意度。6.根据权利要求5所述的方法,所述数量比为各个类别在所述子树中的比例。7.一种用户满意度的分析装置,包括:数据获取模块,用于融合业务支撑...

【专利技术属性】
技术研发人员:印艳春
申请(专利权)人:中国移动通信集团辽宁有限公司中国移动通信集团公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1