一种基于标签库的电信用户兴趣度分析方法及系统技术方案

技术编号:13775051 阅读:78 留言:0更新日期:2016-09-30 19:30
为解决现有技术电信用户兴趣度分析方法存在的不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题,本发明专利技术提出一种基于标签库的电信用户兴趣度分析方法及系统,通过获取全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析法对用户标签库和电信业务信息进行分析并形成用户宽表,针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;形成“用户‑业务”二维兴趣度矩阵和“时间‑用户‑业务”的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务的精准营销奠定了基础。

【技术实现步骤摘要】

本专利技术涉及电信用户兴趣度分析方法
,具体涉及到一种基于标签库的电信用户兴趣度分析方法及系统
技术介绍
随着移动互联网的快速发展,电信运营商在传统的语音和信息方面的收入呈明显的下降趋势,同时,运营商的业务增长空间由于流量价值不断向OTT服务商转移而受到挤压,运营商日益呈现出管道化、边缘化、低值化的发展趋势,因此,实现对自身电信业务的精准营销能够帮助运营商攫取更大的价值。然而,要想实现对自身电信业务的精准营销,其前提条件是对电信用户对各种电信业务或服务的兴趣度的精准分析,并以此分析为基础向电信用户进行营销,以更精确的手段进行用户需求挖掘与业务营销推广。现有技术电信用户兴趣度分析方法通常采用基于电信用户的基本资料、地理位置、通信行为等数据的分析和挖掘,从中发现业务运营规律,进而开展电信业务推荐。但随着移动互联网的不断发展,以及用户使用终端的多样化,加之互联网上丰富多彩的内容和非常复杂繁琐的电信用户行为,使得现有技术电信用户兴趣度分析方法不能精准分析电信用户对各种电信业务或服务的兴趣度,盲目的营销不仅会引起电信用户的反感,而且极其容易引发电信用户的投诉。显然,现有技术电信用户兴趣度分析方法存在着不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题。
技术实现思路
为解决现有技术电信用户兴趣度分析方法存在的不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题,本专利技术提出一种基于标签库的电信用户兴趣度分析方法及系统。本专利技术基于标签库的电信用户兴趣度分析方法,包括以下步骤:S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关 系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;S5、在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。进一步的,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。进一步的,步骤S2中的用户宽表,包括:所述地理位置包含居住地、工作地和行政区域信息;所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周 期、换机时长和曾使用的手机个数信息其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。进一步的,步骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的合理性和完整性。进一步的,步骤S4中根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为: W j = Σ i = 1 n A i j · C i B i , ( i = 1 , 2 , ... n ; C i = 1 , 2 , ... B i ) ]]>对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。本专利技术基于标签库的电信用户兴趣度分析系统,包括,数据和信息采集模块、数据和信息处理模块、用户标签库模块和相关分析模块;所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性本文档来自技高网...

【技术保护点】
一种基于标签库的电信用户兴趣度分析方法,其特征在于,该方法包括以下步骤:S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为‑互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户‑业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;S5、在设定时间间隔内运用相关分析法进行分析可生成“时间‑用户‑业务”的三维兴趣度矩阵。

【技术特征摘要】
1.一种基于标签库的电信用户兴趣度分析方法,其特征在于,该方法包括以下步骤:S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;S5、在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。2.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。3.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S2中的用户宽表,包括:所述地理位置包含居住地、工作地和行政区域信息;所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信
\t息;所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周期、换机时长和曾使用的手机个数信息其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。4.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的合理性和完整性。5.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S4中根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为: W j = Σ i = 1 n A i j · C i B i , ( i = 1 , 2 , ... n ; C i = 1 , 2 , ... B i ) ]]>对用户标签库中电信用户逐个进行相关矩阵分析,...

【专利技术属性】
技术研发人员:程亮张治中
申请(专利权)人:重庆重邮汇测通信技术有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1