一种标签数据的优化方法及系统技术方案

技术编号:19692567 阅读:29 留言:0更新日期:2018-12-08 11:22
本发明专利技术提供了一种标签数据的优化方法,具体包括:首先获取目标网页的用户点击数据,在预设时间周期T内,根据用户点击数据的主体内容定义多个指标分类,并对其设置优先级;然后再根据预设的维度表选择与所述指标分类相匹配的多个维度组合,生成多个维度指标关系并构建维度指标关系表;最后根据指标分类设置的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据进行整合分类并按照预设规则更新到后端数据仓库。通过实施本发明专利技术方法,将优先级高的用户数据和优先级低的用户数据分别按照不同的规则更新至后端数据仓库,可以减少后端数据仓库存储压力,同时提高大数据利用效率。

【技术实现步骤摘要】
一种标签数据的优化方法及系统
本专利技术涉及大数据领域,尤其涉及一种标签数据的优化方法及系统。
技术介绍
随着互联网的高速发展,迎来了大数据时代,走过了探索阶段和市场启动阶段,如今大数据已经进入从概念到实际应用的关键转折时期。大数据在接受度、技术、应用等各个方面趋于成熟,开始步入产业的快速发展阶段。大数据巨大的应用价值带动了大数据行业的巨大发展。现有技术中,通过从海量数据中提炼用户有效信息和整合分析数据,但是,随着各行业大数据的推进发展,仍然存在许多技术问题亟待解决,比如如何基于已有的数据分析技能和应用技术,有效的结合企业自身业务需求对提炼出的用户有效信息进行直观、全方位的进行数据分析,以及利用自身业务经验积累对整合分析后的数据进行数据创新和更新优化等问题,从而转化为企业的价值资源。
技术实现思路
本专利技术实施例提供一种标签数据的优化方法及系统,主要用于根据企业已有的数据分析技能和应用技术,有效的结合企业自身业务需求对提炼出的用户有效信息进行直观、全方位的数据分析,以及利用自身业务经验积累对整合分析后的数据进行数据创新和更新优化等,从而将大数据信息转化为企业的价值资源,提高大数据分析效率和数据利用率。第一方面,本专利技术实施例提供了一种标签数据的优化方法,具体包括:获取目标网页的用户点击数据,所述用户点击数据包括用户点击所述目标网页数据的坐标和当前坐标对应的主体内容;在预设时间周期T1内,根据所述用户点击所述目标网页数据的坐标对应的主体内容定义多个指标分类,并将所述多个指标分类与预设的指标分类-优先级关系进行匹配,根据所述匹配的结果将所述多个指标分类设置所述预设的优先级;根据预设的维度表选择与所述指标分类相匹配的多个维度组合,所述指标分类包括指标分类名称和指标ID,所述维度组合包括维度名称、维度属性ID、维度属性值和维度ID,根据所述指标分类名称、所述指标ID、所述维度名称、所述维度属性ID、所述维度属性值和所述维度ID生成多个维度指标关系,根据所述多个维度指标关系构建维度指标关系表;根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库。在一些可行的实施方式中,所述数据库服务器在预设时间段T1内,根据所述用户点击所述目标网页数据的坐标对应的主体内容定义多个指标分类,并将所述多个指标分类与预设的指标分类-优先级关系进行匹配,根据所述匹配的结果将所述多个指标分类分别设置所述预设的优先级,具体包括:所述数据库服务器预先建立指标分类-优先级关系库,所述优先级包括第一优先级、第二优先级和第三优先级,所述第一优先级对应的更新时间为t1,所述第二优先级对应的更新时间为t2,所述第三优先级对应的更新时间为t3,所述第一优先级大于所述第二优先级,所述第二优先级大于第三优先级,所述t1<t2<t3;将所述多个指标分类与所述指标分类-优先级关系库进行匹配,为所述多个指标分类分别设置匹配成功的所述指标分类-优先级关系对应的优先级。在一些可行的实施方式中,所述数据库服务器根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库,还包括:所述数据库服务器将所述多个维度指标关系按照所述第一优先级、第二优先级和第三优先级依次进行排序;利用联机分析处理技术将所述用户点击数据按照所述第一优先级、第二优先级和第三优先级依次对应的更新时间t1、t2和t3更新至后端数据仓库。在一些可行的实施方式中,所述利用联机分析处理技术将所述用户点击数据按照所述第一优先级、第二优先级和第三优先级依次对应的更新时间t1、t2和t3更新至后端数据仓库,具体包括:根据预设的时间周期T2利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的时间周期T2分为日、月和季,所述属性集合为日、月和季的时间维属性集合;根据所述日、月和季的时间维属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到日用户点击数据、月用户点击数据和季用户点击数据;根据所述多个维度指标关系中的指标分类对应的所述第一优先级、所述第二优先级和所述第三优先级分别将所述日用户点击数据、所述月用户点击数据和所述季用户点击数据进行优先级由高至低依次排序,所述日用户点击数据、所述月用户点击数据和所述季用户点击数据依次按照对应的所述更新时间t1、t2和t3更新至后端数据仓库;或者,根据预设的地理维度利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的地理维度分为省、自治区和直辖市,所述属性集合为省、自治区和直辖市的地理维度属性集合;根据所述省、自治区和直辖市的地理维度属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到省地理维度用户点击数据、自治区地理维度用户点击数据和直辖市地理维度用户点击数据;根据所述多个维度指标关系中的指标分类对应的所述第一优先级、所述第二优先级和所述第三优先级分别将所述省地理维度用户点击数据、自治区地理维度用户点击数据和直辖市地理维度用户点击数据进行优先级由高至低依次排序,所述省地理维度用户点击数据、自治区地理维度用户点击数据和直辖市地理维度用户点击数据分别依次按照对应的所述更新时间t1、t2和t3更新至后端数据仓库;或者,根据预设的用户操作平台利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的用户操作平台分为网页、AndroidAPP和IOSAPP,所述属性集合为网页、AndroidAPP和IOSAPP的用户操作平台属性集合;根据所述网页、AndroidAPP和IOSAPP的用户操作平台属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据;根据所述多个维度指标关系中的指标分类对应的所述第一优先级、所述第二优先级和所述第三优先级分别将所述网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据进行优先级由高至低依次排序,所述网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据分别依次按照对应的所述更新时间t1、t2和t3更新至后端数据仓库。在一些可行的实施方式中,所述数据库服务器根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库,还包括:根据预设的用户操作平台利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的用户操作平台分为网页、AndroidAPP和IOSAPP,所述属性集合为网页、AndroidAPP和IOSAPP的用户操作平台属性集合;所述预设的用户操作平台预先设置优先级,所述预设的用户操作平台包括网页、AndroidAPP和IOSAPP,网页优先级大于AndroidAPP,AndroidAPP优先级大于IOSAPP优先级,所述网页优先级对应的更新时间为t4,所述AndroidAPP优先级对应的更新时间为t5,所述IOSAPP优先级对应的更新时间为t6,所述t4<t5<t6;根据所述网本文档来自技高网...

【技术保护点】
1.一种标签数据的优化方法,其特征在于,所述方法包括:获取目标网页的用户点击数据,所述用户点击数据包括用户点击所述目标网页数据的坐标和当前坐标对应的主体内容;在预设时间周期T1内,根据所述用户点击所述目标网页数据的坐标对应的主体内容定义多个指标分类,并将所述多个指标分类与预设的指标分类‑优先级关系进行匹配,根据所述匹配的结果将所述多个指标分类设置所述预设的优先级;根据预设的维度表选择与所述指标分类相匹配的多个维度组合,所述指标分类包括指标分类名称和指标ID,所述维度组合包括维度名称、维度属性ID、维度属性值和维度ID,根据所述指标分类名称、所述指标ID、所述维度名称、所述维度属性ID、所述维度属性值和所述维度ID生成多个维度指标关系,根据所述多个维度指标关系构建维度指标关系表;根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库。

【技术特征摘要】
1.一种标签数据的优化方法,其特征在于,所述方法包括:获取目标网页的用户点击数据,所述用户点击数据包括用户点击所述目标网页数据的坐标和当前坐标对应的主体内容;在预设时间周期T1内,根据所述用户点击所述目标网页数据的坐标对应的主体内容定义多个指标分类,并将所述多个指标分类与预设的指标分类-优先级关系进行匹配,根据所述匹配的结果将所述多个指标分类设置所述预设的优先级;根据预设的维度表选择与所述指标分类相匹配的多个维度组合,所述指标分类包括指标分类名称和指标ID,所述维度组合包括维度名称、维度属性ID、维度属性值和维度ID,根据所述指标分类名称、所述指标ID、所述维度名称、所述维度属性ID、所述维度属性值和所述维度ID生成多个维度指标关系,根据所述多个维度指标关系构建维度指标关系表;根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库。2.根据权利要求1所述的方法,其特征在于,所述在预设时间周期T1内,根据所述用户点击所述目标网页数据的坐标对应的主体内容定义多个指标分类,并将所述多个指标分类与预设的指标分类-优先级关系进行匹配,根据所述匹配的结果将所述多个指标分类设置所述预设的优先级,具体包括:预先建立指标分类-优先级关系库,所述优先级包括第一优先级、第二优先级和第三优先级,所述第一优先级对应的更新时间为t1,所述第二优先级对应的更新时间为t2,所述第三优先级对应的更新时间为t3,所述第一优先级大于所述第二优先级,所述第二优先级大于第三优先级,所述t1<t2<t3;将所述多个指标分类与所述指标分类-优先级关系库进行匹配,为所述多个指标分类分别设置匹配成功的所述指标分类-优先级关系对应的优先级。3.根据权利要求2所述的方法,其特征在于,所述根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库,还包括:将所述多个维度指标关系按照所述第一优先级、第二优先级和第三优先级依次进行排序;利用联机分析处理技术将所述用户点击数据按照所述第一优先级、第二优先级和第三优先级依次对应的更新时间t1、t2和t3更新至后端数据仓库。4.根据权利要求3所述的方法,其特征在于,所述利用联机分析处理技术将所述用户点击数据按照所述第一优先级、第二优先级和第三优先级依次对应的更新时间t1、t2和t3更新至后端数据仓库,具体包括:根据预设的时间周期T2利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的时间周期T2分为日、月和季,所述属性集合为日、月和季的时间维属性集合;根据所述日、月和季的时间维属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到日用户点击数据、月用户点击数据和季用户点击数据;根据所述多个维度指标关系中的指标分类对应的所述第一优先级、所述第二优先级和所述第三优先级分别将所述日用户点击数据、所述月用户点击数据和所述季用户点击数据进行优先级由高至低依次排序,所述日用户点击数据、所述月用户点击数据和所述季用户点击数据依次按照对应的所述更新时间t1、t2和t3更新至后端数据仓库;或者,根据预设的地理维度利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的地理维度分为省、自治区和直辖市,所述属性集合为省、自治区和直辖市的地理维度属性集合;根据所述省、自治区和直辖市的地理维度属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到省地理维度用户点击数据、自治区地理维度用户点击数据和直辖市地理维度用户点击数据;根据所述多个维度指标关系中的指标分类对应的所述第一优先级、所述第二优先级和所述第三优先级分别将所述省地理维度用户点击数据、自治区地理维度用户点击数据和直辖市地理维度用户点击数据进行优先级由高至低依次排序,所述省地理维度用户点击数据、自治区地理维度用户点击数据和直辖市地理维度用户点击数据分别依次按照对应的所述更新时间t1、t2和t3更新至后端数据仓库;或者,根据预设的用户操作平台利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的用户操作平台分为网页、AndroidAPP和IOSAPP,所述属性集合为网页、AndroidAPP和IOSAPP的用户操作平台属性集合;根据所述网页、AndroidAPP和IOSAPP的用户操作平台属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据;根据所述多个维度指标关系中的指标分类对应的所述第一优先级、所述第二优先级和所述第三优先级分别将所述网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据进行优先级由高至低依次排序,所述网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据分别依次按照对应的所述更新时间t1、t2和t3更新至后端数据仓库。5.根据权利要求1所述的方法,其特征在于,所述根据所述预设的优先级将所述多个维度指标关系进行由高至低优先级排序,并利用联机分析处理技术将所述用户点击数据按照预设规则更新到后端数据仓库,还包括:根据预设的用户操作平台利用联机分析处理技术将所述用户点击数据形成多个属性集合,所述预设的用户操作平台分为网页、AndroidAPP和IOSAPP,所述属性集合为网页、AndroidAPP和IOSAPP的用户操作平台属性集合;所述预设的用户操作平台预先设置优先级,所述预设的用户操作平台包括网页、AndroidAPP和IOSAPP,网页优先级大于AndroidAPP,AndroidAPP优先级大于IOSAPP优先级,所述网页优先级对应的更新时间为t4,所述AndroidAPP优先级对应的更新时间为t5,所述IOSAPP优先级对应的更新时间为t6,所述t4<t5<t6;根据所述网页、AndroidAPP和IOSAPP的用户操作平台属性集合分别与所述维度指标关系表将用户点击数据进行整合,得到网页用户点击数据、AndroidAPP用户点击数据和IOSAPP用户点击数据;根据所述网页优先级、AndroidAPP优先级和IOSAPP优先级将所述用户点击数据以优先级由高至低,并分别按所述网页优先级、An...

【专利技术属性】
技术研发人员:陈炳贵邬向春王国彬
申请(专利权)人:深圳市彬讯科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1