用户画像标签数据的处理方法及处理设备技术

技术编号:20076640 阅读:68 留言:0更新日期:2019-01-15 01:05
本发明专利技术公开了一种用户画像标签数据的处理方法及处理设备,其中该处理方法包括:根据数据事实层记录的标签数据,在数据集市层生成标签目录表;其中,标签目录表记录有多个原始标签名称,以及每个原始标签名称对应的标签标识、主体属性和各级类目信息;在数据集市层构建标签成员表、标签公共字典表和成员标签关系表;其中,成员标签关系表记录有至少一个成员编号以及每个成员编号对应的标签取值标识;接收标签扩展需求;根据标签扩展需求、标签目录表、标签成员表、标签公共字典表和成员标签关系表,扩展标签目录表、标签公共字典表和成员标签关系表中的标签内容,能根据实际需求对标签数据进行扩展,从而对市场前端产品起到推动作用。

Processing Method and Equipment of User Portrait Label Data

The invention discloses a processing method and equipment for user portrait label data, in which a label catalogue table is generated at the data mart level according to the label data recorded in the data fact layer, in which the label catalogue table records multiple original label names, as well as label identification, subject attributes and category information corresponding to each original label name. At the data mart level, tag membership tables, tag common dictionary tables and member tag relationship tables are constructed; among them, the member tag relationship tables record at least one member number and tag value identification corresponding to each member number; receive tag extension requirements; expand according to tag expansion requirements, tag catalogue tables, tag membership tables, tag common dictionary tables and member tag relationship tables. The contents of labels in the catalogue table of exhibition labels, the common dictionary table of labels and the membership label relational table can expand the label data according to the actual needs, thus promoting the front-end products in the market.

【技术实现步骤摘要】
用户画像标签数据的处理方法及处理设备
本专利技术涉及数据处理领域,尤其涉及一种用户画像标签数据的处理方法及处理设备。
技术介绍
在互联网逐渐步入大数据时代后,不可避免的为企业及消费者行为带来一系列改变与重塑,其中最大的变化莫过于,通过对消费者的行为进行分析,使消费者在企业面前变成一种可视化的对象。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据为消费者提供精准营销服务,进而从中深入挖掘潜在的商业价值。以上这些可以通过“用户画像”的方法实现对用户的描述。用户画像也叫用户信息标签,是企业通过收集与分析消费者的社会属性、生活习惯、消费行为等主要信息后,完美地抽象出一个用户的商业全貌。用户画像能够为企业提供足够的信息基础,以帮助企业快速找到精准用户群体和用户群体的需求。目前的用户画像数据包括年龄、性别和/或学历等基础属性,也包括表示用户的年收入、兴趣特征,如女装和/或服饰等的社会属性或行为属性。随着市场竞争性的增强,这些原始的标签属性难以满足市场需求,企业往往需要具有综合性的标签,例如高装修需求等标签名称,以快速为消费者提供精准营销服务,但目前的用户画像标签数据具有来源不一、信息量大、数据分散等特点,从而导致标签数据的处理速度慢,难以根据实际需求对标签数据进行扩展,无法对市场前端产品起到推动作用。
技术实现思路
本专利技术的主要目的在于提供一种用户画像标签数据的处理方法及处理设备,以解决标签数据的处理速度慢,难以根据实际需求对标签数据进行扩展,无法对市场前端产品起到推动作用的问题。为实现上述目的,本专利技术提供了一种用户画像标签数据的处理方法,该处理方法包括:根据数据事实层记录的标签数据,在数据集市层生成标签目录表;其中,标签目录表记录有多个原始标签名称,以及每个原始标签名称对应的标签标识、主体属性和各级类目信息;在数据集市层构建标签成员表、标签公共字典表和成员标签关系表;其中,标签成员表记录有至少一个主体属性以及每个主体属性对应的成员编号,标签公共字典表记录有至少一个标签标识以及每个标签标识对应的标签取值和标签取值标识,成员标签关系表记录有至少一个成员编号以及每个成员编号对应的标签取值标识;接收标签扩展需求;根据标签扩展需求、标签目录表、标签成员表、标签公共字典表和成员标签关系表,扩展标签目录表、标签公共字典表和成员标签关系表中的标签内容。其中,标签扩展需求包括需扩展的组合标签名称,以及组合标签名称对应的主体属性和标签组合规则,标签组合规则包括多个目标标签名称的组合关系,多个目标标签名称为多个原始标签名称中的至少部分;根据标签扩展需求、标签目录表、标签成员表、标签公共字典表和成员标签关系表,扩展标签目录表、标签公共字典表和成员标签关系表中的标签内容的步骤,包括:根据预设的组合标签标识的配置规则,为组合标签名称配置对应的组合标签标识;根据组合标签名称和组合标签名称对应的主体属性和组合标签标识,扩展标签目录表中的标签内容;根据多个目标标签名称和组合标签名称对应的组合标签标识,扩展标签公共字典表中的标签内容;根据扩展后的标签公共字典表中的标签内容,扩展成员标签关系表中的标签内容。其中,根据组合标签名称和组合标签名称对应的主体属性和组合标签标识,扩展标签目录表中的标签内容的步骤,包括:在标签目录表中添加组合标签名称,以及组合标签名称对应的组合标签标识和主体属性。其中,根据多个目标标签名称和组合标签名称对应的组合标签标识,扩展标签公共字典表中的标签内容的步骤,包括:从标签目录表中获取每个目标标签名称对应的标签标识;根据每个目标标签名称对应的标签标识,从标签公共字典表中获取每个目标标签名称对应的标签取值;根据获取到的标签取值,获取组合标签标识对应的组合标签取值;根据预设的组合标签取值标识的配置规则,为组合标签取值配置对应的组合标签取值标识;在标签公共字典表中添加组合标签标识,以及组合标签标识对应的组合标签取值和组合标签取值标识。其中,根据获取到的标签取值,获取组合标签标识对应的组合标签取值的步骤,包括:根据标签扩展需求和多个目标标签名称,通过Jsoup表达式和正则表达式生成标签规则项;判断获取到的多个目标标签名称对应的标签取值是否满足标签规则项;在获取到的多个目标标签名称对应的标签取值满足标签规则项时,将第一预设值作为组合标签标识对应的组合标签取值;其中,第一预设值用于表征满足组合标签名称;在获取到的多个目标标签名称对应的标签取值不满足标签规则项时,将第二预设值作为组合标签标识对应的组合标签取值;其中,第二预设值用于表征不满足组合标签名称。其中,根据扩展后的标签公共字典表中的标签内容,扩展成员标签关系表中的标签内容的步骤,包括:根据组合标签名称对应的主体属性和组合标签标识,从标签成员表中获取组合标签标识对应的成员编号;根据组合标签标识对应的成员编号和组合标签取值标识,在成员标签关系表中添加组合标签取值标识,以及组合标签取值标识对应的成员编号。其中,根据数据事实层记录的标签数据,在数据集市层生成标签目录表的步骤,包括:提取出标签数据中的所有主体属性;从标签数据中获取每个主体属性对应的原始标签名称;根据预先存储的原始标签名称与至少一级类目信息的对应关系,分别确定出获取到的每个原始标签名称对应的至少一级类目信息;根据预先存储的原始标签名称与标签标识的对应关系,分别确定出获取到的每个原始标签名称对应的标签标识;建立提取到的主体属性、获取到的原始标签名称、获取到的每个原始标签名称对应的至少一级类目信息和标签标识之间的对应关系,获得标签目录表。其中,在获得标签目录表的步骤之后,处理方法还包括:分别针对标签目录表中的每个原始标签名称,根据原始标签名称对应的标签标识,在标签目录表中为原始标签名称对应的主体属性配置主体属性标识。本专利技术还提供了一种用户画像标签数据的处理设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述的用户画像标签数据的处理方法的步骤。本专利技术还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述的用户画像标签数据的处理方法的步骤。本专利技术的上述方案至少包括以下有益效果:在本专利技术的实施例中,通过根据数据事实层记录的标签数据,在数据集市层生成标签目录表,并在数据集市层构建标签成员表、标签公共字典表和成员标签关系表,使得在接收到标签扩展需求时,能根据标签扩展需求、标签目录表、标签成员表、标签公共字典表和成员标签关系表,扩展标签目录表、标签公共字典表和成员标签关系表中的标签内容,进而使得标签数据中包括根据实际需求生成的具有综合性的标签,达到根据实际需求对标签数据进行扩展,对市场前端产品起到推动作用的效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术第一实施例中用户画像标签数据的处理方法的流程图;图2为本专利技术第一实施例中图1中步骤14的具体实现方式的步骤流程图;图3为本专利技术第本文档来自技高网...

【技术保护点】
1.一种用户画像标签数据的处理方法,其特征在于,所述处理方法包括:根据数据事实层记录的标签数据,在数据集市层生成标签目录表;其中,所述标签目录表记录有多个原始标签名称,以及每个原始标签名称对应的标签标识、主体属性和各级类目信息;在所述数据集市层构建标签成员表、标签公共字典表和成员标签关系表;其中,所述标签成员表记录有至少一个主体属性以及每个主体属性对应的成员编号,所述标签公共字典表记录有至少一个标签标识以及每个标签标识对应的标签取值和标签取值标识,所述成员标签关系表记录有至少一个成员编号以及每个成员编号对应的标签取值标识;接收标签扩展需求;根据所述标签扩展需求、所述标签目录表、所述标签成员表、所述标签公共字典表和所述成员标签关系表,扩展所述标签目录表、所述标签公共字典表和所述成员标签关系表中的标签内容。

【技术特征摘要】
1.一种用户画像标签数据的处理方法,其特征在于,所述处理方法包括:根据数据事实层记录的标签数据,在数据集市层生成标签目录表;其中,所述标签目录表记录有多个原始标签名称,以及每个原始标签名称对应的标签标识、主体属性和各级类目信息;在所述数据集市层构建标签成员表、标签公共字典表和成员标签关系表;其中,所述标签成员表记录有至少一个主体属性以及每个主体属性对应的成员编号,所述标签公共字典表记录有至少一个标签标识以及每个标签标识对应的标签取值和标签取值标识,所述成员标签关系表记录有至少一个成员编号以及每个成员编号对应的标签取值标识;接收标签扩展需求;根据所述标签扩展需求、所述标签目录表、所述标签成员表、所述标签公共字典表和所述成员标签关系表,扩展所述标签目录表、所述标签公共字典表和所述成员标签关系表中的标签内容。2.根据权利要求1所述的处理方法,其特征在于,所述标签扩展需求包括需扩展的组合标签名称,以及所述组合标签名称对应的主体属性和标签组合规则,所述标签组合规则包括多个目标标签名称的组合关系,所述多个目标标签名称为所述多个原始标签名称中的至少部分;所述根据所述标签扩展需求、所述标签目录表、所述标签成员表、所述标签公共字典表和所述成员标签关系表,扩展所述标签目录表、所述标签公共字典表和所述成员标签关系表中的标签内容的步骤,包括:根据预设的组合标签标识的配置规则,为所述组合标签名称配置对应的组合标签标识;根据所述组合标签名称和所述组合标签名称对应的主体属性和组合标签标识,扩展所述标签目录表中的标签内容;根据所述多个目标标签名称和所述组合标签名称对应的组合标签标识,扩展所述标签公共字典表中的标签内容;根据扩展后的标签公共字典表中的标签内容,扩展所述成员标签关系表中的标签内容。3.根据权利要求2所述的处理方法,其特征在于,所述根据所述组合标签名称和所述组合标签名称对应的主体属性和组合标签标识,扩展所述标签目录表中的标签内容的步骤,包括:在所述标签目录表中添加所述组合标签名称,以及所述组合标签名称对应的组合标签标识和主体属性。4.根据权利要求2所述的处理方法,其特征在于,所述根据所述多个目标标签名称和所述组合标签名称对应的组合标签标识,扩展所述标签公共字典表中的标签内容的步骤,包括:从所述标签目录表中获取每个目标标签名称对应的标签标识;根据每个目标标签名称对应的标签标识,从所述标签公共字典表中获取每个目标标签名称对应的标签取值;根据获取到的标签取值,获取所述组合标签标识对应的组合标签取值;根据预设的组合标签取值标识的配置规则,为所述组合标签取值配置对应的组合标签取值标识;在所述标签公共字典表中添加所述组合标签标识,以及所述...

【专利技术属性】
技术研发人员:陈炳贵邬向春王国彬
申请(专利权)人:深圳市彬讯科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1