一种标签生产方法、管理方法、装置及系统制造方法及图纸

技术编号:28423320 阅读:20 留言:0更新日期:2021-05-11 18:31
本发明专利技术提供一种标签生产方法、管理方法、装置及系统,该标签生产方法包括如下步骤:获取标签生产请求端输入的标签逻辑,标签逻辑包括标签生产指令、数据源及标签配置内容;对数据源包括的若干数据源表进行表关系处理得到初始数据集;基于标签配置内容配置数据处理规则及打标规则;基于数据处理规则对初始数据集进行数据处理;基于打标规则对处理后的初始数据集进行打标获得目标标签SQL,该标签生产方法通过搭建生产工具以收集标签生产请求端的标签逻辑以自动生成标签SQL,从而代替目前获得标签逻辑之后人工写SQL的方式,以缩短标签生产时间、提高标签生产效率,以快速响应业务需求。

【技术实现步骤摘要】
一种标签生产方法、管理方法、装置及系统
本专利技术涉及计算机信息处理
,特别涉及一种标签生产方法、管理方法、装置及系统。
技术介绍
通常的电子商务平台具有较多的用户及商品,为了更好地实现平台管理,通常会对用户或商品打标签。用户标签是构成用户画像的核心因素,是将用户在平台内所产生的行为数据分析处理后生成具有差异性特征的形容词,主要用于平台管理、设计千人千面及运营策略。商品标签用于描述商品内容、功能、商品成交率等信息。通过用户标签及商品标签的生产,不仅能更好地管理平台,还能针对不同的业务场景对用户或商品情况进行分析,以支持运营。标签的生产过程包括收集需求、建立规则、生产标签、标签维护。目前标签生产通常采用的手段是:在策划前期,运营与技术需要沟通明确标签的目的及作用,明确标签逻辑,再基于底层海量的数据,通过统计计算、规则分层或算法挖掘等逻辑人工写SQL进行生产。这个做法的弊端是:依赖人工生产,开发周期较长,不能快速响应业务需求。其次,人工生产难以落实标签生产规范,造成标签生产与标签服务系统脱节,标签生产完成后需单独开发才能对外提供服务。因此,需要提供一种能有效克服上述问题的标签生产及管理方法。
技术实现思路
为解决上述技术问题,本专利技术提供了一种标签生产方法,其能有效提高标签生产效率及准确率。本专利技术提供的技术方案如下:第一方面,提供一种标签生产方法,所述标签生产方法包括如下步骤:获取标签生产请求端输入的标签逻辑,所述标签逻辑包括标签生产指令、数据源及标签配置内容;对所述数据源包括的若干数据源表进行表关系处理得到初始数据集;基于所述标签配置内容配置数据处理规则及打标规则;基于所述数据处理规则对所述初始数据集进行数据处理;基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL。在一种较佳的实施方式中,所述对所述数据源包括的若干数据源表进行表关系处理得到初始数据集,包括:对所述数据源包括的若干数据源表进行关联和/或合并处理以得到初始数据集。在一种较佳的实施方式中,所述数据处理规则包括维度规则、过滤规则、聚合规则、计算规则;所述基于所述数据处理规则对所述初始数据集进行数据处理包括如下子步骤:基于所述维度规则及过滤规则处理所述初始数据集获得第一处理数据集;基于所述聚合规则对所述第一处理数据集进行聚合计算或基于所述计算规则对所述第一处理数据集进行算数计算获得第二处理数据集;所述基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL,包括:基于所述打标规则对所述第二处理数据集进行打标获得目标标签SQL。在一种较佳的实施方式中,所述获得目标标签SQL之后,所述标签生产方法还包括:基于所述目标标签SQL获取与所述标签逻辑对应的目标标签数据,包括如下子步骤:根据所述目标标签SQL同步标签字典信息;当采集到与所述目标标签SQL对应的目标标签字典信息时,创建目标标签生产任务并执行,获得所述目标标签数据。在一种较佳的实施方式中,所述获得所述目标标签数据后,所述标签生产方法还包括:基于所述目标标签数据生成目标标签数据表。在一种较佳的实施方式中,所述数据源表至少包括数仓指标模型,还包括Hive表或导入的商品/用户数据中的至少一种。第二方面,提供一种基于所述标签生产方法的标签管理方法,所述标签管理方法包括:基于标签生产请求端输入的标签逻辑获得目标标签SQL;根据所述目标标签SQL同步标签字典信息;当采集到与所述目标标签SQL对应的目标标签字典信息时,创建目标标签生产任务并执行,获得所述目标标签数据;将所述目标标签数据同步至标签服务数据库以对其进行更新。第三方面,提供一种标签生产装置,所述标签生产装置包括:第一获取模块,用于获取标签生产请求端输入的标签逻辑,所述标签逻辑包括标签生产指令、数据源及标签配置内容;第一处理模块,用于对所述数据源包括的若干数据源表进行表关系处理得到初始数据集;规则配置模块,用于基于所述标签配置内容生成数据处理规则及打标规则;第二处理模块,用于基于所述数据处理规则对所述初始数据集进行数据处理;打标模块,用于基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL。第四方面,提供一种标签管理装置,所述标签管理装置包括:第三处理模块,用于基于标签生产请求端输入的标签逻辑获得目标标签SQL;第一同步模块,用于根据所述目标标签SQL同步标签字典信息;采集模块,用于采集目标标签字典信息;第四处理模块,用于当采集到与所述目标标签SQL对应的目标标签字典信息时,创建目标标签生产任务并执行,获得所述目标标签数据;第二同步模块,用于将所述目标标签数据同步至标签服务数据库以对其进行更新。第五方面,提供一种计算机系统,包括:一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:获取标签生产请求端输入的标签逻辑,所述标签逻辑包括标签生产指令、数据源及标签配置内容;对所述数据源包括的若干数据源表进行表关系处理得到初始数据集;基于所述标签配置内容配置数据处理规则及打标规则;基于所述数据处理规则对所述初始数据集进行数据处理;基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL。本专利技术相比现有技术而言的有益效果在于:本专利技术提供一种标签生产方法,该方法包括如下步骤:获取标签生产请求端输入的标签逻辑,标签逻辑包括标签生产指令、数据源及标签配置内容;对数据源包括的若干数据源表进行表关系处理得到初始数据集;基于标签配置内容配置数据处理规则及打标规则;基于数据处理规则对初始数据集进行数据处理;基于打标规则对处理后的初始数据集进行打标获得目标标签SQL,该标签生产方法通过搭建生产工具以收集标签生产请求端的标签逻辑以自动生成标签SQL,从而代替目前获得标签逻辑之后人工写SQL的方式,以缩短标签生产时间、提高标签生产效率,以快速响应业务需求,且提高标签生产规范;进一步,标签生产时所用的数据源表至少包括数仓指标模型,还包括Hive表或导入的商品/用户数据中的至少一种或多种的组合,由此,将数仓指标模型作为标签生产时的数据源之一,从而打通标签生产工具与数仓指标模型,促进指标信息与标签底层数据的口径一致以提高统计类/规则类标签的准确率;本专利技术还提供一种基于标签生产方法的标签管理方法,其在生产获得目标标签SQL并获得目标标签数据之后,将目标标签数据同步至标签服务数据库以对其进行更新,该标签管理方法将标签生产工具与标签服务系统打通实现标签数据同步,相较于现有的在生产获得标签数据后通过人工入标签服务数据库的技术方案,能有效提高标签服务效率;进本文档来自技高网...

【技术保护点】
1.一种标签生产方法,其特征在于,所述标签生产方法包括如下步骤:/n获取标签生产请求端输入的标签逻辑,所述标签逻辑包括标签生产指令、数据源及标签配置内容;/n对所述数据源包括的若干数据源表进行表关系处理得到初始数据集;/n基于所述标签配置内容配置数据处理规则及打标规则;/n基于所述数据处理规则对所述初始数据集进行数据处理;/n基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL。/n

【技术特征摘要】
1.一种标签生产方法,其特征在于,所述标签生产方法包括如下步骤:
获取标签生产请求端输入的标签逻辑,所述标签逻辑包括标签生产指令、数据源及标签配置内容;
对所述数据源包括的若干数据源表进行表关系处理得到初始数据集;
基于所述标签配置内容配置数据处理规则及打标规则;
基于所述数据处理规则对所述初始数据集进行数据处理;
基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL。


2.根据权利要求1所述的标签生产方法,其特征在于,所述对所述数据源包括的若干数据源表进行表关系处理得到初始数据集,包括:
对所述数据源包括的若干数据源表进行关联和/或合并处理以得到初始数据集。


3.根据权利要求1所述的标签生产方法,其特征在于,所述数据处理规则包括维度规则、过滤规则、聚合规则、计算规则;
所述基于所述数据处理规则对所述初始数据集进行数据处理包括如下子步骤:
基于所述维度规则及过滤规则处理所述初始数据集获得第一处理数据集;
基于所述聚合规则对所述第一处理数据集进行聚合计算或基于所述计算规则对所述第一处理数据集进行算数计算获得第二处理数据集;
所述基于所述打标规则对处理后的所述初始数据集进行打标获得目标标签SQL,包括:
基于所述打标规则对所述第二处理数据集进行打标获得目标标签SQL。


4.根据权利要求2或3所述的标签生产方法,其特征在于,所述获得目标标签SQL之后,所述标签生产方法还包括:基于所述目标标签SQL获取与所述标签逻辑对应的目标标签数据,包括如下子步骤:
根据所述目标标签SQL同步标签字典信息;
当采集到与所述目标标签SQL对应的目标标签字典信息时,创建目标标签生产任务并执行,获得所述目标标签数据。


5.根据权利要求4所述的标签生产方法,其特征在于,所述获得所述目标标签数据后,所述标签生产方法还包括:
基于所述目标标签数据生成目标标签数据表。


6.根据权利要求1所述的标签生产方法,其特征在于,所述数据源表至少包括数仓指标模型,还包括Hive表或导入的商品/用户数据中的至少一种。


7.一种基于权...

【专利技术属性】
技术研发人员:曹程明沈海旺孙迁李成张志强
申请(专利权)人:江苏苏宁云计算有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1