一种人群分类的标注方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39293057 阅读:10 留言:0更新日期:2023-11-07 11:00
本发明专利技术公开了一种人群分类的标注方法、装置、计算机设备及存储介质,以解决SQL查询语句的执行性能影响人群分类效率的问题。该方法包括:获取预期圈选人群的第一查询语句;执行所述第一查询语句,并记录执行时长;当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;在所述待标注人群上,标注所述分类标签。标注所述分类标签。标注所述分类标签。

【技术实现步骤摘要】
一种人群分类的标注方法、装置、计算机设备及存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种人群分类的标注方法、装置、计算机设备及存储介质。

技术介绍

[0002]在进行用户画像分析时,通常会采用标签圈选或者SQL(全称为Structured Query Language)语句圈选对不同的人群进行圈选,从而进行人群分类,以便后续依据人群分类分析出不同的用户画像。
[0003]由于SQL语句圈选时,往往需要开发人员编写对应的SQL查询语句,进而通过该SQL查询语句对数据库中的数据进行查询操作,从而得出SQL语句圈选出的人群。因此,SQL查询语句执行性能将影响人群分类的效率,从而影响用户画像分析的效率。

技术实现思路

[0004]本专利技术实施例提供一种人群分类的标注方法、装置、计算机设备及存储介质,以解决SQL查询语句的执行性能影响人群分类效率的问题。
[0005]一种人群分类的标注方法,包括:
[0006]获取预期圈选人群的第一查询语句;
[0007]执行所述第一查询语句,并记录执行时长;
[0008]当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;
[0009]在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;
[0010]在所述待标注人群上,标注所述分类标签。
[0011]在一种可能的设计中,所述记录执行时长,包括:
[0012]记录所述第一查询语句的开始执行时间;
[0013]记录所述第一查询语句的结束执行时间;
[0014]将所述结束执行时间与所述开始执行时间相减,得出所述执行时长。
[0015]在一种可能的设计中,所述执行所述第一查询语句,并记录执行时长之后,所述方法还包括:
[0016]创建预期时间段对应的存储分区表;
[0017]在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群;
[0018]将所述圈选人群、所述圈选人群对应的执行时长存储在所述存储分区表中。
[0019]在一种可能的设计中,所述在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群之后,所述方法还包括:
[0020]标记所述圈选人群的版本,得到人群版本号。
[0021]在一种可能的设计中,所述当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件中,包括:
[0022]在所述预期时间段内,获取所述执行时长超出所述预期时长的次数,得到所述第一查询语句的超时次数;
[0023]若所述超时次数达到预期次数,则新增所述分类标签和标签筛选条件。
[0024]在一种可能的设计中,所述新增所述第一查询语句对应的分类标签和标签筛选条件之前,所述方法还包括:
[0025]生成包含所述第一查询语句的预警邮件;
[0026]向预设邮箱发送所述预警邮件。
[0027]在一种可能的设计中,所述生成包含所述第一查询语句的预警邮件之前,所述方法还包括:
[0028]检测所述第一查询语句是否符合预期编写规范;
[0029]若不符合所述预期编写规范,则获取修改后的第二查询语句,并重新判断所述第二查询语句的执行时长是否超出所述预期时长。
[0030]一种人群分类的标注装置,包括:
[0031]获取模块,用于获取预期圈选人群的第一查询语句;
[0032]执行模块,用于执行所述第一查询语句,并记录执行时长;
[0033]新增模块,用于当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;
[0034]筛选模块,用于在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;
[0035]标注模块,用于在所述待标注人群上,标注所述分类标签。
[0036]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述人群分类的标注方法的步骤。
[0037]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述人群分类的标注方法的步骤。
[0038]上述人群分类的标注方法、装置、计算机设备及存储介质,通过获取预期圈选人群的第一查询语句;执行第一查询语句,并记录执行时长;当执行时长超出预期时长时,则新增第一查询语句对应的分类标签和标签筛选条件;在待圈选人群中,筛选出符合标签筛选条件的待标注人群;在待标注人群上,标注分类标签。该方法将执行时长大于预期时长的第一查询语句对应出分类标签,在后续的人群分类中,可以直接依据分类标签,对待圈选人群进行筛选,然后直接标注该分类标签,有效改善了第一查询语句的执行性能影响人群分类的效率问题,进而提升了用户画像分析的效率。
附图说明
[0039]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0040]图1是本专利技术一实施例中人群分类的标注方法的一应用环境示意图;
[0041]图2是本专利技术一实施例中人群分类的标注方法的一流程示意图;
[0042]图3是本专利技术一实施例中人群分类的标注装置的一示意图;
[0043]图4是本专利技术一实施例中计算机设备的一示意图。
具体实施方式
[0044]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0045]本专利技术实施例提供的人群分类的标注方法,可应用在如图1的应用环境中,其中,终端设备通过网络与服务器进行通信,服务器通过终端设备获取第一查询语句以及待圈选人群。其中,终端设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0046]在一实施例中,如图2所示,提供一种人群分类的标注方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0047]S10:获取预期圈选人群的第一查询语句。
[0048]获取预期圈选人群的SQL查询语句,也就是第一查询语句。其中,人群指用户群体,包括但不仅限于某部电影的受众、某种产品的购买人群等。预期圈选人群指预期的目标用户群体,包含预期的目标用户。查询语句指能够在人群中查询出预期目标用户的程序语句。
[0049]S20:执行所述第一查询语句,并记录执行时长。
[0050]执行第一查询语句本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人群分类的标注方法,其特征在于,包括:获取预期圈选人群的第一查询语句;执行所述第一查询语句,并记录执行时长;当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;在所述待标注人群上,标注所述分类标签。2.如权利要求1所述人群分类的标注方法,其特征在于,所述记录执行时长,包括:记录所述第一查询语句的开始执行时间;记录所述第一查询语句的结束执行时间;将所述结束执行时间与所述开始执行时间相减,得出所述执行时长。3.如权利要求1所述人群分类的标注方法,其特征在于,所述执行所述第一查询语句,并记录执行时长之后,所述方法还包括:创建预期时间段对应的存储分区表;在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群;将所述圈选人群、所述圈选人群对应的执行时长存储在所述存储分区表中。4.如权利要求3所述用户画像的分析方法,其特征在于,所述在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群之后,所述方法还包括:标记所述圈选人群的版本,得到人群版本号。5.如权利要求3所述用户画像的分析方法,其特征在于,所述当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件中,包括:在所述预期时间段内,获取所述执行时长超出所述预期时长的次数,得到所述第一查询语句的超时次数;若所述超时次数达到预期次数,则新...

【专利技术属性】
技术研发人员:余辉
申请(专利权)人:深圳市酷开网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1