获得年龄占比的方法和装置、机器可读存储介质及处理器制造方法及图纸

技术编号:24091121 阅读:26 留言:0更新日期:2020-05-09 08:07
本发明专利技术实施例提供一种获得年龄占比的方法和装置、机器可读存储机制及处理器,属于数据处理领域。该方法包括:接收关于所述人群包的至少一个数据来源,其中所述至少一个数据来源中的每一数据来源包括划分的年龄段及每一年龄段的占比;以及基于所述至少一个数据来源中的每一数据来源所包括的年龄段及每一年龄段的占比确定所述人群包中每一年龄的占比。藉此,克服了第三方数据来源年龄段划分混乱的缺陷,实现了可以将关于人群包的数据来源中的数据与需要这些数据的系统中的年龄段进行合并,对于第三方数据来源人群包,可以按照系统年龄段进行随意切分,克服了单一信任某一数据来源导致数据不准确的缺陷。

Methods and devices for obtaining age share, machine-readable storage medium and processor

【技术实现步骤摘要】
获得年龄占比的方法和装置、机器可读存储介质及处理器
本专利技术涉及数据处理领域,具体地涉及一种获得年龄占比的方法和装置、机器可读存储机制及处理器。
技术介绍
从第三方数据来源获取到的人群包年龄比例占比,年龄段划分比较混乱,比如,对于相同的人群包,数据来源A划分两个年龄段,20-29岁和30-39岁;数据来源B划分为三个年龄段,20-24岁、24-29岁和30-39岁。所获取的数据来源中的数据不能与需要这些数据的系统中的年龄段进行合并。另外,对于具有不同数据来源的人群包,仅仅选择一个认为数据比较准确的数据来源。但是,对于相同的人群包,不同的数据来源年龄占比不同。例如,从数据来源A得知,20-29岁占34%,但是从数据来源B得知,20-29岁占12%。由此,单一的信任某一方的数据源,有可能数据不够准确。
技术实现思路
本专利技术的目的是提供一种获得年龄占比的方法和装置、机器可读存储机制及处理器,其可解决或至少部分解决上述问题。为了实现上述目的,本专利技术的一个方面提供一种获得人群包年龄占比的方法,该方法包括:接收关于所述人群包的至少一个数据来源,其中所述至少一个数据来源中的每一数据来源包括划分的年龄段及每一年龄段的占比;以及基于所述至少一个数据来源中的每一数据来源所包括的年龄段及每一年龄段的占比,确定所述人群包中每一年龄的占比。可选地,该方法还包括:接收对所述至少一个数据来源中的每一数据来源的权重的设置;其中,所述确定所述人群包中每一年龄的占比包括:基于每一数据来源所包括的年龄段、每一年龄段的占比以及每一数据来源的权重,确定所述人群包中每一年龄的占比。可选地,所述确定所述人群包中每一年龄的占比包括:基于每一数据来源所包括的年龄段、每一年龄段的占比、每一数据来源的权重以及每一年龄在所在数据来源中所处的年龄段的跨度,确定所述人群包中每一年龄的占比。可选地,所述确定人群包中每一年龄的占比为根据以下公式确定:其中,i表示年龄,Pi表示年龄i在所述人群包中的占比,j表示所述至少一个数据来源中的第j个数据来源,n表示所述至少一个数据来源的总数,qj表示第j个数据来源的权重,pij表示年龄i在第j个数据来源中所处于的年龄段的占比,Lij表示年龄i在第j个数据来源中所处于的年龄段的跨度。可选地,所述方法还包括:根据所述人群包的总人数和所述人群包中每一年龄的占比,得到所述人群包中每一年龄的人数。可选地,所述方法还包括:根据各个预设年龄段和所述人群包中每一年龄的占比,得到所述人群包中各个预设年龄段的占比。相应地,本专利技术的另一方面提供一种获得人群包年龄占比的装置,该装置包括:第一接收模块,用于接收关于所述人群包的至少一个数据来源,其中所述至少一个数据来源中的每一数据来源包括划分的年龄段及每一年龄段的占比;以及确定模块,用于基于所述至少一个数据来源中的每一数据来源所包括的年龄段及每一年龄段的占比确定所述人群包中每一年龄的占比。可选地,该装置还包括:第二接收模块,用于接收对所述至少一个数据来源中的每一数据来源的权重的设置;其中,所述确定模块确定每一年龄的占比还基于所设置的每一数据来源的权重。此外,本专利技术的另一方面还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的方法。另外,本专利技术的另一方面还提供一种处理器,其特征在于,用于运行程序,其中,所述程序被运行时用于执行上述的方法。通过上述技术方案,基于关于人群包的至少一个数据来源中的每一数据来源确定人群包中每一年龄的占比,如此,对年龄段划分比较混乱的第三方数据来源进行整合,克服第三方数据来源年龄段划分混乱的缺陷。此外,在基于关于人群包的至少一个数据来源确定每一年龄的占比后,需要人群包数据的系统可以根据自己系统中的年龄段的划分基于所确定的每一年龄的占比得到各个年龄段的占比,例如,将某一年龄段所包括的年龄对应的占比求和得到该年龄段的占比,如此,可以将关于人群包的数据来源中的数据与需要这些数据的系统中的年龄段进行合并,对于第三方数据来源人群包,可以按照系统年龄段进行随意切分,或者,可以根据需要对确定的每一年龄的占比进行自由组合,得到需要的年龄段划分的占比。另外,在确定人群包中的每一年龄的占比时,基于关于人群包的至少一个数据来源中的每一数据来源进行确定,如此,克服了单一信任某一数据来源导致数据不准确的缺陷。本专利技术的其它特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术实施例,但并不构成对本专利技术实施例的限制。在附图中:图1是本专利技术一实施例提供的获得人群包年龄占比的方法的流程图;以及图2是本专利技术一实施例提供的获得人群包年龄占比的装置的结构框图。附图标记说明1第一接收模块2确定模块具体实施方式以下结合附图对本专利技术实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本专利技术实施例,并不用于限制本专利技术实施例。本专利技术实施例的一个方面提供一种获得人群包年龄占比的方法。图1是本专利技术一实施例提供的获得人群包年龄占比的方法的流程图。如图1所示,该方法包括以下步骤。在步骤S10中,接收关于人群包的至少一个数据来源,其中至少一个数据来源中的每一数据来源包括划分的年龄段及每一年龄段的占比。其中,接收至少一个数据来源可以是通过与数据来源提供方通信进行接收。关于某一人群包的数据来源包括多个,每个数据来源包括该数据来源中划分的年龄段及每一年龄段在该人群包中的占比。例如,一个包含一万人的人群包,关于该人群包有三个数据来源,其中,各个数据来源中的年龄段划分及每一年龄段的占比如下:数据来源A:20-29岁60%,30-39岁40%;数据来源B:20-24岁20%,25-29岁40%,30-34岁30%,35-39岁10%;数据来源C:20岁5%,21岁5%,22岁5%,23岁5%,24岁5%,25岁5%,26岁5%,27岁5%,28岁5%,29岁5%,30岁5%,31岁5%,32岁5%,33岁5%,34岁5%,35岁5%,36岁5%,37岁5%,38岁5%,39岁5%。在步骤S11中,基于至少一个数据来源中的每一数据来源所包括的年龄段及每一年龄段的占比,确定人群包中每一年龄的占比。例如,基于关于人群包的每一数据来源,分别确定人群包中的某一年龄的人数,将根据每一数据来源确定出的该年龄的人数求和除以数据来源的总数得到该年龄的人数的平均值,将该平均值除以人群包的总人数得到该年龄的占比。用同样的方法求和人群包中的每一年龄的占比。比如,以上述包括一万人的人群包为例,假设求20岁的占比。基于数据来源A,将总人数乘以20岁所在的年龄段的占比除以所在年龄段的跨度求出基于数据来源A确定出的20岁的总人数,经过求解为600。基于同样的方法,分别求出基于数据来源B和数据本文档来自技高网...

【技术保护点】
1.一种获得人群包年龄占比的方法,其特征在于,该方法包括:/n接收关于所述人群包的至少一个数据来源,其中所述至少一个数据来源中的每一数据来源包括划分的年龄段及每一年龄段的占比;以及/n基于所述至少一个数据来源中的每一数据来源所包括的年龄段及每一年龄段的占比,确定所述人群包中每一年龄的占比。/n

【技术特征摘要】
1.一种获得人群包年龄占比的方法,其特征在于,该方法包括:
接收关于所述人群包的至少一个数据来源,其中所述至少一个数据来源中的每一数据来源包括划分的年龄段及每一年龄段的占比;以及
基于所述至少一个数据来源中的每一数据来源所包括的年龄段及每一年龄段的占比,确定所述人群包中每一年龄的占比。


2.根据权利要求1所述的方法,其特征在于,该方法还包括:
接收对所述至少一个数据来源中的每一数据来源的权重的设置;
其中,所述确定所述人群包中每一年龄的占比包括:基于每一数据来源所包括的年龄段、每一年龄段的占比以及每一数据来源的权重,确定所述人群包中每一年龄的占比。


3.根据权利要求2所述的方法,其特征在于,所述确定所述人群包中每一年龄的占比包括:基于每一数据来源所包括的年龄段、每一年龄段的占比、每一数据来源的权重以及每一年龄在所在数据来源中所处的年龄段的跨度,确定所述人群包中每一年龄的占比。


4.根据权利要求3所述的方法,其特征在于,所述确定所述人群包中每一年龄的占比为根据以下公式确定:



其中,i表示年龄,Pi表示年龄i在所述人群包中的占比,j表示所述至少一个数据来源中的第j个数据来源,n表示所述至少一个数据来源的总数,qj表示第j个数据来源的权重,pij表示年龄i在第j个数据来源中所处于的年龄段的占比,Lij表示年龄i在第j个...

【专利技术属性】
技术研发人员:华尔泽唐露
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1