一种相似人群扩展方法、装置及电子设备制造方法及图纸

技术编号:21400803 阅读:36 留言:0更新日期:2019-06-19 07:29
本发明专利技术实施例提供了一种相似人群扩展方法、装置及电子设备,涉及推荐技术领域,可以提高获取相似人群的速度。本申请的实施例包括:确定种子用户集中各种子用户所属的目标类簇,其中,种子用户集包括至少一个种子用户;然后确定候选用户与种子用户集的相似度,其中,候选用户为目标类簇中除种子用户外的用户;再按照相似度从高到低的顺序,选择第一预设数量个候选用户,确定所选择的候选用户为种子用户集的相似用户集。

【技术实现步骤摘要】
一种相似人群扩展方法、装置及电子设备
本专利技术涉及推荐
,特别是涉及一种相似人群扩展方法、装置及电子设备。
技术介绍
目前,为满足广告主投放广告的需求,互联网领域已经有一些技术可以提供“相似人群拓展功能”,该功能可以基于定制的种子用户的特征,寻找与种子用户相似的用户,从而自动实现规模化的相似人群拓展,帮助广告主高效地找到潜在的用户,提高了人群圈选和广告投放的效率。现有的人群扩展算法中,一般是预先通过种子用户和非种子用户的数据对分类模型进行训练,然后在进行相似人群扩展时,将用户池中每个用户的数据逐一输入训练好的分类模型中,根据分类结果确定用户池中的每个用户是否为与种子用户相似的用户,从而从用户池中筛选出相似人群。但是采用这种方法,每次训练出的分类模型只能用于特定的种子用户的相似人群扩展,若需对其他种子用户进行相似人群扩展,则需要重新训练分类模型。并且在通过分类模型筛选相似人群时,需要逐一判断用户池中每个用户是否为属于相似人群,效率较低。
技术实现思路
本专利技术实施例的目的在于提供一种相似人群扩展方法、装置及电子设备,以实现提高获取相似人群的效率。具体技术方案如下:第一方面,提供了一种相似人群扩展方法,所述方法包括:确定种子用户集中各种子用户所属的目标类簇;所述种子用户集包括至少一个种子用户;确定候选用户与所述种子用户集的相似度;所述候选用户为所述目标类簇中除所述种子用户外的用户;按照相似度从高到低的顺序,选择第一预设数量个候选用户,确定所选择的候选用户为所述种子用户集的相似用户集。可选的,在所述确定种子用户集中各种子用户所属的目标类簇步骤之前,所述方法还包括:根据用户池中各用户的用户画像信息,确定所述用户池中各用户在各指定维度的特征值,所述用户画像信息中包括所述指定维度对应的用户信息,所述用户在指定维度的特征值用于反映该用户在所述指定维度的偏好程度;根据所述用户池中各用户在各指定维度的特征值,对所述用户池中的用户进行聚类,将所述用户池中的用户分为至少两个类簇;所述确定种子用户集中各种子用户所属的目标类簇,包括:从所述用户池中,选取种子用户集中各种子用户所属的目标类簇。可选的,所述确定候选用户与所述种子用户集的相似度,包括:针对每一指定维度,根据所述种子用户集中各种子用户在所述指定维度的特征值,以及所述用户池中各用户在所述指定维度的特征值,确定所述指定维度的权重;针对每一候选用户,根据各指定维度的权重,对所述候选用户在各指定维度的特征值加权求和,得到该候选用户与所述种子用户集的相似度。可选的,所述根据所述种子用户集中各种子用户在所述指定维度的特征值,以及所述用户池中各用户在所述指定维度的特征值,确定所述指定维度的权重,包括:针对每一指定维度,确定在所述种子用户集中满足预设条件的种子用户的数量为该指定维度对应的第一权重子参数,确定在所述用户池中满足所述预设条件的用户的数量为该指定维度对应的第二权重子参数;所述预设条件为用户在该指定维度的特征值属于预设目标区间;针对每一指定维度,确定该指定维度对应的第一权重子参数与所述种子用户集中种子用户的总数量的比值,为该指定维度的第一权重参数;确定该指定维度对应的第二权重子参数,与所述用户池中用户的总数量的比值,为该指定维度的第二权重参数;根据各指定维度的第一权重参数和第二权重参数,利用下述公式,计算各指定维度的权重:其中,Wi为第i个指定维度的权重,Ai为第i个指定维度的第一权重参数,Bi为第i个指定维度的第二权重参数,a和b均为预设常数。可选的,所述方法还包括:若所述目标类簇中候选用户总数小于所述第一预设数量,则在所述用户池中选择除所述目标类簇以外的至少一个类簇,作为备选类簇;所述备选类簇中用户的总数不小于第二预设数量;所述第二预设数量为所述第一预设数量与所述候选用户总数的差值;确定所述备选类簇中各用户与所述种子用户集的相似度;按照相似度从高到低的顺序,从所述备选类簇中选择所述第二预设数量个用户加入所述相似用户集。第二方面,还提供了一种相似人群扩展装置,所述装置包括:确定模块,用于确定种子用户集中各种子用户所属的目标类簇;所述种子用户集包括至少一个种子用户;确定候选用户与所述种子用户集的相似度;所述候选用户为所述目标类簇中除所述种子用户外的用户;选择模块,用于按照相似度从高到低的顺序,选择第一预设数量个候选用户,确定所选择的候选用户为所述种子用户集的相似用户集。可选的,该装置还包括:聚类模块;所述确定模块,在执行所述确定种子用户集中各种子用户所属的目标类簇步骤之前,还用于根据用户池中各用户的用户画像信息,确定所述用户池中各用户在各指定维度的特征值,所述用户画像信息中包括所述指定维度对应的用户信息,所述用户在指定维度的特征值用于反映该用户在所述指定维度的偏好程度;所述聚类模块,用于根据所述确定模块确定的所述用户池中各用户在各指定维度的特征值,对所述用户池中的用户进行聚类,将所述用户池中的用户分为至少两个类簇;在执行所述确定种子用户集中各种子用户所属的目标类簇步骤时,所述确定模块具体用于:从所述用户池中,选取种子用户集中各种子用户所属的目标类簇。可选的,所述确定模块,具体用于:针对每一指定维度,根据所述种子用户集中各种子用户在所述指定维度的特征值,以及所述用户池中各用户在所述指定维度的特征值,确定所述指定维度的权重;针对每一候选用户,根据各指定维度的权重,对所述候选用户在各指定维度的特征值加权求和,得到该候选用户与所述种子用户集的相似度。可选的,所述确定模块,具体用于:针对每一指定维度,确定在所述种子用户集中满足预设条件的种子用户的数量为该指定维度对应的第一权重子参数,确定在所述用户池中满足所述预设条件的用户的数量为该指定维度对应的第二权重子参数;所述预设条件为用户在该指定维度的特征值属于预设目标区间;针对每一指定维度,确定该指定维度对应的第一权重子参数与所述种子用户集中种子用户的总数量的比值,为该指定维度的第一权重参数;确定该指定维度对应的第二权重子参数,与所述用户池中用户的总数量的比值,为该指定维度的第二权重参数;根据各指定维度的第一权重参数和第二权重参数,利用下述公式,计算各指定维度的权重:其中,Wi为第i个指定维度的权重,Ai为第i个指定维度对应的第一权重参数,Bi为第i个指定维度对应的第二权重参数,a和b均为预设常数。可选的,所述选择模块,还用于若所述目标类簇中候选用户总数小于所述第一预设数量,则在所述用户池中选择除所述目标类簇以外的至少一个类簇,作为备选类簇;所述备选类簇中用户的总数不小于第二预设数量;所述第二预设数量为所述第一预设数量与所述候选用户总数的差值;所述确定模块,还用于确定所述选择模块选择的所述备选类簇中各用户与所述种子用户集的相似度;所述选择模块,还用于按照相似度从高到低的顺序,从所述备选类簇中选择所述第二预设数量个用户加入所述相似用户集。第三方面,提供了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一相似人群扩展方法的步骤。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,本文档来自技高网...

【技术保护点】
1.一种相似人群扩展方法,其特征在于,所述方法包括:确定种子用户集中各种子用户所属的目标类簇;所述种子用户集包括至少一个种子用户;确定候选用户与所述种子用户集的相似度;所述候选用户为所述目标类簇中除所述种子用户外的用户;按照相似度从高到低的顺序,选择第一预设数量个候选用户,确定所选择的候选用户为所述种子用户集的相似用户集。

【技术特征摘要】
1.一种相似人群扩展方法,其特征在于,所述方法包括:确定种子用户集中各种子用户所属的目标类簇;所述种子用户集包括至少一个种子用户;确定候选用户与所述种子用户集的相似度;所述候选用户为所述目标类簇中除所述种子用户外的用户;按照相似度从高到低的顺序,选择第一预设数量个候选用户,确定所选择的候选用户为所述种子用户集的相似用户集。2.根据权利要求1所述的方法,其特征在于,在所述确定种子用户集中各种子用户所属的目标类簇步骤之前,所述方法还包括:根据用户池中各用户的用户画像信息,确定所述用户池中各用户在各指定维度的特征值,所述用户画像信息中包括所述指定维度对应的用户信息,所述用户在指定维度的特征值用于反映该用户在所述指定维度的偏好程度;根据所述用户池中各用户在各指定维度的特征值,对所述用户池中的用户进行聚类,将所述用户池中的用户分为至少两个类簇;所述确定种子用户集中各种子用户所属的目标类簇,包括:从所述用户池中,选取种子用户集中各种子用户所属的目标类簇。3.根据权利要求2所述的方法,其特征在于,所述确定候选用户与所述种子用户集的相似度,包括:针对每一指定维度,根据所述种子用户集中各种子用户在所述指定维度的特征值,以及所述用户池中各用户在所述指定维度的特征值,确定所述指定维度的权重;针对每一候选用户,根据各指定维度的权重,对所述候选用户在各指定维度的特征值加权求和,得到该候选用户与所述种子用户集的相似度。4.根据权利要求3所述的方法,其特征在于,所述根据所述种子用户集中各种子用户在所述指定维度的特征值,以及所述用户池中各用户在所述指定维度的特征值,确定所述指定维度的权重,包括:针对每一指定维度,确定在所述种子用户集中满足预设条件的种子用户的数量为该指定维度对应的第一权重子参数,确定在所述用户池中满足所述预设条件的用户的数量为该指定维度对应的第二权重子参数;所述预设条件为用户在该指定维度的特征值属于预设目标区间;针对每一指定维度,确定该指定维度对应的第一权重子参数与所述种子用户集中种子用户的总数量的比值,为该指定维度的第一权重参数;确定该指定维度对应的第二权重子参数,与所述用户池中用户的总数量的比值,为该指定维度的第二权重参数;根据各指定维度的第一权重参数和第二权重参数,利用下述公式,计算各指定维度的权重:其中,Wi为第i个指定维度的权重,Ai为第i个指定维度的第一权重参数,Bi为第i个指定维度的第二权重参数,a和b均为预设常数。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述目标类簇中候选用户总数小于所述第一预设数量,则在所述用户池中选择除所述目标类簇以外的至少一个类簇,作为备选类簇;所述备选类簇中用户的总数不小于第二预设数量;所述第二预设数量为所述第一预设数量与所述候选用户总数的差值;确定所述备选类簇中各用户与所述种子用户集的相似度;按照相似度从高到低的顺序,从所述备选类簇中选择所述第二预设数量个用户加入所述相似用户集。6.一种相似人群扩展装置,其特征在于,所述装置包括:确定模块,用于确定种子用户集中各种子用户所属的目标类簇;所述种子用户集包括至少一个种子用户;确定候...

【专利技术属性】
技术研发人员:孙逸
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1