【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及用于生成信息的方法和装置。
技术介绍
不同业务对不同的用户群需要提供个性化的信息推送等服务,因此,不同业务在为用户群提供信息推送等服务之前,必须要对用户群有一个了解。为了实现各行业对用户群的了解,我们往往需要借助用户的用户信息和用户行为信息等方面的特征信息,并对用户的特征信息进行集合划分,从而实现为用户提供个性化的服务和产品。现有技术中,通常需要通过设计与业务类型相关的人群问卷或在相关网站进行埋点等方式获取用户的特征信息来生成用户的特征信息集合。并且对于不同类型的业务,通常需要采用不同的人群问卷或网站埋点获取用户的特征信息来生成用户的特征信息集合。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,特征信息包括用户信息和用户行为信息;从多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。在一些实施例中,方法还包括:分析各特征信息集合中的特征信息,确定各特征信息集合的区别特征信息,其中,区别特征信息用于区别所采集的特征信息和特征信息集合。在一些实施例中,基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合,包括:设置K值,其中,K为预设的特征信息集合的个数,且K为正整数;基于K值,执行如下聚类步骤:利用K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分 ...
【技术保护点】
一种用于生成信息的方法,包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;从所述多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。
【技术特征摘要】
1.一种用于生成信息的方法,包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;从所述多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。2.根据权利要求1所述的方法,其中,所述方法还包括:分析各所述特征信息集合中的特征信息,确定各所述特征信息集合的区别特征信息,其中,所述区别特征信息用于区别所采集的特征信息和所述特征信息集合。3.根据权利要求1所述的方法,其中,所述基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合,包括:设置K值,其中,K为预设的所述特征信息集合的个数,且K为正整数;基于所述K值,执行如下聚类步骤:利用所述K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分析,生成M个所述特征信息集合,其中,M为正整数;如果M≥K-N,则确定所述特征信息集合的目标数目为M,其中,N为预先设置的可容忍缺失的特征信息集合的个数,且N为正整数;如果M<K-N,则将K+1作为所述K值继续执行所述聚类步骤。4.根据权利要求2所述的方法,其中,所述分析各所述特征信息集合中的特征信息,确定各所述特征信息集合的区别特征信息,包括:分别为各所述特征信息集合建立用户画像群,并根据所述特征信息集合中的特征信息对各所述用户画像群中的用户画像进行多维度描述;确定每个所述用户画像群中具有第一维度的特征信息的用户画像数量在该所述用户画像群中所占的第一比例,其中,所述第一维度为所述用户画像描述的任一维度;确定各所述目标用户中具有第一维度的特征信息的用户数量在各所述目标用户中所占的第二比例;计算所述第二比例与所述第一比例的比值,并按照所述比值从大到小的顺序排列各所述特征信息集合生成特征信息集合队列;从所述特征信息集合队列中依次获取第一预设数目的所述特征信息集合,将所述第一维度的特征信息作为所获取的特征信息集合的区别特征信息。5.根据权利要求4所述的方法,其中,所述方法还包括:确定第一用户画像群中兴趣维度的特征信息的用户画像数量在该所述第一用户画像群中所占的第三比例,其中,所述第一用户画像群为任一所述用户画像群;响应于判断出所述第三比例大于预设阈值,则确定该所述兴趣维度的特征信息为所述第一用户画像群对应的特征信息集合的区别特征信息。6.根据权利要求1所述的方法,其中,所述方法还包括:对所采集的特征信息进行聚类分析,得到多个预留特征信息集合,确定各所述预留特征信息集合的标签;根据任一所述特征信息集合与各所述预留特征信息集合的相似度,确定该所述特征信息集合的标签。7.一种用于生成信息的装置,包括:采集单元,配置用于采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;选取单元,配置用于...
【专利技术属性】
技术研发人员:康建峰,孙健,闻波,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。