用于生成信息的方法和装置制造方法及图纸

技术编号:17780400 阅读:26 留言:0更新日期:2018-04-22 09:16
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,特征信息包括用户信息和用户行为信息;从多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。该实施方式通过利用目标用户的特征信息可以生成任一业务类型用户对应的特征信息集合,提高了信息生成方法的通用性。

【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及用于生成信息的方法和装置。
技术介绍
不同业务对不同的用户群需要提供个性化的信息推送等服务,因此,不同业务在为用户群提供信息推送等服务之前,必须要对用户群有一个了解。为了实现各行业对用户群的了解,我们往往需要借助用户的用户信息和用户行为信息等方面的特征信息,并对用户的特征信息进行集合划分,从而实现为用户提供个性化的服务和产品。现有技术中,通常需要通过设计与业务类型相关的人群问卷或在相关网站进行埋点等方式获取用户的特征信息来生成用户的特征信息集合。并且对于不同类型的业务,通常需要采用不同的人群问卷或网站埋点获取用户的特征信息来生成用户的特征信息集合。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,特征信息包括用户信息和用户行为信息;从多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。在一些实施例中,方法还包括:分析各特征信息集合中的特征信息,确定各特征信息集合的区别特征信息,其中,区别特征信息用于区别所采集的特征信息和特征信息集合。在一些实施例中,基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合,包括:设置K值,其中,K为预设的特征信息集合的个数,且K为正整数;基于K值,执行如下聚类步骤:利用K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分析,生成M个特征信息集合,其中,M为正整数;如果M≥K-N,则确定特征信息集合的目标数目为M,其中,N为预先设置的可容忍缺失的特征信息集合的个数,且N为正整数;如果M<K-N,则将K+1作为K值继续执行聚类步骤。在一些实施例中,分析各特征信息集合中的特征信息,确定各特征信息集合的区别特征信息,包括:分别为各特征信息集合建立用户画像群,并根据特征信息集合中的特征信息对各用户画像群中的用户画像进行多维度描述;确定每个用户画像群中具有第一维度的特征信息的用户画像数量在该用户画像群中所占的第一比例,其中,第一维度为用户画像描述的任一维度;确定各目标用户中具有第一维度的特征信息的用户数量在各目标用户中所占的第二比例;计算第二比例与第一比例的比值,并按照比值从大到小的顺序排列各特征信息集合生成特征信息集合队列;从特征信息集合队列中依次获取第一预设数目的特征信息集合,将第一维度的特征信息作为所获取的特征信息集合的区别特征信息。在一些实施例中,方法还包括:确定第一用户画像群中兴趣维度的特征信息的用户画像数量在该第一用户画像群中所占的第三比例,其中,第一用户画像群为任一用户画像群;响应于判断出第三比例大于预设阈值,则确定该兴趣维度的特征信息为第一用户画像群对应的特征信息集合的区别特征信息。在一些实施例中,方法还包括:对所采集的特征信息进行聚类分析,得到多个预留特征信息集合,确定各预留特征信息集合的标签;根据任一特征信息集合与各预留特征信息集合的相似度,确定该特征信息集合的标签。第二方面,本申请实施例提供了一种用于生成信息的装置,装置包括:采集单元,配置用于采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,特征信息包括用户信息和用户行为信息;选取单元,配置用于从多个维度中选取与目标业务类型相关的维度;聚类单元,配置用于基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。在一些实施例中,装置还包括:确定单元,配置用于分析各特征信息集合中的特征信息,确定各特征信息集合的区别特征信息,其中,区别特征信息用于区别所采集的特征信息和特征信息集合。在一些实施例中,聚类单元包括:设置模块,配置用于设置K值,其中,K为预设的特征信息集合的个数,且K为正整数;第一执行模块,配置用于基于K值,执行如下聚类步骤:利用K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分析,生成M个特征信息集合,其中,M为正整数;如果M≥K-N,则确定特征信息集合的目标数目为M,其中,N为预先设置的可容忍缺失的特征信息集合的个数,且N为正整数;第二执行模块,配置用于如果M<K-N,则将K+1作为K值继续执行聚类步骤。在一些实施例中,确定单元具体配置用于:分别为各特征信息集合建立用户画像群,并根据特征信息集合中的特征信息对各用户画像群中的用户画像进行多维度描述;确定每个用户画像群中具有第一维度的特征信息的用户画像数量在该用户画像群中所占的第一比例,其中,第一维度为用户画像描述的任一维度;确定各目标用户中具有第一维度的特征信息的用户数量在各目标用户中所占的第二比例;计算第二比例与第一比例的比值,并按照比值从大到小的顺序排列各特征信息集合生成特征信息集合队列;从特征信息集合队列中依次获取第一预设数目的特征信息集合,将第一维度的特征信息作为所获取的特征信息集合的区别特征信息。在一些实施例中,确定单元进一步配置用于:确定第一用户画像群中兴趣维度的特征信息的用户画像数量在该第一用户画像群中所占的第三比例,其中,第一用户画像群为任一用户画像群;响应于判断出第三比例大于预设阈值,则确定该兴趣维度的特征信息为第一用户画像群对应的特征信息集合的区别特征信息。在一些实施例中,装置还包括标签设置单元,配置用于:对所采集的特征信息进行聚类分析,得到多个预留特征信息集合,确定各预留特征信息集合的标签;根据任一特征信息集合与各预留特征信息集合的相似度,确定该特征信息集合的标签。本申请实施例提供的用于生成信息的方法和装置,通过采集所有目标用户的用户信息和用户行为信息作为特征信息,之后对采集到的特征信息进行维度划分,而后从各维度中获取与目标业务类型相关的维度,最后对所获取维度的特征信息进行聚类分析可以得到目标数目的特征信息集合,从而通过有效地利用目标用户的特征信息,实现生成任意业务类型的特征信息集合的目的,提高了生成信息方法的通用性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于生成信息的方法的一个实施例的流程图;图3是根据本申请的用于生成信息的方法的一个应用场景的示意图;图4是根据本申请的用于生成信息的的又一个实施例的流程图;图5是根据本申请的用于生成信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于生成信息的方法或用于生成信息的装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和本文档来自技高网...
用于生成信息的方法和装置

【技术保护点】
一种用于生成信息的方法,包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;从所述多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。

【技术特征摘要】
1.一种用于生成信息的方法,包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;从所述多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。2.根据权利要求1所述的方法,其中,所述方法还包括:分析各所述特征信息集合中的特征信息,确定各所述特征信息集合的区别特征信息,其中,所述区别特征信息用于区别所采集的特征信息和所述特征信息集合。3.根据权利要求1所述的方法,其中,所述基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合,包括:设置K值,其中,K为预设的所述特征信息集合的个数,且K为正整数;基于所述K值,执行如下聚类步骤:利用所述K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分析,生成M个所述特征信息集合,其中,M为正整数;如果M≥K-N,则确定所述特征信息集合的目标数目为M,其中,N为预先设置的可容忍缺失的特征信息集合的个数,且N为正整数;如果M<K-N,则将K+1作为所述K值继续执行所述聚类步骤。4.根据权利要求2所述的方法,其中,所述分析各所述特征信息集合中的特征信息,确定各所述特征信息集合的区别特征信息,包括:分别为各所述特征信息集合建立用户画像群,并根据所述特征信息集合中的特征信息对各所述用户画像群中的用户画像进行多维度描述;确定每个所述用户画像群中具有第一维度的特征信息的用户画像数量在该所述用户画像群中所占的第一比例,其中,所述第一维度为所述用户画像描述的任一维度;确定各所述目标用户中具有第一维度的特征信息的用户数量在各所述目标用户中所占的第二比例;计算所述第二比例与所述第一比例的比值,并按照所述比值从大到小的顺序排列各所述特征信息集合生成特征信息集合队列;从所述特征信息集合队列中依次获取第一预设数目的所述特征信息集合,将所述第一维度的特征信息作为所获取的特征信息集合的区别特征信息。5.根据权利要求4所述的方法,其中,所述方法还包括:确定第一用户画像群中兴趣维度的特征信息的用户画像数量在该所述第一用户画像群中所占的第三比例,其中,所述第一用户画像群为任一所述用户画像群;响应于判断出所述第三比例大于预设阈值,则确定该所述兴趣维度的特征信息为所述第一用户画像群对应的特征信息集合的区别特征信息。6.根据权利要求1所述的方法,其中,所述方法还包括:对所采集的特征信息进行聚类分析,得到多个预留特征信息集合,确定各所述预留特征信息集合的标签;根据任一所述特征信息集合与各所述预留特征信息集合的相似度,确定该所述特征信息集合的标签。7.一种用于生成信息的装置,包括:采集单元,配置用于采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;选取单元,配置用于...

【专利技术属性】
技术研发人员:康建峰孙健闻波
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1