兴趣特征确定方法、装置、设备及存储介质制造方法及图纸

技术编号:25044009 阅读:41 留言:0更新日期:2020-07-29 05:34
本发明专利技术公开了一种兴趣特征确定方法、装置、设备及存储介质。该方法包括:根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,第三用户群体包括第一用户群体和第二用户群体,能够提高识别用户群体的准确性和群体特征丰富性。

【技术实现步骤摘要】
兴趣特征确定方法、装置、设备及存储介质
本专利技术属于大数据
,尤其涉及一种兴趣特征确定方法、装置、设备及存储介质。
技术介绍
随着大数据的快速发展,各大运营商开始从单一的通讯服务提供商逐渐转变为多元化的信息服务提供商。因此,运营商的产业链和价值链也需要更加丰富,那么运营商所拥有的用户成为了运营商的价值链中的核心。而将用户作为运营商的价值链中的核心,需要构建完善的用户标签体系,准确描述用户特征,进而为用户提供差异化的服务信息。用户标签体系对运营商挖掘用户的意图、活动规律和潜在的兴趣爱好等重要信息具有重要的意义。但是,通过用户标签体系识别用户群体的准确性低且群体特征丰富性差。
技术实现思路
本专利技术实施例提供一种兴趣特征确定方法、装置、设备及存储介质,能够解决识别用户群体的准确性低且群体特征丰富性差的问题。第一方面,提供了一种兴趣特征确定方法,该方法包括:根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,第三用户群体包括第一用户群体和第二用户群体。在一种可能的实现方式中,根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图,包括:根据多个用户的用户兴趣特征信息,提取每个用户的兴趣特征向量;根据每个用户的兴趣特征向量,计算用户之间兴趣特征的相似度;根据用户之间兴趣特征的相似度,生成用户兴趣特征图。在一种可能的实现方式中,根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体,包括:根据用户关系图和用户兴趣特征图,生成用户关系兴趣特征向量;根据用户关系兴趣特征向量,确定用户的中心度;中心度表示用户在社交网络中的重要度;根据中心度,确定第一用户群体和第二用户群体。在一种可能的实现方式中,基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征,包括:对第一用户群体进行聚类,得到第一用户群体的目标聚类子集;计算第二用户群体和第一用户群体之间的兴趣主题的相似度;将第二用户群体和第一用户群体之间的兴趣主题的相似度最高对应的第二用户群体加入到第一用户群体的聚类子集中,得到用户群体聚类子集和用户群体聚类子集的兴趣特征;根据用户群体聚类子集和用户群体聚类子集的兴趣特征,确定第三用户群体的兴趣特征。在一种可能的实现方式中,对第一用户群体进行聚类,得到第一用户群体的目标聚类子集,包括:获取第一用户群体中用户对不同兴趣主题的兴趣特征值;针对所述第一用户群体,迭代下述步骤一至步骤三:步骤一:确定所述第一用户群体中的聚类子集;步骤二:根据所述第一用户群体中用户对不同兴趣主题的兴趣特征值,确定所述聚类子集对不同兴趣主题的支持度;步骤三:根据所述支持度,确定所述聚类子集对不同兴趣主题的信息模糊度;当第一用户群体中用户对不同兴趣主题的信息模糊度为零或者迭代次数达到预设的次数阈值时,得到第一用户群体的目标聚类子集。在一种可能的实现方式中,该方法包括:根据用户群体聚类子集的兴趣特征,计算用户群体聚类子集对兴趣主题集合的差异度;兴趣主题集合是由不同兴趣主题组成的集合;根据差异度确定兴趣特征的均值;当兴趣特征中的兴趣特征值为零时,将兴趣特征值替换为均值。在一种可能的实现方式中,该方法还包括:根据第一用户群体中用户对不同兴趣主题的兴趣特征值,计算第一用户群体的聚类子集的差异度。第二方面,提供了一种兴趣特征确定装置,其特征在于,该装置包括:关系图生成模块,用于根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;特征图生成模块,用于根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;群体确定模块,用于根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;特征确定模块,用于基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,第三用户群体包括第一用户群体和第二用户群体。第三方面,提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面或者第一方面的任一可能实现方式中的方法。第四方面,提供了一种计算机存储介质,该计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面的任一可能实现方式中的方法。基于提供的兴趣特征确定方法、装置、设备及存储介质,通过根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,第三用户群体包括第一用户群体和第二用户群体,能够提高识别用户群体的准确性和群体特征丰富性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种兴趣特征确定方法的流程示意图;图2是本专利技术实施例提供的一种用户关系图;图3是本专利技术实施例提供的一种用户兴趣特征图;图4是本专利技术实施例提供的一种用户和用户之间的关系-兴趣特征图;图5是本专利技术实施例提供的一种兴趣特征确定装置的结构示意图;图6是本专利技术实施例提供的电子设备的结构示意图。具体实施方式下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本专利技术,并不被配置为限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另本文档来自技高网...

【技术保护点】
1.一种兴趣特征确定方法,其特征在于,所述方法包括:/n根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;/n根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;/n根据所述用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;/n基于所述第二用户群体,对所述第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,所述第三用户群体包括所述第一用户群体和所述第二用户群体。/n

【技术特征摘要】
1.一种兴趣特征确定方法,其特征在于,所述方法包括:
根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;
根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;
根据所述用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;
基于所述第二用户群体,对所述第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,所述第三用户群体包括所述第一用户群体和所述第二用户群体。


2.根据权利要求1所述的方法,其特征在于,所述根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图,包括:
根据所述多个用户的用户兴趣特征信息,提取每个用户的兴趣特征向量;
根据所述每个用户的兴趣特征向量,计算用户之间兴趣特征的相似度;
根据所述用户之间兴趣特征的相似度,生成所述用户兴趣特征图。


3.根据权利要求1所述的方法,其特征在于,所述根据所述用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体,包括:
根据所述用户关系图和所述用户兴趣特征图,生成用户关系兴趣特征向量;
根据所述用户关系兴趣特征向量,确定用户的中心度;所述中心度表示所述用户在社交网络中的重要度;
根据所述中心度,确定所述第一用户群体和所述第二用户群体。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述第二用户群体,对所述第一用户群体进行聚类,确定第三用户群体的兴趣特征,包括:
对所述第一用户群体进行聚类,得到所述第一用户群体的聚类子集;
计算所述第二用户群体和所述第一用户群体之间的兴趣主题的相似度;
将所述第二用户群体和所述第一用户群体之间的兴趣主题的相似度最高对应的第二用户群体加入到所述第一用户群体的聚类子集中,得到用户群体聚类子集和所述用户群体聚类子集的兴趣特征;
根据所述用户群体聚类子集和所述用户群体聚类子集的兴趣特征,确定所述第三用户群体的兴趣特征。


5.根据权利要求4所述的方法,其特征在于,所述对所述第一用户群体进行聚类,得到所述第一用户群体的聚类子集,包括:<...

【专利技术属性】
技术研发人员:曾瑞邵波冀宇
申请(专利权)人:中国移动通信集团黑龙江有限公司中国移动通信集团有限公司
类型:发明
国别省市:黑龙;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1