【技术实现步骤摘要】
网络社区的发现方法、装置、电子设备及可读存储介质
本专利技术涉及社区发现
,具体而言,本专利技术涉及一种网络社区的发现方法、装置、电子设备及可读存储介质。
技术介绍
社区发现,即用来发现网络中的社区结构,对网络结构中具有相似性属性的实体集进行划分和提取,是一种广义的聚类算法。一个网络社区相当于聚类中的一个簇(类)。近年来,各种社区发现算法己经被提出,但这些算法大都是单源社区发现算法。单源社区发现算法是根据单个数据源的数据特征将数据实例划分为若干个社区,使社区内数据实例的相似性较大,社区间数据实例的相似性较小。虽然通过现有的单源社区发现算法,能够实现社区的发现,但是现有方案都是基于单个数据源的数据实现的,存在视角单一、容错率低的问题,社区发现结果的准确率较低。
技术实现思路
本专利技术的目的旨在解决现有技术中存在的至少一个技术问题。本专利技术实施例提供的方案如下:第一方面,本专利技术提供了一种网络社区的发现方法,该方法包括:获取社交网络用户的多源社交网络数据,多源社交网络数据包 ...
【技术保护点】
1.一种网络社区的发现方法,其特征在于,包括:/n获取社交网络用户的多源社交网络数据,所述多源社交网络数据包括至少两种数据源对应的数据;/n基于每种辅助数据源对应的社交网络用户和主要数据源对应的社交网络用户之间的用户关系,分别确定每种辅助数据源与所述主要数据源的关联关系,其中,所述主要数据源为指定的所述至少两种数据源中的一种数据源,所述辅助数据源为所述至少两种数据源中除所述主要数据源之外的数据源;/n基于所述主要数据源的数据、每种辅助数据源的数据、以及每种辅助数据源与所述主要数据源的关联关系,对所述主要数据源对应的社交网络用户进行社区划分,得到所述主要数据源对应的社交网络用 ...
【技术特征摘要】
1.一种网络社区的发现方法,其特征在于,包括:
获取社交网络用户的多源社交网络数据,所述多源社交网络数据包括至少两种数据源对应的数据;
基于每种辅助数据源对应的社交网络用户和主要数据源对应的社交网络用户之间的用户关系,分别确定每种辅助数据源与所述主要数据源的关联关系,其中,所述主要数据源为指定的所述至少两种数据源中的一种数据源,所述辅助数据源为所述至少两种数据源中除所述主要数据源之外的数据源;
基于所述主要数据源的数据、每种辅助数据源的数据、以及每种辅助数据源与所述主要数据源的关联关系,对所述主要数据源对应的社交网络用户进行社区划分,得到所述主要数据源对应的社交网络用户的网络社区的划分结果。
2.根据权利要求1所述的方法,其特征在于,所述基于每种辅助数据源对应的社交网络用户和主要数据源对应的社交网络用户之间的用户关系,分别确定每种辅助数据源与主要数据源的关联关系,包括:
基于每种辅助数据源所对应的社交网络用户和主要数据源对应的社交网络用户之间的用户关系,分别构建每种辅助数据源与主要数据源之间的关系矩阵;
其中,每种辅助数据源对应的关系矩阵用于表征每种辅助数据源与所述主要数据源之间的关联关系,关系矩阵中的元素用于表征每种辅助数据源对应的社交网络用户和主要数据源对应的社交网络用户之间的用户关系。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述主要数据源的数据、每种辅助数据源的数据、以及每种辅助数据源与所述主要数据源的关联关系,对所述主要数据源对应的社交网络用户进行社区划分,得到所述主要数据源对应的社交网络用户的网络社区的划分结果,包括:
基于所述主要数据源的数据,通过第一聚类算法,得到第一目标函数,所述第一目标函数中包括所述主要数据源对应的求解前的社区指示矩阵;
基于每种辅助数据源的数据,以及每种辅助数据源与所述主要数据源的关联关系,通过第二聚类算法,得到第二目标函数;
基于所述第一目标函数和所述第二目标函数,得到最终目标函数;
对所述最终目标函数进行求解,得到所述主要数据源对应的求解后的社区指示矩阵;
基于所述求解后的社区指示矩阵,得到所述主要数据源对应的社交网络用户的网络社区的划分结果。
4.根据权利要求3所述的方法,其特征在于,所述基于每种辅助数据源的数据,以及每种辅助数据源与所述主要数据源的关联关系,通过第二聚类算法,得到第二目标函数,包括:
基于每种辅助数据源的数据,以及每种辅助数据源与所述主要数据源的关联关系,通过所述第二聚类算法,得到每种辅助数据源对应的子目标函数;
基于每种辅助数据源对应的所述子目标函数,得到所述第二目标函数。
5.根据权利要求4所述的方法,其特征在于,所述基于每种辅助数据源对应的所述子目标函数,得到所述第二目标函数,包括:
基于每种辅助数据源对应的所述子目标函数,以及每种辅助数据源对应的权重,得到所述第二目标子函数。
6.根据权利要求4或5所述的方法,其特征在于,所述基于所述主要数据源的数据,通过第一聚类算法,得到第一目标函数,包括:
基于所述主要数据源的数据,计算所述主要数据源对应的用户相似度矩阵;
基于所述主要数据源对应的用户相似度矩阵,通过所述第一聚类算法,得到所述第一目标函数;
所述基于每种辅助数据源的数据,以及每种辅助数据源与所述主要数据源的关联关系,通过所述第二聚类算法,得到每种辅助数据源对应的子目标函数,包括:
基于每种辅助数据源的数据,计算每种辅助数据源对应的用户相似度矩阵;
基于每种辅助数据源对应的用户相似度矩阵和每种辅助数据源对应的关系矩阵,通过所述第二聚类算法,得到每种辅助数据源对应的子目标函数;
其中,每种辅助数据源对应的关系矩阵用于表征每种辅助数据源与所述主要数据源之间的关...
【专利技术属性】
技术研发人员:陈川,钱慧,林志伟,凌国惠,张宗一,郑子彬,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。