【技术实现步骤摘要】
信息聚类方法、系统、服务器及计算机可读存储介质
本专利技术涉及数据处理与控制领域,尤其涉及一种信息聚类方法、系统、服务器及计算机可读存储介质。
技术介绍
随着智能终端的快速发展,用户使用智能终端进行各类的信息处理和分类,及接收已聚类的数据成为了常见的交互手段,甚至对于不少运行在智能终端上的应用程序而言,是否可以根据用户的使用习惯、交互习惯和喜好对信息分类,已成为用户选择是否使用该应用程序的关键因素。如当用户使用流媒体播放类的应用程序时,为方便用户找到喜好接收的流媒体,应用程序运营商常对不同信息类型的视频作划分和标签,而对视频的划分标准,当前通常以视频的内容,或是以用户自行给出的标签作划分。上述划分方式,更易方便用户查找视频内容。而对于应用程序的运营商而言,很难从这些划分标准中准确地分析出观看某些视频的用户规律,继而较难地向用户推广与用户喜好有关的其他视频。因此,需要一种新型的信息聚类方法,可方便运营商从大数据中了解用户的使用规律,更为精准地推广近似的信息,增加用户的消费点。
技术实现思路
为了克服上述技术缺陷,本专利技术的目的在于提供一种信息聚类方法、系统、服务器及计 ...
【技术保护点】
1.一种信息聚类方法,其特征在于,包括以下步骤:S100:获取一历史时间内目标信息的时间访问数据及地域访问数据,以形成输入数据样本;S200:对每一目标信息的初始数据特征降维至具有一特征范围的二维数据特征;S300:在二维尺度下分割所述特征范围,以将所述二维数据特征划分至多个聚类;S400:提取所述聚类中的二维数据特征,并对提取的二维数据特征升维至所述初始数据特征,以形成输出数据样本;S500:分析所述输出数据样本的地域访问特征及时间访问特征,以获取对所述信息的地域访问偏好及时间访问规律。
【技术特征摘要】
1.一种信息聚类方法,其特征在于,包括以下步骤:S100:获取一历史时间内目标信息的时间访问数据及地域访问数据,以形成输入数据样本;S200:对每一目标信息的初始数据特征降维至具有一特征范围的二维数据特征;S300:在二维尺度下分割所述特征范围,以将所述二维数据特征划分至多个聚类;S400:提取所述聚类中的二维数据特征,并对提取的二维数据特征升维至所述初始数据特征,以形成输出数据样本;S500:分析所述输出数据样本的地域访问特征及时间访问特征,以获取对所述信息的地域访问偏好及时间访问规律。2.如权利要求1所述的信息聚类方法,其特征在于,所述步骤S100包括:S110:获取历史时间为t天内,n个视频信息在m个地区的访问数据,作为时间访问数据及地域访问数据;S120:形成n*t*m个输入数据样本。3.如权利要求2所述的信息聚类方法,其特征在于,步骤S110中,t=15,m=34;步骤S120中计算的输入数据样本为n*15*34个。4.如权利要求2所述的信息聚类方法,其特征在于,所述步骤S200包括:S210:对于每一视频信息的初始数据,基于:Ln=tanh(wn·Ln-1+bn)逐层降维至具有一特征范围的二维数据特征,其中n为第n层,wn为权重,bn为偏差,tanh()为激活函数,所述特征范围为(-1,1)。5.如权利要求2所述的信息聚类方法,其特征在于,所述步骤S400包括:S410:对于每一提取的视频信息的二维数据,基于:Ln=tanh(wn·Ln-1+bn)逐层升维至初始数据,其中n为第n层,wn为权重,bn为偏差,tanh()为激活函数。6.如权利要求4所述的信息聚类方法,其特征在于,所述步骤S300包括:S310:在每一维度上将所述特征范围(-1,1)划分为u个二级范围;S320:对每一二级范围等分为v个区间,以形成(u·v)2个聚类。7.如权利要求6所述的信息聚类方法,其特征在于,所述步骤S310包括:S311:在每一维度上将所述特征范围(-1,1)划分...
【专利技术属性】
技术研发人员:黄河,彭思涵,
申请(专利权)人:上海哔哩哔哩科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。