【技术实现步骤摘要】
基于动态聚类的数据处理方法、介质、设备及装置
[0001]本专利技术涉及数据处理
,特别涉及一种基于动态聚类的数据处理方法、介质、设备及装置。
技术介绍
[0002]相关技术中,推荐系统的推荐速度是最重要的,对于精度可以接受局部最优解,并需要0训练成本,能够增量推荐,所以通常采用聚类方法进行推荐,但是该聚类方法针对高纬度,海量数据下的推荐系统计算量大,从而导致推荐速度慢。
技术实现思路
[0003]本专利技术旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于动态聚类的数据处理方法,能够不受纬度限制,且在海量数据下计算量小,从而大大提高了推荐速度。
[0004]本专利技术的第二个目的在于提出一种计算机可读存储介质。
[0005]本专利技术的第三个目的在于提出一种计算机设备。
[0006]本专利技术的第四个目的在于提出一种基于动态聚类的数据处理装置。
[0007]为达到上述目的,本专利技术第一方面实施例提出了一种基于动态聚类的数据处理 ...
【技术保护点】
【技术特征摘要】
1.一种基于动态聚类的数据处理方法,其特征在于,包括以下步骤:获取所有的待处理数据向量和第一阈值;根据所述第一阈值对所述所有的待处理数据向量进行划分,以得到多个第一数据集和每个第一数据集对应的中心向量;判断所述每个第一数据集对应的中心向量的个数是否大于所述第一阈值;如果是,则根据所述第一阈值对所述每个第一数据集对应的中心向量进行划分,以得到多个第二数据集和每个第二数据集对应的中心向量,以此类推,直至中心向量的个数小于等于所述第一阈值,以得到多个最终数据集和每个最终数据集对应的中心向量。2.如权利要求1所述的基于动态聚类的数据处理方法,其特征在于,如果所述每个第一数据集对应的中心向量的个数小于等于所述第一阈值,则将所述第一数据集作为最终数据集。3.如权利要求2所述的基于动态聚类的数据处理方法,其特征在于,还包括:获取与待推荐数据向量距离最近的中心向量,并找到所述距离最近的中心向量对应的最终数据集,以便根据所述最终数据集找到所述待处理数据向量中与所述待推荐数据向量最相似的数据向量。4.如权利要求1
‑
3中任一项所述的基于动态聚类的数据处理方法,其特征在于,划分过程包括:将待拆分的数据集中距离最远的两个数据向量之间的1/4中心点作为第一初始中心,3/4中心点作为第二初始中心,以便根据所述第一初始中心和所述第二初始中心将所述待拆分的数据集拆分成两个数据集。5.一种计算机可读存储介质,其特征在于,其上存储有基于动态聚类的数据处理程序,该基于动态聚类的数据处理程序被处理器执行时实现如权利要求1
‑
4中任一项所述的基于动态聚类的数据处理方法。6.一种计算机设备,包括存储器、处...
【专利技术属性】
技术研发人员:吴万健,
申请(专利权)人:稿定厦门信息服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。