当前位置: 首页 > 专利查询>朱常林专利>正文

一种基于云端数据分析、态势感知算法制造技术

技术编号:20329147 阅读:25 留言:0更新日期:2019-02-13 05:45
本发明专利技术提供一种基于云端数据分析、态势感知算法,获取面向用户的等待筛选的目标数据;确定目标数据的属性,所述待筛选的目标数据具有评分数据和数据类别属性信息;所述待筛选的目标数据包括第一类型目标数据和第二类型目标数据;对所述待筛选的目标数据进行预筛选处理,对上层属性所对应的数据值建立索引,如果是数值型数据就构建B+树索引结构,如果是字符型数据就构建倒排索引,数据筛选滤出有效数据,然后基于有效数据自动进行物品相似度的计算,使得根据计算得到的相似度数据能够准确进行产品推荐。该数据分析方法兼容多种业务场景,能够有效减少数据生产、校验及运营成本。

【技术实现步骤摘要】
一种基于云端数据分析、态势感知算法
本专利技术是一种基于云端数据分析、态势感知算法,属于数据处理领域。
技术介绍
现有技术中,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动,数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物,传统的数据分析存在较为繁琐的问题,所以需要一种新的方法来解决上述问题。
技术实现思路
针对现有技术存在的不足,本专利技术目的是提供一种基于云端数据分析、态势感知算法,以解决上述
技术介绍
中提出的问题。为了实现上述目的,本专利技术是通过如下的技术方案来实现:一种基于云端数据分析、态势感知算法,包括如下步骤:S1:获取面向用户的等待筛选的目标数据;确定目标数据的属性,所述待筛选的目标数据具有评分数据和数据类别属性信息;所述待筛选的目标数据包括第一类型目标数据和第二类型目标数据;S2:对所述待筛选的目标数据进行预筛选处理,对上层属性所对应的数据值建立索引,如果是数值型数据就构建B+树索引结构,如果是字符型数据就构建倒排索引;S3:基于所述数据类别属性信息,对不同数据类别属性的所述预筛选处理后的目标数据进行分组,确定数据属性值类型,若是数值型数据,则为其创建B+树索引;若是字符型属性则为其建立倒排索引结构S4:对每一组的所述预筛选处理后的目标数据,根据目标数据的评分数据进行数据评分的归一化处理,生成所述目标数据的归一化评分参数;所述归一化评分参数具有目标数据的目标对象ID、数据类别ID和所述用户的用户ID的信息;S5:获取多个用户的目标数据的归一化评分参数,所述归一化评分参数所在的位置为父节点,在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历,以便向所述用户输出合适的一个或多个推荐数;S6:根据所述数据类别ID,对不同用户的多个目标数据的统一化评分参数进行相似度计算,得到相似度度量的值;S7:根据所述相似度度量的值,确定所述多个目标数据对应的目标对象之间的相关度。进一步地,所述用户的用户ID和所述目标数据的目标对象ID的格式;所述确定所述第一目标数据是否是无效数据具体包括:确定所述第一目标数据的播放时长是否超过有效播放时间阈值。本专利技术的有益效果:本专利技术的一种基于云端数据分析、态势感知算法,数据筛选滤出有效数据,然后基于有效数据自动进行物品相似度的计算,使得根据计算得到的相似度数据能够准确进行产品推荐。该数据分析方法兼容多种业务场景,能够有效减少数据生产、校验及运营成本。具体实施方式为使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本专利技术。本专利技术提供一种技术方案:一种基于云端数据分析、态势感知算法,包括如下步骤:S1:获取面向用户的等待筛选的目标数据;确定目标数据的属性,所述待筛选的目标数据具有评分数据和数据类别属性信息;所述待筛选的目标数据包括第一类型目标数据和第二类型目标数据;S2:对所述待筛选的目标数据进行预筛选处理,对上层属性所对应的数据值建立索引,如果是数值型数据就构建B+树索引结构,如果是字符型数据就构建倒排索引;S3:基于所述数据类别属性信息,对不同数据类别属性的所述预筛选处理后的目标数据进行分组,确定数据属性值类型,若是数值型数据,则为其创建B+树索引;若是字符型属性则为其建立倒排索引结构S4:对每一组的所述预筛选处理后的目标数据,根据目标数据的评分数据进行数据评分的归一化处理,生成所述目标数据的归一化评分参数;所述归一化评分参数具有目标数据的目标对象ID、数据类别ID和所述用户的用户ID的信息;S5:获取多个用户的目标数据的归一化评分参数,所述归一化评分参数所在的位置为父节点,在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历,以便向所述用户输出合适的一个或多个推荐数;S6:根据所述数据类别ID,对不同用户的多个目标数据的统一化评分参数进行相似度计算,得到相似度度量的值;S7:根据所述相似度度量的值,确定所述多个目标数据对应的目标对象之间的相关度。用户的用户ID和所述目标数据的目标对象ID的格式;所述确定所述第一目标数据是否是无效数据具体包括:确定所述第一目标数据的播放时长是否超过有效播放时间阈值。实施例1:一种基于云端数据分析、态势感知算法,包括如下步骤:首先获取面向用户的等待筛选的目标数据;确定目标数据的属性,所述待筛选的目标数据具有评分数据和数据类别属性信息;所述待筛选的目标数据包括第一类型目标数据和第二类型目标数据,然后对所述待筛选的目标数据进行预筛选处理,对上层属性所对应的数据值建立索引,如果是数值型数据就构建B+树索引结构,如果是字符型数据就构建倒排索引,接下来基于所述数据类别属性信息,对不同数据类别属性的所述预筛选处理后的目标数据进行分组,确定数据属性值类型,若是数值型数据,则为其创建B+树索引;若是字符型属性则为其建立倒排索引结构,然后对每一组的所述预筛选处理后的目标数据,根据目标数据的评分数据进行数据评分的归一化处理,生成所述目标数据的归一化评分参数;所述归一化评分参数具有目标数据的目标对象ID、数据类别ID和所述用户的用户ID的信息,最后获取多个用户的目标数据的归一化评分参数,所述归一化评分参数所在的位置为父节点,在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历,以便向所述用户输出合适的一个或多个推荐数,根据所述数据类别ID,对不同用户的多个目标数据的统一化评分参数进行相似度计算,得到相似度度量的值,根据所述相似度度量的值,确定所述多个目标数据对应的目标对象之间的相关度。用户的用户ID和所述目标数据的目标对象ID的格式;所述确定所述第一目标数据是否是无效数据具体包括:确定所述第一目标数据的播放时长是否超过有效播放时间阈值。以上显示和描述了本专利技术的基本原理和主要特征和本专利技术的优点,对于本领域技术人员而言,显然本专利技术不限于上述示范性实施例的细节,而且在不背离本专利技术的精神或基本特征的情况下,能够以其他的具体形式实现本专利技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本专利技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本专利技术内。不应将权利要求视为限制所涉及的权利要求。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。本文档来自技高网...

【技术保护点】
1.一种基于云端数据分析、态势感知算法,其特征在于包括如下步骤:S1:获取面向用户的等待筛选的目标数据;确定目标数据的属性,所述待筛选的目标数据具有评分数据和数据类别属性信息;所述待筛选的目标数据包括第一类型目标数据和第二类型目标数据;S2:对所述待筛选的目标数据进行预筛选处理,对上层属性所对应的数据值建立索引,如果是数值型数据就构建B+树索引结构,如果是字符型数据就构建倒排索引;S3:基于所述数据类别属性信息,对不同数据类别属性的所述预筛选处理后的目标数据进行分组,确定数据属性值类型,若是数值型数据,则为其创建B+树索引;若是字符型属性则为其建立倒排索引结构S4:对每一组的所述预筛选处理后的目标数据,根据目标数据的评分数据进行数据评分的归一化处理,生成所述目标数据的归一化评分参数;所述归一化评分参数具有目标数据的目标对象ID、数据类别ID和所述用户的用户ID的信息;S5:获取多个用户的目标数据的归一化评分参数,所述归一化评分参数所在的位置为父节点,在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历,以便向所述用户输出合适的一个或多个推荐数;S6:根据所述数据类别ID,对不同用户的多个目标数据的统一化评分参数进行相似度计算,得到相似度度量的值;S7:根据所述相似度度量的值,确定所述多个目标数据对应的目标对象之间的相关度。...

【技术特征摘要】
1.一种基于云端数据分析、态势感知算法,其特征在于包括如下步骤:S1:获取面向用户的等待筛选的目标数据;确定目标数据的属性,所述待筛选的目标数据具有评分数据和数据类别属性信息;所述待筛选的目标数据包括第一类型目标数据和第二类型目标数据;S2:对所述待筛选的目标数据进行预筛选处理,对上层属性所对应的数据值建立索引,如果是数值型数据就构建B+树索引结构,如果是字符型数据就构建倒排索引;S3:基于所述数据类别属性信息,对不同数据类别属性的所述预筛选处理后的目标数据进行分组,确定数据属性值类型,若是数值型数据,则为其创建B+树索引;若是字符型属性则为其建立倒排索引结构S4:对每一组的所述预筛选处理后的目标数据,根据目标数据的评分数据进行数据评分的归一化处理,生成所述目标数据的归一化评分参...

【专利技术属性】
技术研发人员:朱常林
申请(专利权)人:朱常林
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1