【技术实现步骤摘要】
多目标流形数据分析方法、装置、设备及存储介质
[0001]本专利技术涉及大数据分析
,尤其涉及多目标流形数据分析方法、装置、设备及存储介质。
技术介绍
[0002]在大数据时代,很多类型的数据受到多维特征的影响,使得数据的复杂度越来越高,可以将复杂度高的数据称为流形数据。例如,电影数据的维度包括制片人维度、拍摄时间维度、结束时间维度、赞助公司维度、演员维度以及上映时间等维度。
[0003]对于海量的流形数据,用户希望高效且准确的分析流形数据。但是,目前的数据分析手段可以对低维度的数据进行有效分析,对于高维度的流形数据的分析准确性极低。
[0004]流形数据分析方法是一种广义的优化求解算法,在流形上的限制条件下,求单位对数似然函数J(θ)的最小值,其中θ为模型参数集。J(θ)定义为:
[0005][0006]其中,y为真实数据观测值,p为模型预测值,ln()表示自然对数函数,<
·
>表示均值函数;λ为常数,w为每组的权重,ρ为信号流形空间,表示组求和函数。
[0007]模型预测值p是真实数据x和参数集θ的函数,根据费米
‑
狄拉克分布函数,可以表示为:
[0008][0009]其中,e表示指数函数,f(x|θ)表示如下:
[0010]f(x|θ)=θ
μ
δ
μ
(x
‑
α
δ
)+o(
…
)
[0011]其中,x ...
【技术保护点】
【技术特征摘要】
1.一种多目标流形数据分析方法,其特征在于,包括:获取多目标流形数据;将所述多目标流形数据输入预先训练好的流形数据分析模型,得到所述多目标流形数据的分析结果,所述流形数据分析模型利用样本流形数据和所述样本流形数据对应的样本分析序列,对流形空间内的初始分析模型训练得到。2.根据权利要求1所述的方法,其特征在于,所述流形数据分析模型通过如下步骤训练:获取样本流形数据、所述样本流形数据对应的样本分析序列以及初始分析模型的初始模型参数;基于所述样本流形数据和所述样本分析序列,对所述流形空间内的初始分析模型的初始模型参数进行迭代调整,直至当前调整次数下的当前模型参数稳定,得到用于确定所述多目标流形数据的分析结果的流形数据分析模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述样本流形数据和所述样本分析序列,对所述流形空间内的初始分析模型的初始模型参数进行迭代调整,直至当前调整次数下的当前模型参数稳定,得到用于确定所述多目标流形数据的分析结果的流形数据分析模型,包括:对所述样本流形数据进行分组,得到所述样本流形数据的多个第一样本分组序列;基于各个所述第一样本分组序列中的样本流形数据分别对应的所述初始模型参数,计算所述初始分析模型的预测分析序列;基于所述预测分析序列与所述样本分析序列,对所述初始模型参数进行迭代调整,直至当前调整次数下的当前模型参数稳定,得到用于确定所述多目标流形数据的分析结果的流形数据分析模型。4.根据权利要求3所述的方法,其特征在于,所述对所述样本流形数据进行分组,得到所述样本流形数据的多个第一样本分组序列,包括:基于所述样本流形数据的每个维度的特征,对所述样本流形数据进行排序,得到所述样本流形数据分别对应的第一排序序列;对所述第一排序序列对应的所述样本流形数据进行分组,得到所述样本流形数据的多个第一样本分组序列。5.根据权利要求4所述的方法,其特征在于,所述对所述第一排序序列对应的所述样本流形数据进行分组,得到所述样本流形数据的至少两个第一样本分组序列,包括:基于所述第一排序序列对应的所述样本流形数据的数据量,确定所述样本流形数据的第一分组切分点;根据所述第一分组切分点,对所述第一排序序列对应的所述样本流形数据进行分组,得到所述样本流形数据的至少两个第一样本分组序列。6.根据权利要求4所述的方法,其特征在于,所述对所述第一排序序列对应的所述样本流形数据进行分组,得到所述样本流形数据的至少两个第一样本分组序列,包括:将所述第一排序序列对应的所述样本流形数据输入所述初始分析模型,得到所述样本流形数据对应的预测分析序列;基于所述预测分析序列中的各个预测分析结果对应的概率值,确定所述样本流形数据
的第二分组切分点;根据所述第二分组切分点,对所述第一排序序列对应的所述样本流形数据进行分组,得到所述样本流形数据的至少两个第一样本分组序列。7.根据权利要求3所述的方法,其特征在于,所述基于各个所述第一样本分组序列中的样本流形数据分别对应的所述初始模型参数,计算所述初始分析模型的预测分析序列,包括:基于所述第一样本分组序列,确定所述初始模型参数的初始分组参数;针对每个所述第一样本分组序列,计算所述第一样本分组序列对应的初始分组参数的分组参数和,得到所述初始分析模型的预测分析序列,所述分组参数和为所述第一样本分组序列对应的初始分组参数中所有初始模型参数的和。8.根据权利要求3所述的方法,其特征在于,在所述对所述样本流形数据进行分组,得到所述样本流形数据的多个第一样本分组序列的之后,所述方法还包括:基于所述第一样本分组序列,确定所述样本...
【专利技术属性】
技术研发人员:苗春永,谢志峰,蔡卓然,单洪泷,
申请(专利权)人:上海大象张量纳米科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。