【技术实现步骤摘要】
一种基于稀疏表示和Fréchet距离融合的轨迹相似度计算方法
本专利技术涉及计算机科学与
,具体是一种基于稀疏表示和Fréchet距离融合的轨迹相似度计算方法。
技术介绍
定位技术的发展以及智能移动终端的普及,催生了大量的轨迹数据。轨迹数据采集之后可直接发布供用户使用,但直接发布很可能导致移动对象的个人敏感信息被泄漏。大量数据挖掘工具的使用要求数据所有者在发布轨迹数据时保证数据中的敏感信息不被泄露,同时还要兼顾所发布轨迹数据的可用性。大量研究表明,基于聚类的轨迹隐私保护方法在隐私保护程度上和数据可用性上取得了较好的平衡,是目前主流的轨迹隐私保护方法之一。基于聚类的轨迹隐私保护方法中聚类结果对匿名轨迹数据可用性的影响较大,而轨迹间相似性的度量方式是轨迹聚类的关键。目前大多数以欧式距离作为轨迹相似性度量标准,方法单一。考虑到轨迹多特性,需要融合多相似度计算。
技术实现思路
本专利技术的目的是要提供一种基于稀疏表示和Fréchet距离融合的轨迹相似度计算方法,该方法通过融合两种分别针对轨迹 ...
【技术保护点】
1.一种基于稀疏表示和Fréchet距离融合的轨迹相似度计算方法,其特征是:包括如下步骤:/n(1)稀疏表示系数求解相似度sim1,将需要求解相似邻居的轨迹表示为测试样本,数据集中除测试样本之外其他的轨迹表示为训练样本,建立用户轨迹的矩阵形式:/n
【技术特征摘要】
1.一种基于稀疏表示和Fréchet距离融合的轨迹相似度计算方法,其特征是:包括如下步骤:
(1)稀疏表示系数求解相似度sim1,将需要求解相似邻居的轨迹表示为测试样本,数据集中除测试样本之外其他的轨迹表示为训练样本,建立用户轨迹的矩阵形式:
其中每一行表示的是该轨迹上等时间间隔选取的m个轨迹点,每个轨迹点有v个属性,Rm.v′代表轨迹上第m个轨迹点的第v个属性值;
(2)对矩阵轨迹数据预先处理,稀疏表示形式如下:
β=a1α1++a2α2+…+anαn
其中,β为测试样本,αi为训练样本(i=1,2…n),ai为需要求解的系数;
建立用户轨迹的矩阵数据时,轨迹上的取点数m多于它的属性个数v;因此将原用户轨迹矩阵全部做转置处理:
y=a1x1+a2x2+…anxn
xi(i=1,2…n)为转置后的轨迹矩阵t的表示;
(3)每个矩阵有n个属性,每个属性的取值范围不同,对轨迹矩阵做归一化处理;
(4)轨迹间的稀疏表示:
y=a1x1++a2x2+…+anxn
y为需要测试的轨迹样本,xi(i=1,2…n)为训练的轨迹样本,ai可理解为第i个训练样本对测试样本的贡献值,将以上公式改写为:
y=XA
其中A=[a1…an]T,X=[x1…xn],并且x1…xn和y都是n*m的矩阵(m>n);如果A是一个非奇异矩阵,可以这样得到A,
A=X-1y
否则,便这样得到A,
A=(XTX+μI)-1XTy
其中μ是一个很小的正数,I是一个单位矩阵;得到A之后,也即是求得了对应的a1…an各个系数的解,得到了第i个训练样本对测试样本的贡献值,这个值越大,也就间接说明了训练样本和测试样本相似度越高;
(5)Fréchet距离求解轨迹直接相似度sim2
任选轨迹集中;两条轨迹P和Q,P轨迹长度为M,Q轨迹长度为N,将变量t约束到区间[0,1]内,α(t)和β(t)是运动位置描述函数;那么有α(0)=0,α(1)=N,β(0)=0,β(0)=M;用P(α(t))和Q(β(t))分别表示t时刻P和Q在各自轨迹上的空间位置:
采用合适的离散弗雷歇距离算法来刻画两条曲线之间的距离,并作为其弗雷歇距离;
(6)基于多相似度融合的轨迹聚类:
通过以上相似度计算方法,需要测试的每条轨迹都可以得到相应的前Top-k条轨迹:
每次迭代从未聚类的轨迹集合(Sunclu)中随机选择一条轨迹作为聚类中心轨迹Tp,根据轨迹间的相似度从Sunclu中选出与Tp相似度较高的k-1条轨迹组成一个大小为k的轨迹集合Snow,并将其添加到聚类集合Sclu中,重复上述聚类操作直到Sunclu中轨迹数(Su...
【专利技术属性】
技术研发人员:李芳,赵文婷,蓝如师,刘忆宁,钟艳如,臧美美,郑金云,王如月,罗笑南,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。