一种基于用户画像的遥感数据推荐方法、系统和装置制造方法及图纸

技术编号:37850724 阅读:26 留言:0更新日期:2023-06-14 22:40
本发明专利技术涉及遥感数据服务技术领域,具体涉及一种基于用户画像的遥感数据推荐方法、系统和装置。本发明专利技术首先根据用户行为数据和内容数据,构建用户兴趣行为集合B,然后提取遥感影像大数据主题特征项C,并根据B,计算用户兴趣度Z,根据B和拉格朗日方程,计算主题特征项权重W,根据C,计算主题特征项的分布范围及步长R和用户数据在主题特征项上的分布特征向量V,根据B、C、W、R、V和Z,构建用户画像模型M,根据用户兴趣度Z和W,计算有效度E,根据E和M,生成推荐方案,本发明专利技术通过计算得到有效度,并将有效度与用户画像模型一起将精准遥感信息推荐给用户,能够提供个性化定制服务,用户体验度好,满意度高。意度高。意度高。

【技术实现步骤摘要】
一种基于用户画像的遥感数据推荐方法、系统和装置


[0001]本专利技术涉及遥感数据服务
,具体涉及一种基于用户画像的遥感数据推荐方法、系统和装置。

技术介绍

[0002]目前,用户画像模型是在大技术应用背景下的开拓应用,利用用户画像模型可以在多维度基础上建立用户标签,对用户行为进行特征描述,同时,也可以挖掘用户需求。根据用户画像模型为用户提供更加高效的信息推送和符合用户个人习惯的用户内容。
[0003]建立用户画像模型的数据源是与用户相关的所有的数据,包括自然数据、行为数据和内容数据。常见用户的自然数据,包括:用户的年龄、性别、单位、职业等用户自身固有的属性,可以在用户注册环节进行收集。行为数据用于描述用户所执行的行为,包括:访问次数、访问频度、访问停留时间、活跃时间、信息输入、点击链接、交互操作、搜索内容等。内容数据表示用户行为的对象,包括:用户所收藏的网页、用户加入购物车、下订单的产品和下载过的数据等;然后,再提取该内容的关键要素作为内容数据来代表用户行为针对的内容。
[0004]面向用户需求的数据推送是近年来研究的热点。然而目前广泛应用的各类遥感数据平台,例如:百度地图、谷歌地图、高德地图等都具备一定的空间信息检索能力,但是根据用户的需求定制服务或能够主动推荐服务较少,无法满足用户的个体需求,迫切需要针对主动推送方面进行技术攻破,满足遥感数据用户的个性化定制要求。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于用户画像的遥感数据推荐方法、系统和装置,以解决现有技术中根据用户的需求定制服务或能够主动推荐服务少,无法满足用户的个体需求和用户的个性化定制要求的问题。
[0006]根据本专利技术实施例的第一方面,提供一种基于用户画像的遥感数据推荐方法,包括:
[0007](1)根据用户行为数据和内容数据,构建用户兴趣行为集合B={B1,B2,ΛB
N
};
[0008](2)提取遥感影像大数据主题特征项C;其中,所述特征项至少包括:经度范围、纬度范围、时间范围、空间分辨率、波谱分辨率、目标类别;
[0009](3)根据所述用户兴趣行为集合B,计算得到用户兴趣度Z;
[0010](4)根据所述用户兴趣行为集合B并结合拉格朗日方程,计算得到主题特征项权重W;
[0011](5)根据所述主题特征项C,计算得到主题特征项的分布范围及步长R;
[0012](6)根据所述主题特征项C,计算用户数据在主题特征项上的分布特征向量V;
[0013](7)根据所述用户兴趣行为集合B、主题特征项C、主题特征项权重W、主题特征项的分布范围及步长R、分布特征向量V和用户兴趣度Z,构建用户画像模型M;
[0014](8)根据所述用户兴趣度Z和所述主题特征项权重W,计算得到有效度E;
[0015](9)根据所述有效度E和所述用户画像模型M,生成推荐方案。
[0016]优选地,所述根据所述用户兴趣行为集合B,计算得到用户兴趣度Z,包括:
[0017]根据用户兴趣行为集合B,计算得到标准化值,并根据所述标准化值计算得到用户行为数据的信息熵;
[0018]根据所述信息熵,计算得到用户兴趣行为集合的权重,根据所述权重和所述标准化值,计算得到用户兴趣度Z。
[0019]优选地,计算标准化值:
[0020][0021]其中,S
ij
为主题特征项检索时第i条记录中第j种行为的标准化值;max(B
ij
)表示第i条记录中第j种行为的最大值;min(B
ij
)表示第i条记录中第j种行为的最小值;
[0022]计算用户行为数据的信息熵:
[0023][0024]其中,N为兴趣行为集合B的分量数量;
[0025]计算操作行为的权重:
[0026]则
[0027]计算兴趣度:
[0028][0029]优选地,所述根据所述用户兴趣行为集合B并结合拉格朗日方程,计算得到主题特征项权重W,具体为:
[0030][0031]其中M表示主题特征项集合C的分量数量;
[0032]优选地,所述根据所述主题特征项C,计算得到主题特征项的分布范围及步长R,具体为:
[0033]根据每一个主题特征项C
i
,若用户的检索历史记录中共有k个检索样本值A={A1,A2,ΛA
t
ΛA
k
},A
t
的取值范围为(min,max);
[0034]根据用户所有的历史检索数据样本A
t
∈(min,max),则分布区间的最大、最小值为:
[0035]dmin=min(min);dmax=max(max)
[0036]区间步长step计算:
[0037]存在正整数l,使得dmin+l
×
step=dmax;
[0038]对于样本中的数据,存在唯一正整数m,n使得:
[0039]dmin+m
×
step=min;
[0040]dmin+n
×
step=max;
[0041]选择step的最大值作为最终结果,以dmin为起点,利用step分割主题特征项所处的区间,得到若干子区间,区间的起始值为dmin,第一个区间的范围为dmin,dmin+1
×
step。
[0042]优选地,所述根据所述主题特征项C,计算用户数据在主题特征项上的分布特征向量V,具体为:
[0043]分布特征向量V:
[0044][0045]其中,将主题特征项C
i
均匀分割为N个区间,其中,f
i
表示第i个单位子区间的出现概率;A
t
表示用户所检索的主题特征项经度范围、纬度范围、时间范围、空间分辨率、波谱分辨率、目标类别的第t个样本值;I
i
表示该数据所处的完整区间分割后的第i个子区间;I
k
()表示示性函数。
[0046]优选地,所述根据所述用户兴趣行为集合B、主题特征项C、主题特征项权重W、主题特征项的分布范围及步长R、分布特征向量V和用户兴趣度Z,构建用户画像模型M,具体为:
[0047]M={B,C,W,R,V,Z}
[0048]其中,B={B1,B2,ΛB
N
}表示用户不同的兴趣行为集合,包括:用户的平均浏览停留时间、重复访问同一页面次数、访问的关键词、点击链接、信息输入、收藏和下载影像;C={C1,C2,ΛC
N
}表示遥感影像的主题特征项;W={W1,W2,ΛW
N
},W
i
为C
i
的权重;R={R1,R2,ΛR
N
},R
i
=<RMIN
i
,RMAX本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户画像的遥感数据推荐方法,其特征在于,包括:(1)根据用户行为数据和内容数据,构建用户兴趣行为集合B={B1,B2,ΛB
N
};(2)提取遥感影像大数据主题特征项C;其中,所述特征项至少包括:经度范围、纬度范围、时间范围、空间分辨率、波谱分辨率、目标类别;(3)根据所述用户兴趣行为集合B,计算得到用户兴趣度Z;(4)根据所述用户兴趣行为集合B并结合拉格朗日方程,计算得到主题特征项权重W;(5)根据所述主题特征项C,计算得到主题特征项的分布范围及步长R;(6)根据所述主题特征项C,计算用户数据在主题特征项上的分布特征向量V;(7)根据所述用户兴趣行为集合B、主题特征项C、主题特征项权重W、主题特征项的分布范围及步长R、分布特征向量V和用户兴趣度Z,构建用户画像模型M;(8)根据所述用户兴趣度Z和所述主题特征项权重W,计算得到有效度E;(9)根据所述有效度E和所述用户画像模型M,生成推荐方案。2.根据权利要求1所述的方法,其特征在于,所述根据所述用户兴趣行为集合B,计算得到用户兴趣度Z,包括:根据用户兴趣行为集合B,计算得到标准化值,并根据所述标准化值计算得到用户行为数据的信息熵;根据所述信息熵,计算得到用户兴趣行为集合的权重,根据所述权重和所述标准化值,计算得到用户兴趣度Z。3.根据权利要求2所述的方法,其特征在于,所述根据用户兴趣行为集合B,计算得到标准化值,并根据所述标准化值计算得到用户行为数据的信息熵;根据所述信息熵,计算得到用户兴趣行为集合的权重,根据所述权重和所述标准化值,计算得到用户兴趣度Z,具体为:计算标准化值:其中,S
ij
为主题特征项检索时第i条记录中第j种行为的标准化值;max(B
ij
)表示第i条记录中第j种行为的最大值;min(B
ij
)表示第i条记录中第j种行为的最小值;计算用户行为数据的信息熵:其中,N为兴趣行为集合B的分量数量;计算操作行为的权重:则计算兴趣度:4.根据权利要求1所述的方法,其特征在于,所述根据所述用户兴趣行为集合B并结合
拉格朗日方程,计算得到主题特征项权重W,具体为:5.根据权利要求1所述的方法,其特征在于,所述根据所述主题特征项C,计算得到主题特征项的分布范围及步长R,具体为:根据每一个主题特征项C
i
,若用户的检索历史记录中共有k个检索样本值A={A1,A2,ΛA
t
ΛA
k
},A
t
的取值范围为(min,max);根据用户所有的历史检索数据样本A
t
∈(min,max),则分布区间的最大、最小值为:dmin=min(min);dmax=max(max)区间步长step计算:存在正整数l,使得dmin+l
×
step=dmax;对于样本中的数据,存在唯一正整数m,n使得:dmin+m
×
step=min;dmin+n
×
step=max;选择step的最大值作为最终结果,以dmin为起点,利用step分割主题特征项所处的区间,得到若干子区间,区间的起始值为dmin,第一个区间的范围为|dmin,dmin+1
×
step|。6.根据权利要求1所述的方法,其特征在于,所述根据所述主题特征项C,计算用户数据在主题特征项上的分布特征向量V,具体为:分布特征向量V:...

【专利技术属性】
技术研发人员:周仿荣文刚潘浩张辉马御棠马仪王一帆耿浩曹俊
申请(专利权)人:云南电网有限责任公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1