【技术实现步骤摘要】
位置数据的处理方法、装置、设备及介质
[0001]本公开涉及地址数据治理
,尤其涉及一种位置数据的处理方法、装置、设备及介质。
技术介绍
[0002]位置数据作为多源异构城市大数据的衍生品,在现有技术中,通过自然语言理解技术将位置数据转换为语义表示,然后基于得到的语义表示进行下游任务,以实现对位置数据的利用。
[0003]但由于位置数据大多没有标准的地址结构,其表达也存在不一致的问题,使得到的位置数据的语义表示的精准度较低,从而也影响了下游任务的执行。
技术实现思路
[0004]本公开提供一种位置数据的处理方法、装置、设备及介质,用以解决现有技术中将位置数据转换为语义表示时,转换精准度低的缺陷,实现精准的得到位置数据的语义表示。
[0005]本公开提供一种位置数据的处理方法,包括:
[0006]获取待处理位置数据;
[0007]将所述待处理位置数据输入语义表示模型,确定每个单元的第一语义特征;基于所述第一语义特征和所述每个单元所属的地理实体类别,确定每个组合与其他组合之间 ...
【技术保护点】
【技术特征摘要】
1.一种位置数据的处理方法,其特征在于,包括:获取待处理位置数据;将所述待处理位置数据输入语义表示模型,确定每个单元的第一语义特征;基于所述第一语义特征和所述每个单元所属的地理实体类别,确定每个组合与其他组合之间的第一相关度;基于所述第一相关度,确定所述每个组合的第二语义特征;基于所述第二语义特征,得到并输出所述待处理位置数据的语义表示;其中,所述单元基于预先设置的分词策略,对所述待处理位置数据进行分词处理得到,所述组合基于所述地理实体类别,对所述单元进行组合得到;其中,所述语义表示模型通过位置数据样本和语义表示样本训练得到。2.根据权利要求1所述的位置数据的处理方法,其特征在于,所述确定每个单元的第一语义特征,包括:确定所述每个单元与其他单元之间的第二相关度;基于所述第二相关度,确定所述第一语义特征。3.根据权利要求2所述的位置数据的处理方法,其特征在于,所述确定所述每个单元与其他单元之间的第二相关度,包括:获取所述每个单元对应的第一标识,所述每个单元在所述待处理位置数据中的位置信息,以及所述每个单元所属的所述地理实体类别;基于所述第一标识、所述位置信息和所述地理实体类别,得到所述每个单元的第一语义表征向量;计算每个所述第一语义表征向量与其他第一语义表征向量之间的所述第二相关度。4.根据权利要求3所述的位置数据的处理方法,其特征在于,所述基于所述第一标识、所述位置信息和所述地理实体类别,得到所述每个单元的第一语义表征向量,包括:调整所述第一标识、所述位置信息和所述地理实体类别至同一维度;将调整后的所述第一标识、所述位置信息和所述地理实体类别的和确定为所述第一语义表征向量。5.根据权利要求3所述的位置数据的处理方法,其特征在于,所述基于所述第二相关度,确定所述第一语义特征,包括:计算所述第二相关度和所述第一语义表征向量的乘积,得到所述第一语义特征。6.根据权利要求1
‑
5任一项所述的位置数据的处理方法,其特征在于,所述基于所述第一语义特征和所述每个单元所属的地理实体类别,确定每个组合与其他组合之间的第一相关度,包括:获取所述每个组合对应的第二标识;计算所述第二标识与所述第一语义特征的乘积,得到目标语义表征向量;计算所述每个组合中包括的所述目标语义表征向量的第一平均向量;将所述第一平均向量确定为所述组合的第二语义表征向量;计算每个所述第二语义表征向量与其他第二语义表征向量之间的所述第一相关度。7.根据权利要求6所述的位置数据的处理方法,其特征在于,所述基于所述第一相关度,确定所述每个组合的第二语义特征,包括:计算所述第一相关度和所述第二语义表征向量的乘积,得到所述第二语义特征。
8.根据权利要求1
‑
5任一项所述的位置数据的处理方法,其特征在于,所述基于所述第二语义特征,得到并输出所述待处理位置数据的语义表示,包括:计算所述待处理位置...
【专利技术属性】
技术研发人员:陈南烨,苏义军,张钧波,郑宇,
申请(专利权)人:京东城市北京数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。