一种基于主客观集成赋权法的道路网语义相似性计算模型制造技术

技术编号:28224998 阅读:16 留言:0更新日期:2021-04-28 09:57
本发明专利技术公开一种基于主客观集成赋权法的道路网语义相似性计算模型。首先,根据每个属性项的描述特征计算其单一属性项语义相似度;然后,采用主客观集成赋权法进行权重的确定;最后,利用回归分析确定其相似度匹配阈值。将该模型应用于多尺度道路网匹配,可有效提高其匹配率、召回率以及F值。主客观集成赋权法相比于均值法和主观赋权法,其权重组合能更合理反映出每个属性项的重要性;通过回归分析选出的最优相似度匹配阈值相较于专家赋值法更有针对性,能有效提高道路网匹配效率。能有效提高道路网匹配效率。能有效提高道路网匹配效率。

【技术实现步骤摘要】
一种基于主客观集成赋权法的道路网语义相似性计算模型


[0001]本专利技术涉及矢量数据匹配领域,更具体的说是涉及一种基于主客观集成赋权法的道路网语义相似性计算模型。

技术介绍

[0002]随着道路网数据在智慧城市、智能交通、移动位置服务等各个领域的广泛应用,人们对道路网数据的需求越来越大,对其现势性要求也越来越高。但是由于不同部门应用目的不同,同一地区的道路网数据采用不同的数据源、不同的比例尺进行采集与刻画。由此产生了大量的资源浪费,并造成了道路网数据的语义、尺度、时空等多方面的差异,给数据的集成和共享造成了极大的困难。因此对道路网数据进行实时更新成为了人们追求的目标,道路网数据的匹配技术是实现道路网数据更新与融合的前提,也是道路网数据自动综合的关键技术。
[0003]目前,国内外学者对道路网匹配方法的研究主要分为2类:(1)基于缓冲区的匹配方法。该类方法主要是通过对线要素构建一定半径的缓冲区,来进行道路网数据的匹配。匹配方法主要包括单缓冲区包含匹配和双缓冲区叠置匹配两种方法。该类方法计算简单,但是对距离偏移较大的道路网数据容易造成误匹配的情况,且缓冲区的大小对匹配结果的影响较大。(2)基于相似性的匹配方法。该类方法主要通过计算线要素的几何相似性进行道路网数据的匹配,通常采用基于距离的方法进行几何相似性的度量,主要包括Hausdorff距离、Fr
é
chet距离以及它们的改进方法。该类方法目前能取得较好的匹配效果,但是用几何相似性进行道路网匹配时需考虑的情况较多,耗时较长。因此,需要考虑语义相似性度量模型在道路网匹配中的应用,但目前的方法主要采用主观赋权法进行语义相似度模型的构建,且在相似度匹配阈值的选择时采用专家赋值法,对匹配结果的影响较大。
[0004]因此,本文提出一种基于语义相似性的多尺度道路网匹配计算模型,用主客观集成赋权法取代传统的专家赋值法,运用回归分析法找出最优匹配阈值,以提高道路网的匹配效率。

技术实现思路

[0005]有鉴于此,本文提出一种基于语义相似性的多尺度道路网匹配计算模型,图1为本专利技术多尺度道路网语义相似性计算模型的概述流程图,包括单一属性项语义相似度计算和语义相似度计算两部分。除此之外,在运用相似性进行道路网匹配时需要计算相似度匹配阈值。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]一种基于语义相似性的多尺度道路网匹配计算模型,包括:单一属性项语义相似度计算、语义相似度计算和相似度匹配阈值计算三部分;
[0008]1.单一属性项语义相似度计算步骤如下:
[0009]S1:对用户输入的属性表根据各个属性项属性信息表达形式的不同,将其分为字
符型、数值型、枚举型和判断型;
[0010]S2:根据单一属性项相似度计算方法,分别进行相似度计算;
[0011]2.语义相似度计算步骤如下:
[0012]S3:字符型属性权重采用主观赋权法确定,其他类型的属性的权重采用极值熵值法和主观赋权法加权平均进行赋值,得到属性权重表;
[0013]S4:把单一属性项相似度根据属性权重表加权得出语义相似度;
[0014]3.相似度匹配阈值计算步骤如下:
[0015]S5:分别定义不同的相似度匹配阈值进行道路网匹配实验,采用人工的方法对匹配结果进行检查,并计算匹配率P和召回率R;
[0016]S6:计算匹配率和召回率的调和平均值F值;
[0017]S7:对相似度匹配阈值和F值进行回归分析,得出最优相似度匹配阈值;
[0018]S8:结束。
[0019]本专利技术方法先进、科学,主客观集成赋权法相比于均值法和主观赋权法,匹配精度更高;通过回归分析选出的最优相似度匹配阈值相较于专家赋值法更有针对性,匹配效果更好。通过实验表明将该模型应用于多尺度道路网匹配,可有效提高其匹配率、召回率以及F值,具有较好的使用价值。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见地,下面描述中的附图仅仅是本专利技术的示意图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0021]图1为本专利技术提供的多尺度道路网语义相似性计算模型的概述流程图;
[0022]图2为本专利技术提供的幂函数拟合的回归分析图;
[0023]图3为本专利技术提供的逆函数拟合的回归分析图;
[0024]图4为本专利技术提供的二次多项式拟合的回归分析图;
[0025]图5为本专利技术提供的三次多项式拟合的回归分析图;
[0026]表1为本专利技术提供的实验结果表。
[0027]具体实施方式
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基
于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]本专利技术实施例公开了一种基于主客观集成赋权法的道路网语义相似性计算模型,包括:
[0030]1、单一属性项语义相似度计算
[0031]Step 1.读取属性表数据,根据各个属性项属性信息表达形式的不同,将其分为字符型、数值型、枚举型和判断型;
[0032]Step 2.根据各个属性项的类型,确定单一属性项语义相似度计算方法;
[0033]Step 3.对字符型语义信息相似度进行计算,采用的字符型语义信息相似度考虑了两个属性值的匹配字数(匹配度)以及匹配的字的词序位置关系(匹配序)。其相似度计算如公式(1)所示。
[0034]S
T
(a,b)=W
C
×
S
C
(a,b)+W
J
×
S
J
(a,b)
ꢀꢀꢀ
(1)
[0035]式(1)中,S
T
(a,b)代表加权字符型语义信息相似度,W
C
和W
J
代表匹配序和匹配度的权重,且0<W
C
、W
J
<1,W
C
+W
J
=1。
[0036]采用的字符匹配序相似度的计算方法如公式(2)所示。
[0037][0038]式(2)中,S
C
(a,b)代表地物a和b的匹配序相似度,m和n代表地物a和b的字符串长度,L
i
表示a和b中较短字符串的第i个字符的匹配索引值,B
i
是一个布尔值,若a和b的第i个字符是否相等,若相等,则B
i
的值为1,反之B
i
等于0。
[0039]采用Jaccard相似性进行匹配度计算。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主客观集成赋权法的道路网语义相似性计算模型,包括单一属性项语义相似度计算、语义相似度计算和相似度匹配阈值确定S三部分:单一属性项语义相似度计算步骤如下:S1:对用户输入的属性表根据各个属性项属性信息表达形式的不同,将其分为字符型、数值型、枚举型和判断型;S2:根据单一属性相似度计算方法,分别进行相似度计算;语义相似度计算步骤如下:S3:字符型属性权重采用主观赋权法确定,其他类型的属性的权重采用极值熵值法和主观赋权法加权平均进行赋值,得到属性权重表;S4:把单一属性项相似度根据属性权重表加权得出语义相似度;相似度匹配阈值计算步骤如...

【专利技术属性】
技术研发人员:王中辉闫浩文崔洁吴冰娇
申请(专利权)人:兰州交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1