【技术实现步骤摘要】
一种志愿者地理信息信誉度计算方法
本专利技术属于众源地理信息(VGI)应用
,具体涉及一种志愿者地理信息信誉度计算方法。
技术介绍
数据质量问题一直是地理信息行业的一个基础性问题,由于志愿者地理信息(VolunteeredGeographicInformation,VGI)或众源信息(Crowd-sourcingdata)是由大众志愿者自发标报,其中存在大量恶意、虚假、低质量数据,与传统专业人员获取数据相比,其可信度具有诸多不确定性,需进行可信性评价后方可放心使用【武汉大学学报:信息科学版,2010.李德仁,钱新林,浅论自发地理信息的数据管理】。但目前这方面的研究工作还刚刚起步,研究成果包括定性分析和定量计算两方面。在定性评价和分析方面,许多众源信息系统采用类似专家评审方式,评审人员由专家或者普通大众(非专业人士)组成。VanExel和Dias研究众源地理信息系统与一般协作知识平台的区别,提出了评价众源数据质量的概念模型CrowdQuality【Proceedingsofthe6thGIScienceinternationalconferenceongeog ...
【技术保护点】
一种志愿者地理信息信誉度计算方法,其特征在于,VGI目标的版本vi的信誉度计算方法为:Tvi=R(c1)i=1ER(vi,vi-1)·R(ci)+(1-ER(vi,vi-1))·Max(Tvi-1,R(ci))i>1]]>其中,i为某VGI目标的版本vi的序号,R(ci)表示版本vi的贡献者ci的信誉度,表示版本vi‑1的信誉度,表示取和R(ci)中的较大值;ER(vi,vi‑1)表示版本vi对版本vi‑1的编辑比例,ER(vi,vi‑1)的计算方法为:ER(vi,vi‑1)=1‑VerSim(vi,vi‑1)其中VerSim(vi, ...
【技术特征摘要】
1.一种志愿者地理信息信誉度计算方法,其特征在于,VGI目标的版本vi的信誉度计算方法为:其中,i为某VGI目标的版本vi的序号,R(ci)表示版本vi的贡献者ci的信誉度,表示版本vi-1的信誉度,表示取和R(ci)中的较大值;ER(vi,vi-1)表示版本vi对版本vi-1的编辑比例,ER(vi,vi-1)的计算方法为:ER(vi,vi-1)=1-VerSim(vi,vi-1)其中VerSim(vi,vi-1)表示版本vi与vi-1的相似度。2.根据权利要求1所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者ci的信誉度R(ci)的计算方法为;其中,R0(ci)为贡献者ci的初始信誉度,Re(ci)为贡献者ci的评价信誉度,e是自然常数,m表示贡献者ci被评价的次数,M为正的自然数常量。3.根据权利要求2所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者ci的初始信誉度R0(ci)根据贡献者ci注册信息中的诚信维和能力维元素的分值计算,诚信维的元素包括真实姓名、身份ID、手机号码和email信息;能力维的元素包括用来确定贡献者贡献能力的信息;具体地,贡献者ci的初始信誉R0(ci)根据下式计算:其中,fa表示诚信维的第a个元素的分值,1≤a≤A;Max(fa)表示A个诚信维元素的分值中的最大值;Ob表示能力维元素b的分值,1≤b≤B;表示各个能力维元素的分值的平均值,B表示能力维的元素总数,α表示诚信维的权值。4.根据权利要求3所述的志愿者地理信息信誉度计算方法,其特征在于,所述真实姓名、身份ID、手机号码和email的分值根据四者的认证情况确定;真实姓名、身份ID和手机号码的认证方法包括形式认证和基于联网数据库的真实性认证,若形式认证和基于联网数据库的真实性认证都通过,则分值为“1”;若无法进行基于联网数据库的真实性认证,只能进行形式认证,则形式正确,分值为“0.5”;否则分值为“0”;email信息的认证方法包括形式认证和有效性验证;形式认证即根据邮箱形式判断email是单位邮箱还是可任意申请的邮箱;有效性验证即根据系统自动发送的认证邮件是否有回复判断email是否为有效邮箱;若认证结果为有效的单位邮箱,则分值为“0.8”;若认证结果为有效的可任意申请的邮箱,其分值为“0.5”;否则分值为“0”;能力维各个元素的分值,根据信息填写的完整程度确定,若能力维元素b已被贡献者填写了,且形式正确,则其分值Ob为“1”,否则分值Ob为“0”。5.根据权利要求1所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者ci的评价信誉Re(ci)根据下式计算:其中,1≤h≤m,m为贡献者ci被评价的次数,wh为第h个评价值的权值;Eh(ci,cj)为贡献者ci因编辑生成某VGI目标的版本vi而得到此VGI目标的后续版本vj的贡献者cj的评价值;Eh(ci,cj)通过以下公式计算:其中,ti和tj分别为VGI目标的版本vi和vj的生成时间;τ为时间跨度阈值,用于控制参与评价的两版本之间的时间跨度;c∈[0,1],用于控制贡献者的信誉度影响其评价结果的程度;N为评价版本跨度阈值,用于控制当版本vj生成时,有N个小于j的版本被评价;VerSim(vi,vj)为版本vi与vj的相似度。6.根据权利要求5所述的志愿者地理信息信誉度计算方法,其特征在于,所述wh=1/m。7.根据权利要求5所述的志愿者地理信息信誉度计算方法,其特征在于,某VGI目标的版本vj和vi的相似度VerSim(vi,vj)计算方法为:VerSim(vi,vj)=w·VerSpatioSim(vi,vj)+(1-w)VerAttrSim(vi,vj)其中,w为空间相似度的权值;VerSpatioSim(vi,vj),VerAttrSim(vi,vj)分别表示VGI目标的版本vi和vj的空间相似度和属性相似度,分别通过以下方法计算;
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。