一种基于在线学习与众包数据分析的城市环境评估方法和系统技术方案

技术编号:24332006 阅读:36 留言:0更新日期:2020-05-29 20:04
本发明专利技术公开了一种基于在线学习与众包数据分析的城市环境评估方法和系统,其中方法包括:从众包数据平台采集城市环境评估数据,并利用众包算法对采集的城市环境评估数据进行预处理;构建城市环境评估模型,并采用预处理后的城市环境评估数据训练所述城市环境评估模型;采集新的模型训练数据,构建在线学习算法,基于新的模型训练数据利用所述在线学习算法定时优化所述城市环境评估模型,并利用最新的城市环境评估模型对待评估的成对街景图片输出城市印象属性比较结果。本发明专利技术充分考虑不同人群评估的差异性,且能够实时更新评估模型,通用性强,显著提高了评估结果的准确性。

A method and system of urban environmental assessment based on online learning and crowdsourcing data analysis

【技术实现步骤摘要】
一种基于在线学习与众包数据分析的城市环境评估方法和系统
本申请属于智慧城市领域,具体涉及一种基于在线学习与众包数据分析的城市环境评估方法和系统。
技术介绍
城市规模的扩大和城市化进程的加速给城市发展带来了巨大挑战。为了应对挑战,智慧城市应运而生。城市环境,即影响城市人类活动的自然、人工外部条件,是衡量城市发展的重要指标之一。城市环境评估是智慧城市研究中的重要组成部分,其最终目的在于改善城市环境,提高市民满意度,辅助制定相关政策,实现城市可持续发展。城市环境包括城市经济环境、社会环境、生态环境、美学环境等。城市环境评估传统上采用基于现场调研的方法,该方法成本高、收益低,难以从宏观角度进行分析。随着传感器技术的发展以及大数据时代的到来,新的数据采集手段为城市环境评估研究提供了大量街景图片,街景评估可作为城市环境评估的新分支。街景图片具有分布范围广、数据量大、内容详实的特点,能够同时从微观和宏观层面反应城市状态。同时,将当前飞速发展的深度学习技术,特别是计算机视觉模型引入城市环境评估任务,有助于降低图片特征提取成本,提高城市环境评估的真实性,拓展智慧城市应用领域。基于街景的城市环境评估(即街景评估)相关研究近年来成为智慧城市领域的新方向。目前,基于街景的城市环境评估相关研究主要集中在通过成对街景图片提高模型对城市感受的评分准确性,忽略了城市环境评估主观性较强、标注结果个体差异大的现状,从而造成目前的评估结果差异大、准确性低,且现有评估系统缺乏模型实时更新能力,无法应对多变的街景环境数据,通用性差。专
技术实现思路
本申请的目的在于提供一种基于在线学习与众包数据分析的城市环境评估方法和系统,充分考虑不同人群评估的差异性,且能够实时更新评估模型,通用性强,显著提高了评估结果的准确性。为实现上述目的,本申请所采取的技术方案为:一种基于在线学习与众包数据分析的城市环境评估方法,所述基于在线学习与众包数据分析的城市环境评估方法,包括:步骤S1、从众包数据平台采集城市环境评估数据,并利用众包算法对采集的城市环境评估数据进行预处理;步骤S2、构建城市环境评估模型,并采用预处理后的城市环境评估数据训练所述城市环境评估模型;步骤S3、采集新的模型训练数据,构建在线学习算法,基于新的模型训练数据利用所述在线学习算法定时优化所述城市环境评估模型,并利用最新的城市环境评估模型对待评估的成对街景图片输出城市印象属性比较结果。作为优选,所述从众包数据平台采集城市环境评估数据,包括:步骤S1.1、将成对街景图片发布于众包数据平台上;步骤S1.2、接收众包数据平台上的标注者对每一成对街景图片的比较结果;步骤S1.3、将比较结果作为当前标注者对当前成对街景图片产生的标签,建立标注者、成对街景图片和标签三者之间的一一对应关系。作为优选,利用众包算法对采集的城市环境评估数据进行预处理,包括:步骤S1.4、设待标注的样本总数为N,即成对街景图片的总对数为N,从众包数据平台上获取K位标注者的比较结果,即标签,并且标签的类别总数为I类;步骤S1.5、对于第n个样本有以下关系式:其中,P表示第n个样本的真实标签为i的概率,记作i表示标签类别i,且i∈(1,…,I);步骤S1.6、每位标注者对应一个I×I的混淆矩阵,第k位标注者对应的混淆矩阵记作π(k),表示第k位标注者将真实标签为a的样本标注为b的概率,a表示标签类别a且a∈(1,…,I),b表示标签类别b且b∈(1,…,I),并且步骤S1.7、构造条件概率如下:其中,Sn代表第n个样本,Qni表示在当前参数下第n个样本的真实标签为i的概率,表示每个样本对应的真实标签分别为1,…i,…I的概率集合,以表示第n个样本的真实标签为i的概率,即π表示每位标注者对应的混淆矩阵;步骤S1.8、采用众包算法计算每个样本对应的真实标签分别为1,…i,…I的概率集合以及每位标注者对应的混淆矩阵π,根据计算得到的与π,通过条件概率公式Qni可计算每个样本对应所有比较结果的条件概率,选择每个样本最大的条件概率对应的比较结果作为当前样本最终的标签。作为优选,所述采用众包算法计算每个样本对应的真实标签为i的概率集合以及每位标注者对应的混淆矩阵π,包括:所采用的众包算法为EM算法,采用EM算法计算与π,计算过程如下:定义Qni的初始值为:其中,k表示标注者的编号,表示所有标注者将第n个样本标注为i的次数,表示第k位标注者将第n个样本标注为b的次数,因此Qni的初始值为所有标注者将第n个样本标注为i的次数除以所有标注者对第n个样本进行标注的总次数;定义M步如下:构建辅助函数,利用极大似然估计最大化辅助函数以更新参数与π;其中辅助函数为:定义E步如下:根据贝叶斯公式,通过与π更新Qni的数值,更新公式如下:循环执行E步和M步至满足EM算法的终止条件,可得到最终参数与π。作为优选,所述构建城市环境评估模型,包括:步骤S2.1、构建孪生网络,所述孪生网络由两个权值相同的城市印象评分模型组成,每一城市印象评分模型以成对街景图片中的一张作为输入,并输出对该张街景图片的城市印象属性评分;所述城市印象评分模型包括用于提取街景图片中特征的计算机视觉模型、以及根据所提取的特征输出城市印象属性评分的全连接层;步骤S2.2、构建所述孪生网络的逻辑回归模型,所述孪生网络和逻辑回归模型构成城市环境评估模型,所述逻辑回归模型以孪生网络输出的两个城市印象属性评分的差值作为输入,以成对街景图片中第一张街景图片产生的主观感受在程度上大于第二张街景图片的概率作为输出,并且设置逻辑回归网络的因变量采用0、0.5、1表示,即设置输出结果采用0、0.5、1表示。作为优选,所述采集新的模型训练数据,包括:1)从众包数据平台采集新的城市环境评估数据;2)采集用户反馈数据,所述用户反馈数据为用户根据所述城市环境评估模型输出的城市印象属性比较结果判断是否符合其主观印象的判断结果。作为优选,所述构建在线学习算法,基于新的模型训练数据利用所述在线学习算法定时优化所述城市环境评估模型,包括:步骤S3.1、以x表示城市环境评估模型的输入,即表示输入孪生网络的成对街景图片;以f表示城市环境评估模型;以θ表示城市环境评估模型的参数;以yp表示城市环境评估模型的输出,即表示逻辑回归模型输出的成对街景图片中对第一张街景图片产生的主观感受在程度上大于第二张街景图片的概率,则所述城市环境评估模型可表示为:yp=f(x|θ)步骤S3.2、建立损失函数如下:其中,yt表示成对街景图片实际的城市印象属性比较结果;步骤S3.3、对所述损失函数求导得到所有参数对应的梯度值ξ,则经过随机梯度下降后,城市环境评估模型的参数更新为θ′如下:θ′=θ-ηξ其中,η为学习率。本申请还提本文档来自技高网
...

【技术保护点】
1.一种基于在线学习与众包数据分析的城市环境评估方法,其特征在于,所述基于在线学习与众包数据分析的城市环境评估方法,包括:/n步骤S1、从众包数据平台采集城市环境评估数据,并利用众包算法对采集的城市环境评估数据进行预处理;/n步骤S2、构建城市环境评估模型,并采用预处理后的城市环境评估数据训练所述城市环境评估模型;/n步骤S3、采集新的模型训练数据,构建在线学习算法,基于新的模型训练数据利用所述在线学习算法定时优化所述城市环境评估模型,并利用最新的城市环境评估模型对待评估的成对街景图片输出城市印象属性比较结果。/n

【技术特征摘要】
1.一种基于在线学习与众包数据分析的城市环境评估方法,其特征在于,所述基于在线学习与众包数据分析的城市环境评估方法,包括:
步骤S1、从众包数据平台采集城市环境评估数据,并利用众包算法对采集的城市环境评估数据进行预处理;
步骤S2、构建城市环境评估模型,并采用预处理后的城市环境评估数据训练所述城市环境评估模型;
步骤S3、采集新的模型训练数据,构建在线学习算法,基于新的模型训练数据利用所述在线学习算法定时优化所述城市环境评估模型,并利用最新的城市环境评估模型对待评估的成对街景图片输出城市印象属性比较结果。


2.如权利要求1所述的基于在线学习与众包数据分析的城市环境评估方法,其特征在于,所述从众包数据平台采集城市环境评估数据,包括:
步骤S1.1、将成对街景图片发布于众包数据平台上;
步骤S1.2、接收众包数据平台上的标注者对每一成对街景图片的比较结果;
步骤S1.3、将比较结果作为当前标注者对当前成对街景图片产生的标签,建立标注者、成对街景图片和标签三者之间的一一对应关系。


3.如权利要求2所述的基于在线学习与众包数据分析的城市环境评估方法,其特征在于,利用众包算法对采集的城市环境评估数据进行预处理,包括:
步骤S1.4、设待标注的样本总数为N,即成对街景图片的总对数为N,从众包数据平台上获取K位标注者的比较结果,即标签,并且标签的类别总数为I类;
步骤S1.5、对于第n个样本有以下关系式:



其中,P表示第n个样本的真实标签为i的概率,记作i表示标签类别i,且i∈(1,...,I);
步骤S1.6、每位标注者对应一个I×I的混淆矩阵,第k位标注者对应的混淆矩阵记作π(k),表示第k位标注者将真实标签为a的样本标注为b的概率,a表示标签类别a且a∈(1,...,I),b表示标签类别b且b∈(1,...,I),并且
步骤S1.7、构造条件概率如下:



其中,Sn代表第n个样本,Qni表示在当前参数下第n个样本的真实标签为i的概率,表示每个样本对应的真实标签分别为1,...i,...I的概率集合,以表示第n个样本的真实标签为i的概率,即π表示每位标注者对应的混淆矩阵;
步骤S1.8、采用众包算法计算每个样本对应的真实标签分别为1,...i,...I的概率集合以及每位标注者对应的混淆矩阵π,根据计算得到的与π,通过条件概率公式Qni可计算每个样本对应所有比较结果的条件概率,选择每个样本最大的条件概率对应的比较结果作为当前样本最终的标签。


4.如权利要求3所述的基于在线学习与众包数据分析的城市环境评估方法,其特征在于,所述采用众包算法计算每个样本对应的真实标签为i的概率集合以及每位标注者对应的混淆矩阵π,包括:
所采用的众包算法为EM算法,采用EM算法计算与π,计算过程如下:
定义Qni的初始值为:



其中,k表示标注者的编号,表示所有标注者将第n个样本标注为i的次数,...

【专利技术属性】
技术研发人员:张一杨马小雯舒元昊张惠根林兴萍
申请(专利权)人:中电海康集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1