
3月28日开课,点击上图了解
项目名称:基于街景图像的城市物质空间与城市长期活动时空模式定量关系研究
项目负责人:张帆
依托单位:北京大学
摘 要

项目执行以来,针对如何量化城市建成环境、如何量化城市物质空间与人类活动之间存在着密切的联系与相互作用关系研究的问题,分别利用计算机视觉方法,城市图片大数据标注方法,以及多种统计计量工具进行研究,物质空间与人类活动之间存在着密切的联系与相互作用分析的基本框架,主要工作可以总结为三个方面:1) 以城市物质空间特征与人类活动模式之间的关系为例,基于深度卷积神经网络,构建城市物质空间特征与人类活动模式之间的非线性关系;2) 以城市物质空间特征与不动产价值为例,提出以场所为中心的房价建模模型(Place-based Hedonic model), 提出了一种融合多源地理大数据的框架来建模和分析房产增值率;3) 以基于城市物质空间特征的“安全感”与城市犯罪率为例,通过构建两者之间的差异度量,提出“感知偏差”的概念,并通过各项社会经济指标进行量化。该课题完成了项目的既定研究目标,实现了该方法体系实现了城市物质空间量化分析方法、以及城市物质空间与人类活动之间关联研究的原始创新。
项目结题成果报告

以下研究成果内容摘自项目结题成果报告。该项目报告共计25页,关注城市数据派微信公众号,在微信公众号对话框中输入 24327,即可获得报告全文PDF的下载方式:


项目执行以来,针对如何量化城市建成环境、如何量化城市物质空间与人类活动之间存在着密切的联系与相互作用关系研究的问题,分别利用计算机视觉方法城市图片大数据标注方法,以及多种统计计量工具进行研究,物质空间与人类活动之间存在着密切的联系与相互作用分析的基本框架,主要工作可以总结为以下几个方面:
a)以城市物质空间特征与人类活动模式之间的关系为例,基于深度卷积神经网络,构建城市物质空间特征与人类活动模式之间的非线性关系;
b)以城市物质空间特征与不动产价值为例,提出以场所为中心的房价建模模型(Place-based Hedonic model),提出了一种融合多源地理大数据的框架来建模和分析房产增值率;
c)以基于城市物质空间特征的“安全感”与城市犯罪率为例,通过构建两老之间的差异度量,提出“感知偏差”的概念,并通过各项社会经济指标进行量化。
(2)取得的主要研究进展、重要结果、关键数据等及其科学意义或应用前景
a)以城市物质空间特征与人类活动模式之间的关系为例,基于深度卷积神经网络,构建城市物质空间特征与人类活动模式之间的非线性关系
城市物质空间中,蕴含了大量关于城市功能、出行、人口属性和社会经济的信息。而如何量化城市物质空间,挖掘其表达的社会经济属性、居民活动模式,进而从“人地关系”的角度回答–城市物质空间和社会空间之间存在多大的关联性一直是有待解决的问题。社会感知(SocialSensing)旨在利用各项人类活动大数据,提取时空行为模式,感知人文及社会经济要素。本文提出了社会感知的新视角:利用街景大数据量化城市物质空间,进而通过城市物质空间来反演社会活动空间及社会经济属性。在案例分析中,本研究训练了一个深度卷积神经网络,通过输入一张街景图片,来预测街景图片所在街道上居民平均每小时的出行量曲线。结果显示,在北京五环内的900多条主要街道上,模型在预测居民出行量量级上取得了 74.1%的准确度(Acc=74.1%);仅仅通过街景图片反映的信息,模型可以解释 66.5%居民出行模式的变化(R2=0.665)。简单地来讲,“仅仅基于街景图像我们能在一定程度上预测每天不同时刻出租车的乘车量。”
图1基于DenseNet的居民出行活动日时谱曲线预测
本研究设计了一个基于DenseNet的深度卷积神经网络,实现将任意一张街景图片作为输入,输出街景图片所在街道的居民出行活动的日时谱曲线(由24维向量组成)。如图1所示,DenseNet(b)对图片(a)进行深度特征学习,旨在提取其反映建成环境质量和街道功能等深层次的语义信息。利用深度特征,建立24个独立的分类器(c),单独估计24小时中每小时的出租车上下车数目。本研究在模型训练和预测的整个过程中,对经典深度学习方法流进行改进,采用了“先分类后回归”、“迁移学习”、“多任务学习”等策略,在实现了多分类、多目标预测任务的同时,提高了模型学习的效率。
图2所示为模型对12个示例样本的预测结果,其中每列左侧为模型输入;每列中间的图片中红色区域代表了模型认为最有信息量、最有助于识别(informativeregion)的区域;右侧是观测曲线与预测曲线的对比(注意样本间虽然模式相似但量级有显著差异)。
通过深度学习“黑箱”的方法,本研究搭建了连接物质空间与社会活动空间关系的桥梁。研究方法可以潜在地衡量建成环境与人类活动、社会经济水平发展的不均衡性,为人地关系研究、城市设计与管理提供参考和决策支持。
b)以城市物质空间特征与不动产价值为例,提出以场所为中心的房价建模模型(Place-based Hedonic model),提出了一种融合多源地理大数据的框架来建模和分析房产增值率
理解和对城市房价升值率(houseprice appreciationrate)建模既有益于购房者选择合适的房产,也能帮助研究人员与城市决策者制定房产相关的政策。先前已经有大量城市经济学、地理信息科学、计算机等领域的工作尝试对房价建模与预测,并取得了一系列成果和应用,然而之前的研究仍然在以下两方面存在一定的缺失。
首先,早期大多数研究关注于房价本身,而非升值率;前者反映了房产在某个特定时间的价值,而后者则描述了房产的长期价值,影响房价绝对值和升值率的因素可能不同。其次,先前研究大多基于特征价格模型(Hedonic Pricing Mode1),主要从结构特征(Structural Attributes)和区域便利性(Locational Amenities两方面入手。其中,结构特征主要指的是房子本身的属性(如面积,楼层,房间数等),而区域便利性则指的是周边生活设施便利度(如房产与服务设施的距离等)。然而,除了这两方面因素,房产的价值可能还与房子周围的物理视觉环境与社会环境相关联,例如,风景优美的小区房产价值可能更高,人流熙攘的区域住宅升值空间可能更高。由于缺乏量化城市环境品质和人流的相关数据,先前的研究可能难以量化地分析这些重要因素对于房产价值的影响。
基于此,本研究提出了一种融合多源地理大数据的框架来建模和分析房产增值率具体而言,我们收集了四方面的数据:
(1)基于志愿者地理信息(VGI)的在线房价数据平台获取了房产信息和房产照片;
(2)通过街景数据和兴趣点(POI)数据描绘房产周围的建成环境;
(3)通过人流量信息和车流量信息刻画房产所在区域的吸引力–“人气”
(4)以及房产周围的社会经济属性。我们以美国波士顿地区(GreaterBostonArea)作为研究区域,使用了回归分析和机器学习的方法,分别从两个尺度房屋尺度和街区尺度,来探究影响房产升值的因素。
研究框架分为以下步骤:数据采集,特征构建,模型训练,以及制图与分析。流程图如图3所示。为了进行多源数据融合,我们采集了四方面数据并分别从房屋尺度和街区尺度构建了特征。
具体而言,对于房产信息,我们从美国房产中介公司REDFIN的网站上下载了大波士顿地区 2014-2019年的房产和房价信息,其中房产信息包括了房屋面积,房间数,建成时间等;同时,我们也下载了房主上传的房屋照片,并使用了ResNet深度卷积神经网络提取了高维度视觉语义特征向量来表达房屋环境。我们还计算了房产价值2019年相较于2014年的增值作为升值率。
对于建成环境特征,我们一方面下载了街景数据,使用ResNet卷积神经网络提取图片的特征向量来表达城市建成环境;另一方面我们通过SafeGraph的POI兴趣点数据库计算了房屋附近的服务设施数量与距离以描述周边环境的生活便利度。
图3 实验框架:(A)数据采集;(B)特征构建;(C)模型训练;(D)制图与分析
对于人口流动情况,我们分别使用了SafeGraph的兴趣点访问频率和UberMovement 交通时间数据集来分别刻画一个地区的人流量和交通通达性。此外,我们还从美国统计局获取了每个房屋所在街区的社会经济属性,包括收入,种族比例,失业率等。
为了建模房价升值率,一方面,我们将本研究所提出的多源数据融合框架,与传统的特征价格模型(只包括结构特征和周边设施两方面)进行比较,探究了多源数据融合是否能够更好地建模和表达房价升值率;另一方面,我们分别从房屋尺度与街区尺度建立了模型。
图4大波士顿地区街区尺度下数据空间分布:(A)房屋升值率;(B)房屋价格绝对值(取数);(C)房屋价格(每平方米);(D)访问人数(数据来源:SafeGraph);(E)平均出行时间(数据来源:Uber Movement);(F)波士顿各街区人口数
对于购房者而言,由于他们关注于微观尺度下个体房屋的升值率,以及模型预测的准确度–准确度越高则购房者更满意。因此,在房屋尺度下,我们使用了一种机器学习的方法–Gradient Boosting Machine(GBM)来预测房价的升值率,同时与线性回归的结果作为基准进行了对比。而对于研究人员而言,了解宏观的房价升值率空间分布,并探究和分析其背后的原因有助于决策制定,故本研究在街区尺度使用了地理加权回归(GWR)并与线性回归的结果进行了对比。此外,本研究还分别探究了不同尺度下不同决定因子对于模型的影响程度,从而了解了房价升值率的影响因子。
(1)无论在房屋尺度,还是在街区尺度,相比于传统的特征价格模型,使用多源数据的模型提高了预测精度,从而可以更好地建模房屋升值率,帮助我们更好地理解房价;
(2)在房屋尺度,使用机器学习可以更好地预测房屋的增值率;在街区尺度,使用地理加权回归模型GWR可以更好地对空间异质性建模:
(3)就影响房价升值率的因素而言,除了传统特征模型中的结构特征与周边设施要素之外,本研究还发现了一些新的影响因子。比如,房价绝对值对于房价的增值率影响最大;通过街景图片提取的高维度视觉要素可以表征房屋附近的环境,同时也对房屋的增值率起到了较大的作用。这说明,建模房产周边环境对于房屋升值率的研究中具有重要意义,本研究的框架提供了新的视角和方法。为了进步探究房价绝对值与房价增值率之间的关系,我们采用双对数拟合了两者之间的关系。结果发现,高房价并不意味着高房价增值率,反而呈现了负相关;这可能是因为高房价的房产升值空间(比例)较小,而房价较低的房子总体升值空间(比例)较高。此外,社区内的各种族比例可能对于房价升值率也有一定的影响。
总体而言,房价绝对值与房产升值率的影响因素存在异同,不能一概而论。对于城市的可持续性发展而言,理解和建模房价升值率有助于规划城市的发展和住房政策。本研究提出了一种融合多源地理大数据来分析房产增值率的框架。我们从街景图片与房子照片中提取了高维度视觉向量来表征房屋的环境。研究发现,影响房价绝对值与房产升值率的因素可能不同。本研究展示了房产价值的动态变化及影响因素,有益于房产政策的制定。同时,本研究将多源地理大数据和机器学习的方法与政策有机结合,为社会科学提供了新的视角、方法和技术。
本部分研究发表在城市研究旗舰刊物Cities和Land Use Policy中。参考文献:[1]Kang,Y.,Zhang,F.,Peng,W.,Gao,S.,Rao, J., Duarte, F.,& Ratti.C.(2021).Understanding house price appreciation using multi-source biggeo-data and machine learning.Land Use Policy,111,104919.[2]Kang,Y.,Zhang,F.,Gao,S.,Peng,w.,&Ratti,C.(2021). Humansettlement value assessment from a place perspective: Considering humardynamics and perceptions in house price modeling. Cities, 118,103333
c)以基于城市物质空间特征的“安全感”与城市犯罪率为例,通过构建两者之间的差异度量,提出“感知偏差”的概念,并通过各项社会经济指标进行量化
从个体角度来讲,对城市的视觉感知,一定程度上影响了个体在城市中的行为活动。个体在有选择的情况下往往偏向于在看起来有“安全感”的空间活动,而规避一些看起来缺乏“安全感”的场所。这种行为意味着某些治安良好的空间如果在视觉感受上无法提供足够的“安全感”,则依然无法吸引人类活动;反之,些提供了良好的视觉感受的空间也可能掩盖了它的其他社会属性以及实际的犯罪率,因此降低了人们的警惕。从城市规划和政策制定上角度来讲,给市民营造出一个感官上安全、祥和的生活场所与降低犯罪率同等重要–前者决定了一个城市的吸引力和活力,后者则反映了城市的治安能力。因此地域“感知偏差”指数可以用来度量一个城市在环境治理方面的平衡性
本研究收集了美国休斯顿地区高密度的城市街景数据,使用深度卷积神经网络模型来预测每一张街景在普通人感知层面上的“安全感”分数,并将其与当地的犯罪率进行相关性分析和对比,进而解释哪些在犯罪环境学和城市规划中关注的医素有可能导致不同程度的“感知偏差”。
实验中的主要数据包括休斯顿当地的犯罪数据,城市街道空间安全感数据,城市动态人口数据,城市 POI数据,以及人口,教育程度,失业率,收入等基本数据,研究单元为census block group(美国人口普查地理单位)。其中动态人口数据来源于 Safegraph 公司对手机用户信息的估计结果;城市街道空间安全感数据来源于深度学习模型(Zhangeta1.,2018),对休斯顿38万张街景数据的预测结果(图2),先前研究中的模型学习了数万名个体对数十万张街景的感知评分规律,可以对任意场景的安全感进行评分。
图 5“感知偏差”的构造方法:红色区域为“实际比看起来更危险”的区域,深蓝色为“实际比看起来更安全”的区域,其余为“无显著偏差”。
为了分析可能造成“感知偏差”的城市社会经济环境因素,本研究设计了一个基于“感知偏差”的有序回归(ordinal regression)模型。我们将“感知偏差’定义为三个有序变量,并对暴力犯罪和非暴力犯罪进行分别分析。这三个变量分别为“实际比看起来更危险(more dangerous than it looks)”,“几乎无偏差(similar)”,“实际比看起来更安全(safer than it looks)”。具体分类方法如图5所示。
……
还有更多成果内容,详见项目结题成果报告。该项目报告共计25页,关注城市数据派微信公众号,在微信公众号对话框中输入 24327,即可获得报告全文PDF的下载方式。
最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”或“在看”,没有把我们“星标”,都有可能出现这种状况。
加“星标”,不迷路!看完文章顺手点点“赞”或“在看”,就可以准时与我们见面了~
原文始发于微信公众号(城市数据派):基于街景图像的城市物质空间与城市长期活动时空模式定量关系研究丨城市数据派