资源库

【信息化天地】漫谈基于视觉数据的城市定量研究

城市视觉数据包含了包罗万象的城市信息,是研究城市极佳的数据源。如果将城市数据分为视觉数据和非视觉数据两类,前者包含信息的深度和维度远大于后者。视觉数据一般包括图片数据和视频数据,来源有个人摄像摄影设备、谷歌、腾讯、百度等公司提供的街景照片、Flicker照片、监控摄像头、无人机、移动拍摄设备等。


利用视觉数据展开城市研究由来已久。早在1971年,威廉·H·怀特采用延时摄影技术开展了开创性研究项目——街道生活研究,讨论了气候、空间、建筑和人类行为之间的关系。扬·盖尔在公共生活研究中倡导影像记录法,他认为“照片和影像是用来定格空间情景的良好工具,为日后提供文档和分析依据……在更为复杂的城市空间环境下,照片和影像会帮助研究者进一步挖掘细节,以弥补人眼在现场观察难以获得的完整信息”。在当时技术条件的限制下,扬盖尔认为自动化识别的准确性和效率比不上人工方式。在过去几十年里,城市研究者采用人工的方式拍摄和解读城市视觉数据,无法大规模地推广和展开。


近年来,不断涌现的大数据为城市研究打开了崭新的研究视角,而经过长时间发展起来的业已成熟的计算机视觉技术为大规模、细粒度、自动化地解析城市视觉数据提供了强有力的技术支撑。


下面介绍一些比较有代表性的研究:


1
利用网络照片的表层信息展开研究

   HollensteinPurves提出了利用网络照片的标签数据与地理信息识别城市中心区与划定边界的方法,并以6个世界城市为案例进行实证研究,探讨了不同标签在不同城市中心识别过程中的差异。Garia等人利用网络照片数据识别欧洲主要旅游城市的游客与居民的行为差异,分析出游客与居民的活动区域,探讨两种人群在城市活动的聚集与离散关系,并揭示了不同城市游客空间的分布差异。剑桥大学Daniele Quercia等使用FlickrFoursquare的社交媒体照片的拍摄时间、标签等信息,自动识别安全和可步行街道。曹越皓等利用公开数据集中照片的地理位置信息与深度学习标签,识别中国24个城市的主导城市意象。


2
解析视觉数据内在“物”的要素

  

在这一领域,最具代表性的为MIT Media Lab以Naik为首的一众研究者,他们利用了数量特别庞大的众包数据集(全球N个大城市的数据,7000人参与评分),采用基于深度学习的计算机视觉技术对街景图像进行语义分割,经过训练后的卷积神经网络模型可对街景图像进行大规模自动化识别,代表性研究有街道的安全性、活力度、美观度和富饶度四维度测度、街道品质变化等等。他们指出,这一技术可以展开全球范围街道尺度的研究。


国内比较有代表性的有清华大学/北京城市实验室的龙瀛团队,他提出了“图片城市主义”,提倡在城市研究中重视图片数据。他的团队与合作者开展了多个基于视觉数据的研究:采用Matlab提取街景图片中HSV通道的绿色值计算城市街道的绿视率;采用人工判读的方式对同一地点两个时间点的街景图片进行对比打分,进而开展空间品质测度;引入了卷积神经网络对全国287城市中心采集到的街景数据进行语义分割,进而对街道空间品质进行评价。


国内其他比较有代表性的还有北京大学张帆、同济大学叶宇、百度慧眼中规院联合创新实验室等的研究,均采用了一个基于深度学习的神经网络模型,训练后的网络能对输入的街景图片进行自动化识别。张帆的研究可以预测所在街道上居民平均每小时的出行量曲线,即基于街景图像预测每天不同时刻出租车的乘车量。叶宇的研究自动识别街景图片中街道绿视率、天空可见度、建筑界面等七个要素,进而判断街道的空间品质。百度慧眼中规院联合创新实验室开展了基于深度学习的北京城市街道景观意向识别,基于街景数据自动识别生活型、商业型、交通型等五个城市道路类型。


3
解析视觉数据内在“人”的要素

北京城市象限人本观测实验室茅明睿在大栅栏旧城更新研究中通过监控摄像头拍摄的照片进行年龄、性别和情绪的识别。龙瀛团队利用可穿戴相机对每隔30秒拍摄的照片进行人工判读,绘制出个体行为时间线,进而展开时空行为的研究。成都市规划设计研究院和四川大学图像信息研究所的合作研究中利用了监控摄像头拍摄目标场景的视频,采用基于深度学习的计算机视觉技术展开人流量、年龄结构、性别比例、情绪、有无佩戴眼镜等要素的识别。


总体上,从数据类型来看,街景图片是视觉数据中被利用最多的一种数据,社交媒体图像数据和监控视频数据的相关研究也逐渐增多。研究范畴主要集中在街道尺度的空间品质评价、安全度、绿视率、活力等方面,也有部分研究涉及了收入水平、人口结构和空气质量,还有一些利用可穿戴摄像设备采集视觉数据以研究个体时空行为。研究方法上,前期规划行业机构主要使用人工判读等相对简单的方法分析视觉数据,少量研究借助比较成熟的机器学习算法提高解析效率。而以MIT城市感知实验室为代表的研究机构则设计了更复杂的深度学习模型以对海量视觉数据进行大规模自动化识别,传统规划院开始与互联网公司、专业图像研究机构展开合作共同研究视觉数据。


利用基于深度学习的计算机视觉技术解析城市视觉数据,用以准确感知城市是城市定量研究的一大趋势。深层网络是一个黑盒子,强于预测,但不易解释。因此,这类研究可以帮助我们更加高效地感知和认识城市,却无法解答“为什么是这样”这一类的问题。另外,由于缺乏理论基础,超参数和网络设计也是一个很大的挑战,这也是目前制约深度学习的一个重要因素。最后,适合中国城市的标准数据集的建立也是一项庞大且长远的工程,需要在未来的研究和探索中予以关注。


参考文献

1.扬·盖尔 . 公共生活研究方法[M]. 中国建筑工业出版社, 2016.09

2.韩龙玫, 卿粼波. 视频大数据在城市公共空间规划领域的应用前景探索[J]. 四川建筑, 2017, 37(3):12-15.

3.George Seif. 深度学习并非万能:你需要避免这三个坑[DB/OL].https://mp.weixin.qq.com/s/7j3iFfbnGrp_7b9FOIMrGg, 2018-08-15


【信息化天地】漫谈基于视觉数据的城市定量研究


相关阅读

【信息化天地】四个步骤达成GIS批量生成最短路径成就

【前沿】当我们看风景时,我们在看什么?

【前沿】5G时代与城市规划

【前沿】植被指数分析的原理与应用介绍

【前沿】玩转大数据——成都各区域主导产业分析





(长按二维码识别就可关注我哦^-^)【信息化天地】漫谈基于视觉数据的城市定量研究




原文始发于微信公众号(成都市规划设计研究院):【信息化天地】漫谈基于视觉数据的城市定量研究

分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址