规划问道

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

年终技能大冲刺!
前沿主题课程带你弯道超车:
空间句法、街景大数据、国空规划ArcGIS、
ArcPy城市计算、Python、城市大数据

任选2套课程,钜惠价再减200元!
任选3套课程,钜惠价再减360元!
任选4套课程,钜惠价再减520元!
任选5套课程,钜惠价再减650元!

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

加我获取8套课程详细介绍
加我咨询和报名课程
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派




内容导读
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派
通过地理环境特征模拟城市形态及演化过程是城市科学的重要任务之一。由于城市本身的复杂特征和多样的城市属性数据,城市形态模拟任务面临巨大的挑战。深度生成模型,尤其是生成对抗网络(GAN)的快速发展则为该问题的突破带来了希望。然而,基于GAN的模型始终受限于城市数据的稀疏特性和训练不稳定的问题,阻碍了此类模型在城市科学中更广泛的应用。

本文提出了一个基于地理知识导引的生成对抗网络Metropolitan GAN(Metro GAN), 用于普适的城市形态模拟任务。我们引入了逐步增长的结构学习城市形态的层次特征,并设计了地理损失对水体施加约束。除此之外,本研究提出了一个全面的评价体系用以对城市系统复杂结构的相似性进行评估。结果显示MetroGAN在所有指标上都相较于最先进的城市模拟方法有20%以上的提升。值得一提的是,当只使用自然地理条件作为输入时,MetroGAN仍然能够复现城市的一般性空间特征。这些结果都说明了MetroGAN很好地解决了原先城市模拟GAN模型中的不稳定和数据稀疏的问题,并且可以被用于基于多种城市属性的形态模拟任务。


研究数据
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派
我们建立并发布了一个用于城市形态模拟的数据集,包括夜间灯光(NTL)、水体(Water Area)、地形(DEM)以及建成区(Built-up Area)四种数据类型。其中模型的输入为夜间灯光、水体和地形数据,城市形态的真值则使用城市建成区数据(见图1)。最终的数据集包含2000年以及2014年共11863个人口大于10000的城市。

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 1:数据样例。建成区 (Built-up Area) 图像及水体 (Water) 图像为二值图,像元值 1 代表是城区/水体。DEM 和夜间灯光 (NTL) 数据被归一化至 [0,1]。


研究方法
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派
一般来说,GAN由两个网络组成,一个生成器(G)和一个判别器(D)。G用来产生图像,D则用来判断图像是否逼真。通过让判别器D对比真值图像与G输出的图像来训练D的判别能力,而使用D的反馈进一步训练生成器G,G和D相互竞争,最终达到最优均衡。
本研究提出了一种新的基于GAN的框架,即Metropolitan GAN(MetroGAN),来解决城市形态模拟任务。 模型结构如图2所示。


MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 2:MetroGAN 结构图

我们采用L1损失和pix2pixGAN 中的U-Net生成器来强化输入输出图像中对应位置的信息耦合。为了结合城市系统的层次结构特征,MetroGAN引入了逐步增长结构。我们还设计了一个地理约束损失,以施加一个自然地理条件的软约束,即城市不能生成在水上。另外,为了解决训练过程中的不稳定性问题,我们选择最小二乘损失作为对抗损失。MetroGAN的优化目标函数可以表述为:

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

其中,LLSGAN(G,D)为最小二乘对抗损失, Lgeo(G)为水体的地理约束损失, Lgeo(G)为L1范数损失。

针对水体的地理约束
虽然深度生成模型可以自动地学习自然环境的影响,但基于物理导引的机器学习方法(Physics-Informed Machine Learning)启示我们可以在损失函数中添加一些地理约束,使模型产生相应的学习偏置,从而使模型可以学习更加符合地理先验知识的映射。
在地理约束中,建筑不能位于水上的限制可以很容易地实现。我们使用水体和生成的城市影像的哈达吗积作为水体的约束损失。水体图像是一副二值图,其中1代表水,0代表非水体。MetroGAN的输出是一幅单通道图像,其中像素的值代表了该像素为城市区域的概率。乘积中只有在水体上生成城市的像元值不为0,从而可以很好地筛选出此类像元,并通过损失函数对在水体上生成像元这一行为进行惩罚:

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

逐步增长结构
为了让模型更好地学习城市的层次结构特征,我们还引入了逐步增长结构。逐步增长结构是指从生成低分辨率图像开始,在训练过程中依次添加层以处理高分辨率图像的模型结构,该结构已被验证有助于稳定模型并产生高质量输出。基于逐步增长的思想,我们重新设计了U-Net生成器和判别器。对于生成器,我们将其拆分为编码器和渐进增长的解码器。编码器的结构是固定的,解码器从生成4×4图像增长到生成256×256图像。与解码器类似,判别器的层也与解码器同步逐步添加,从获取4×4图像作为输入生长到获取256×256的图像。


城市形态评价体系
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派
由于城市形态是高度结构化的数据,存在自组织的多种结构特征。因此只使用传统的逐像素评价是不够的,忽略了城市的结构特征。对于城市形态的评价,我们主要需要解决两个问题:

1. 生成的城市与对应的真实城市(真值图像)有多相似?
2. 生成的城市是否具有与真实城市相似的复杂特征? 
针对以上两个问题,本文提出了一个城市形态评价体系(如表1)

表1:城市形态评价体系汇总

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

像元层次
按照像素进行图片比对,各像元之间相互独立,缺点是无法考虑结构信息。在像元层次中我们使用传统的PSNR指标。

感知层次
感知层次的图像相似度比较在计算机视觉领域得到了广泛的应用。其更关注于像元之间的联系以及像元分布的结构信息。在感知层次,我们使用SSIM (Structural Similarity Index)和LPIPS (Learned perceptual Image Patch Similarity)。
• SSIM 通过统计学的方法,从亮度、对比度、结构相似性三个层面提取浅层结构特征。
• LPIPS 通过神经网络的深层感知模拟人眼的视觉感知, 从而提取图像的深层结构特征。

多尺度空间层次
遥感影像和普通照片之间最重要的差异是前者具有位置信息。从多个尺度对城市的空间结构进行评价可以很好地考虑城市各部分的位置信息。我们基于空间金字塔匹配算法 (Spatial Pyramid Matching),将每一个亮点像元作为特征点,在对图像进行不同尺度的切割下比较城市形态各部分的相似性,从而将空间位置信息纳入评价体系的考量。

宏观层次
城市是各种类型元素自下而上形成的复杂系统,遵循着许多宏观规律。分形特征是城市最重要的形态特征之一。分形维数常被用来度量该特征及系统的自相似程度。这里出于计算简便性的考量,我们采用计盒维数算法计算分形维数。计算流程为使用不同尺度的矩形(box)覆盖图形边界,并计算所需的矩形数量随矩形尺度的变化趋势。计盒维数的定义如下:
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

其中,其中是在格网尺度下,覆盖城市边界所需要的格网数量。

与分形维数不同,齐普夫定律(Zipf’s Law)是描述城市体系中聚落规模分布的一种统计规律。其描述的现象是在一个城市系统中,面积越大的聚落出现的概率越低,并且聚落出现的概率与其面积的平方成反比。根据齐普夫定律,定居点的大小与其出现频率之间的关系如下:
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派


实验结果
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派
图3展示了随机抽取的部分测试集城市的结果。

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 3:测试集结果展示

宏观层次验证
基于对数变换后的齐普夫定律,使用线性回归计算Zipf 指数,回归系数即为Zipf 指数:

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

 图4显展示了测试集城市Zipf指数的分。100个城市中,84个城市的指数在[-2.25,-1.75] 范围内,98个城市的指数在[-2.5,-1.5] 范围内。这表明生成的城市很好地契合 Zipf 定律。

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 4:奇普夫定律验证结果

对于分形维数,我们计算了真实城市和 GAN 生成城市的计盒位数,并绘制散点图(图 5)。生成城市和真实城市的皮尔森相关系数为 0.811,平均百分比误差仅为 5%。

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 5:分形维数验证结果

与基线模型比较
我们共使用了三种基线模型进行对比:
l XGBoost:基于分类的传统城市提取模型的代表。
l U-Net:图像翻译的经典方法。
l CityGAN:基于pix2pixGAN的城市形态模拟方法。
表2总结了MetroGAN和基线模型的评价结果。为了便于进行直观比较,我们还在图6中展示了真实城市和不同模型生成的城市。

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 6:MetroGAN与基线模型结果对比

表 2:MetroGAN 与基线模型结果对比汇总
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

结果表明,在更关注像素准确性的PSNR 和 SSIM指标上,MetroGAN相较于U-Net 提升了 7%,相较于其他方法提升了 20% 以上。在更关注结构化信息的SPM 与 LPIPS 上,MetroGAN较所有方法都提升了超过 20%。

基于自然环境的城市形态模拟
除了使用夜间灯光数据、地形数据和水体数据共同作为输入,我们还进行了仅使用自然地理条件(地形和水体)作为输入的模拟实验。由于同样的自然地理条件可以衍生出该位置不同历史时期的多种城市形态,我们还输入人口总数标识城市发展进程。具体来讲,我们额外输入了一个像元值为城市的人口数的单值图像。部分结果如图7所示。结果表明,在某些特殊的自然条件下,如城市沿山谷、盆地或海湾时,我们的模型可以生成城市的大致形状和纹理。

MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派图 7:自然环境输入模拟结果


总结
MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派
在本研究中,我们提出了基于地理知识的MetroGAN模型,通过逐步增长结构与地理约束将GAN模型与城市模拟任务有机结合,解决了之前基于GAN的城市模拟模型的不稳定性问题,并验证了MetroGAN处理各种城市属性(例如单独输入自然地理条件)的能力。此外,由于城市的高度结构性和层级性特征,任何单一指标都不足以评估生成的城市。我们提出了一个综合评价体系,用于评估生成的城市是否与真实城市相似,以及生成的城市与相应真实城市的相似程度,弥补了以往城市提取评估标准的不足。

此外,我们发现,通过自然环境变量,即DEM和水体,我们的模型可以在一定的自然条件下生成与实际较为相似的城市形态,这对于进一步发掘自然与城市的关系具有启示性作用。环境决定论始终是地理学和城市科学领域内争论的热点,自然条件对城市形态具有一定的影响,但城市形态又不完全被地理条件所决定,那么自然环境究竟可以在多大程度上影响城市形态,也许可以借助MetroGAN进一步探究这一悬而未决的问题。

参考文献

Weiyu Zhang, Yiyang Ma, Di Zhu, Lei Dong, and Yu Liu. 2022. MetroGAN: Simulating Urban Morphology with Generative Adversarial Network. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD ’22). Association for Computing Machinery, New York, NY, USA, 2482–2492. https://doi.org/10.1145/3534678.3539239


最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”在看,没有把我们“星标”,都有可能出现这种状况。
“星标”,不迷路!看完文章顺手点点“赞”在看,就可以准时与我们见面了~

原文始发于微信公众号(城市数据派):MetroGAN:基于生成对抗网络的城市形态模拟丨城市数据派

赞(0)