准确识别城市场所的功能对合理规划城市、提高城市化质量具有重要意义。当代城市生活方式的“高频”的特征使得城市功能在精细时空颗粒度上高度混杂而动态,为现有的城市功能识别方法带来了挑战。本文引入一种新的城市功能代理,即4G无线电信网络流量数据,其具有完全匿名、较低偏误、高频实时、蕴含人类时空行为信息丰富等优势。本文尝试通过对电信流量数据的挖掘,提出一种推断城市场所混合功能的新方法。
基于以下假设:(1)电信流量数据中包含细粒度的人类行为特征;(2)城市区域的功能本质上反映在其所包含的人类行为的组合中,本文猜想城市场所的功能与其电信流量特征之间存在对应关系。考虑电信流量的时间序列,我们进一步猜想,每个“基本”城市功能都应具有独特的时间特征模式,并且观察到的城市场所的流量时间序列是这些基本模式的叠加。本文对这些猜想进行了实证检验。实证分析的整体框架如图1所示:
图1. 分析框架
首先,根据建筑物的面积将50m网格系统中的电信流量分配给建筑物,然后对建筑物的流量时间序列进行标准化。其次,对标准化序列进行K-Means聚类,以初步对具有相似曲线模式的建筑物进行分组。接下来,使用官方规划文件和POI验证典型曲线模式的相应城市功能,从而确定基本功能及其基曲线。之后,利用基曲线分解原始时间序列,确定每栋建筑的基本功能的线性混合系数,从而表示混合功能。若总共有 K 种基本功能,每种基本功能的基曲线为 Bk,其在建筑物中 i 的权重为:
对于建筑物 i , Wi,k 是待求参数,确定参数值的方法为:
其中, Si 为建筑物 i 的标准化后的原始流量时间序列。Wi,k 计算出的的信息熵即为该建筑物的功能混合度。
此外,为进一步揭示城市功能混合的更多细节,我们引入城市功能的另一种代理,即城市肌理,并将其与上一步得到的功能混合系数拼接,使用层次凝聚聚类对建筑物进行第二轮聚类。本文采用的城市肌理数值的计算步骤是,对建筑物生成“面Voronoi多边形”,去除道路面积后,对建筑物对应的面Voronoi多边形面积取对数。详细的方法介绍请参考原文与补充材料。
本文的两个案例研究区均位于中国深圳,如图2。研究区域A位于深圳北部,以居民区为主,设有高铁站、物流园区等设施。研究区域B位于深圳南部福田区的中心地带,其中心区域为福田中心CBD。两个研究区域都包含两类典型的居住区:“常规”城市社区,和有时被视为较差居住形式的“城中村”。这两个区域都是典型的混合用途区域。
图2. 研究区域
K-Means步骤得到的5类曲线的形状如图3 (a)所示,图3 (b)显示了与每条曲线相对应的建筑物分布(同一类建筑物与对应的曲线颜色相同)。通过对照官方规划文件、百度POI等各种城市功能代理,发现这五种曲线大致对应于《雅典宪章》中城市的四种基本功能。第1类和第5类对应的建筑大多是城市的住宅区,包括“常规”城市社区和城中村,因此对应于居住功能。第3类对应的建筑物大多是办公楼,因此对应工作功能。第4类对应的建筑大多具有娱乐功能,因此该类可归结为娱乐功能。研究区域B的第2类建筑与地铁站位置一致,因此第2类区县可归类为交通功能。这意味着该方法的提取结果与经典规划理论吻合较好,使得每栋建筑都可以根据其所属的聚类初步划分为四种基本城市功能之一。当然,交通功能的识别不是很准确,因为研究对象是建筑物,而建筑物本身很难是纯粹的交通功能。因此,我们提取了三种基本类型的城市功能的电信流量基曲线:居住、工作和娱乐(图3 (c))。
图3. 使用流量数据的聚类、曲线、其对应的建筑物以及提取的基本曲线评估结果比较
图4显示了在混合城市功能上应用基于基曲线的分解方法后,研究区域A和B的识别结果。83.87%的建筑物经过基曲线线性混合后的与原始曲线余弦相似度值大于0.9。这意味着这三条基曲线可以很好地代表建筑物在两个区域的功能。图4 (a)∼(c)显示了所有建筑物各种基本功能的权重系数。研究区域A的居住系数一般在0.9以上,大部分建筑物的功能和娱乐系数相对较低,说明该区域建筑物的主要功能是居住。研究区域B中,居住和工作系数呈现明显的区域分布:在写字楼聚集的北部,工作系数普遍高于0.8;在东部和南部居住区,居住系数大多高于0.9。图4 (d)显示了建筑物的功能混合度,其在两个研究区域都分布不均,部分居住小区、城中村、火车站呈现出高度的功能混合。此外,对日间和夜间数据分析发现,虽然大多数建筑物相同功能的系数在日间和夜间的差异有限,但一些特定建筑物在日间和夜间的主要功能存在明显差异,如图4 (e)∼(f)所示。
图4. 混合城市功能分解的结果
在层次凝聚聚类中,我们通过重复实验确定建筑物聚类的最佳参数组合,识别出五种类型的建筑物,这些建筑物在功能和肌理方面具有明显的特征(如图5)。第1类主要包含城中村;第2类主要是“普通”居住区;第9类建筑物大多是具有与工作相关的功能的建筑物,例如办公楼;一些比普通住宅楼更大的建筑物被标记为第5类,大多是具有特殊功能的建筑,或具有混合城市功能的商业地产建筑;第7类建筑是体积非常大且具有特殊功能的建筑,如深圳北站、会展中心、市民中心等。
图5. 研究区域A和B的层次凝聚聚类结果
提取五类建筑物(即第1、2、5、7、9类)的原始流量,将每个聚类中所有建筑物的流量相加,得到总流量的时间序列,然后对每个时间序列进行标准化。对于第7类,除了上文提到的三座大型功能建筑外,还有一些较小的建筑位于研究区的外缘,我们认为这些建筑也是边缘效应引起的噪声。因此,这些“嘈杂”的建筑物被排除在计算之外。结果如图6所示。无论是直接观察其形态,还是对这些建筑分别进行基曲线分解,结果都与我们之前对这些类别的解读基本一致。
图6. 层次凝聚聚类结果的标准化流量时间序列
对结果的定性验证,以及其它详细信息,请见论文原文与补充材料。
本文提出了一种新的方法来分解观察到的人类行为时间序列(电信流量消耗)并据此挖掘城市功能。城市肌理信息的引入将推动城市功能检测向更精细的空间和语义粒度发展。用其他数据源支持的先验知识对结果进行验证,证明了方法的普遍有效性。若以适当的方式与其他常见的地理空间和众包数据结合使用,“高频”社会感知数据可以更好地支撑城市研究。规划师和管理者可以利用电信流量数据准确识别城市土地上的实际功能以及混合方式,例如改善对城中村等实际上功能高度混合的区域的功能识别。
这些发现也为城市理论提供了启示。现代主义的座右铭“形式服从功能”意味着一种独特的形式/功能二分法:建筑物的形状(或城市地区的肌理)取决于人们对其功能的需求。然而,研究结果表明,建筑物、城市区域和整个城市的形式和功能之间存在更微妙的关系,特别是从“高频”的角度来看。比起经典的形式/功能二分法,本文在更精细的时空粒度中观察到的城市生活符合新城市主义的座右铭——“混合收入,混合用途”。这种“高频”现象可能反映了城市化的新趋势。
参考文献
Tang, J., Cheng, X., Liu, A., Huang, Q., Zhou, Y., Huang, Z., Liu, Y., & Xu, L. (2023). Inferring “high-frequent” mixed urban functions from telecom traffic. Environment and Planning B: Urban Analytics and City Science, 23998083231221867.
最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”或“在看”,没有把我们“星标”,都有可能出现这种状况。
加“星标”,不迷路!看完文章顺手点点“赞”或“在看”,就可以准时与我们见面了~
原文始发于微信公众号(城市数据派):【“高频”城市功能识别新视角】电信流量数据的挖掘与应用丨城市数据派