导读
随着世界范围内特大城市群的迅速发展,城市群内部各个单元的空间相互作用模式成为城市研究的热点,尤其以人口迁徙及其背后影响机制的相关研究最为广泛。引力模型作为量化和模拟空间相互作用最常用的方法之一,对于研究空间相互作用有着大量的应用经验,并不断发展为一系列适应不同空间尺度及流动类型的模型集。然而,由于我国城市间的Origin-Destination(O-D)历史面板数据十分有限,尤其是城市及更小空间单元之间的O-D数据,目前基于引力模型的空间相互作用模拟研究大多停留在理论研究层面,或者使用假定的模型参数值来估算城市间的O-D流量,缺少实证数据的验证。因此,本文使用百度地图春节返乡的迁徙大数据以代替城市间的人口流动,并结合各城市的社会经济指标、O-D出行时间成本,对粤港澳大湾区(广东省内)9个城市间的人口迁徙进行解读、量化模拟和可视化,探寻多中心型特大城市群内部人口迁徙的主要影响因素及影响强度参数,并结合未来该片区的高铁线路建设,模拟未来可能的人口迁徙情况,对未来的区域规划提出建设性的建议。
本文字数:8999字
阅读时间:27分钟
作者
张尊昊,中国城市规划设计研究院上海分院
江映璇,上海同济城市规划设计研究院有限公司
关键词
多中心特大城市群,空间相互作用,人口迁徙,无约束引力模型,大数据模拟,大数据可视化
01
引 言
近几十年来,随着城市群和都市圈在世界范围内的蓬勃兴起和发展,越来越多的学者开始对包含多个中心城市、内部各城市联系紧密的复杂城市群区域进行研究(Hanssens等,2013;He等,2017),并提出了许多类似的描述性概念,如多中心巨型城市区域(PM-CR)等(Hall&Pain,2006)。在这种背景下,解读和模拟城市间的空间相互作用尤为重要。
粤港澳大湾区涵盖了广东省的九个城市以及香港和澳门,通常被认为是中国最重要的多中心城市群之一,从社会经济规模横向比较来看,它与纽约、东京和旧金山三个著名的国际湾区不相上下(李郇等,2018)。因此,探索粤港澳大湾区内部当前的空间相互作用模式,有效模拟规划实施对其潜在影响具有重要意义。
流动人口迁徙是最常见的空间相互作用形式,中国的快速城镇化和交通网络的不断建设为城市间的人口迁徙提供了动力和机会(李先锋等,2019),特别是在像粤港澳大湾区这样的特大城市群地区。然而,这种频繁迁徙趋势也给住房、公共基础设施和交通带来一定压力,也伴随着一些社会问题的恶化。因此,量化、解读和模拟人口迁徙模式可能是进一步探索这些挑战的基础。
引力模型作为研究和模拟空间相互作用最常用的方法之一(Batty,1972;Poot等,2016),由于在国内缺乏可获得的城市间O-D实证数据,在国内学术界的应用普遍停留在理论研究或使用预设参数来估算流量(顾朝林&庞海峰,2008;胡科林&郑新奇,2015;梅志雄等,2012)。具体到针对国内人口迁徙的研究也是如此,过往大部分基于引力模型的实证研究都是在省级人口迁徙层面,而不是在城市间层面(Li等,2017;Shen,2017)。为了有助于这一领域的研究,本文使用百度迁徙大数据中春节返乡人流的O-D数据代替各城市间人口迁徙的历史面板数据,并利用引力模型更好地量化、模拟和可视化粤港澳大湾区内部各城市间的人口迁徙。
02
文献综述
2.1 无约束引力模型在空间相互作用领域中的应用
空间网络中的空间相互作用可以定义为地理区域之间按不同要素进行的“交换流”(Norris,1972),通常可以用统计矩阵来描述,流的起源地和目的地标记为i和j,流量大小定义为Fij。空间相互作用研究中使用的引力模型是从牛顿引力定律(1687)导出的:

引力模型很早就被观察到适用于社会科学的各个领域,即两个地方之间的空间相互作用很可能与这两个地方的质量或吸引力成正比,与它们之间距离的平方成反比(Davis等,2013)。早在1931年,雷利就在零售业的背景下提出了这种定律,并创造了他的零售引力定律(Batty,1978)。后来,Zipf的早期研究(1946)认为城市间的运动也存在同样的原理,但他认为流量与距离成反比,而不是像经典物理学中那样提高到距离的二次幂。
尽管物理学中的引力模型针对空间相互作用的适用性已经在许多早期实证研究中得到了证明,但始终没有建立起完善的理论框架。直到1967年,威尔逊提出将最大熵原理应用于研究旅行分布(Williams,2019),才终于从根本上发展出了引力模型在空间单元之间应用的理论基础。威尔逊推导过程的核心思想可以概括为:在一个封闭系统中,在总出发、总到达和总旅行费用的约束下,最高概率出现的旅行分布应该是该系统的熵达到最大值时(Batty,1972;Wilson,1971)。在此基础上,Wilson(1971)根据已知的系统约束条件,将引力模型扩展为一系列相关模型。其中,威尔逊模型系列中的无约束引力模型在实践中通常表述如下:

其中,Tij为空间相互作用的量化值,Oi和DJ代表始发地和目的地的质量,Cij指旅行成本,如旅行所需的时间或距离,α、β作为变量的参数被用于对始发地和目的地质量的重要性给予一定的弹性(Batty&Mackie,1972),参数γ也被称为旅行成本的摩擦系数。
由于其中的3个参数α、β、γ,特别是旅行成本的摩擦系数γ,需要根据研究系统的历史观测O-D数据来估计,因此该模型需要进一步校准。通过取两边的对数并用回归模型估计参数,将方程2转化为线性公式(方程3),是一种广泛接受的校准过程方法(Flowerdew& Aitkin,1982)。

同时,在针对人口流动分析的回归模型选择上,一些学者认为,普通最小二乘法(OLS)是估算对数线性模型的最常用方法之一(Ramos&Suriñach,2017)。然而,Flowerdew和Aitkin(1982)也强调,泊松回归或负二项回归模型可能比OLS更适用,尤其是在预测一些存在极小值流量的情况中,其原因可以概括为:预测的人口迁徙通常是非负整数,并且很有可能满足泊松分布而不是正态分布(Dennett,2018)。
2.2 运用引力模型的人口迁徙研究
本文重点的研究对象为空间相互作用机制影响下的城市间人口迁徙O-D流,城市间的人口迁徙定义为随着长期居住地址改变而发生的人口流动。根据我国的户籍制度,我国的流动人口可以明确定义为长期不在户籍所在地居住或工作的群体,按照不同行政区范围可以区分为省际流动、市际流动和区际流动等。
虽然目前利用引力模型对人口迁徙的实证研究是在不同的空间系统和不同的地理层次上进行的,但对于不同因素对人口迁徙的影响,普遍存在一些共性的发现。例如,世界各地的大多数实证研究表明,出发地和目的地的人口规模、人均收入,以及旅行成本,不论是针对国际人口迁徙还是国内人口迁徙的流动量,普遍都有着巨大的影响。
另一方面,引力模型中的一些指标参数的影响在不同的层级的空间系统可能有所差别,或者参数的影响大小可能很大程度上取决于不同类型的人口迁徙。Boyle等人(1998)在他们对英国非大都市区域内的跨县人口流动的研究中强调,住房需求和住房供给类型对人口迁徙起着至关重要的作用。Shen(2017)的研究表明,目的地的气候恶劣性和农村发展情况可能对中国国内的省际人口迁徙有重要影响。在国际人口迁徙方面,引力模型的考量参数指标会变得非常复杂,包括迁徙政策、文化差异和边界效应等。因此,引力模型在实际运用中,需要考虑纳入的变量及其对人口迁徙的重要性在不同的地理尺度或不同的国情可能也有所不同。
此外,随着近几年空间数据可视化的流行和发展,对空间相互作用的可视化表达,如O-D图等,不仅可以帮助我们更好地理解复杂空间系统内部联系的特征和模式,而且可以为城市规划和政策决策提供更有意义的参考(Batty,2013;2018)。
03
数据处理及研究方法
3.1 研究区域与地理尺度
考虑到可获得数据的局限性,本文的研究范围包括粤港澳大湾区内的属于广东省的9个城市:广州市、深圳市、珠海市、佛山市、惠州市、东莞市、中山市、江门市、肇庆市,不包括香港和澳门。根据9*9构建O-D矩阵,不考虑城市自身内部的人口流动,区域内9个城市之间的城市间迁徙共包含72个人口迁徙流。
3.2 数据获取与预处理
3.2.1城市间人口迁徙数据
首先,通过对百度地图迁徙平台提供的城市间每日人群迁徙量指数进行处理,以反映实际的流动人口迁徙流量。百度地图主要利用其“基于位置的服务”功能来收集中国城市间每日O-D的旅程总量,即记录安装或调用百度地图应用程序的用户的位置变化。如图1所示,在中国文化的背景下,春节前的大约两周通常被定义为在外流动人口返回家乡的高峰期。为排除近几年春运可能受到的疫情影响,本文对比了深圳和肇庆两地2019年和2020年的人口迁入数据(图2),发现与春运返乡阶段划分具有高度一致性。同时,将百度迁徙数据与各城市统计年鉴中公布的流入和流出人口总量进行对比拟合,发现存在较强线性相关关系(图3)。因此,通过多维度对比和数据校核,本文认为2020年1月10日至2020年1月25日(16天)的返乡流动量之和可以很大程度代表和反映我国城市间实际的流动人口迁徙。

图1:2019年与2020年春运前后阶段划分示意图(图片来源:作者自绘)

图2:深圳(SZ)和肇庆(ZQ)两地2019年与2020年春运前后百度迁徙指数量变化折线图(图片来源:作者自绘,数据来源:百度地图迁徙数据)

图3:广东省21个城市2019年1月10日至1月25日百度迁徙流动指数之和与各城市统计年鉴中流动人口数据分布的散点图(图片来源:作者自绘)
3.2.2 迁徙成本(时间)数据
在迁出城市与目的城市之间的迁徙成本方面,本研究根据不同的交通方式,采用了三种旅行时间数据:最小开车时间、可乘坐所有铁路的最小旅行时间(优先是高铁或动车)和仅乘坐普通火车的最小旅行时间。与以往许多实证研究(Dennett&Wilson,2013))中使用的空间距离不同,旅行时间更真实地反映了当下公路和铁路系统全面覆盖下真实的区域通勤时间。本文利用Python脚本从百度地图路线矩阵API中抓取城市间公路交通最小行车的时间。其次,乘坐各种公共交通和仅乘坐普通列车的最小旅行时间都是从12306中国铁路提供的所有列车时刻表中收集的。
3.3 无约束引力模型的变量选择及模拟方法
3.3.1 变量的筛选及模型建立
由于本研究的主要目标是定量地探讨不同社会经济指标与城市间人口迁徙流量之间的关系,因此采用了引力模型家族中的无约束引力模型(前文中的方程2)。

表1:本次研究引力模型中变量定义统计表(图片来源:作者整理)
此外,结合文献综述中的其他共性研究以及中国实际的社会经济情况,除了传统引力模型中的出发地和目的地的人口变量外,本文中还加上了其他潜在指标(Karemera等,2000;Shen,2017)。表1列出了所有本次无约束引力模型中涵盖的社会经济指标和用来代表旅行成本的三类旅行时间。在此基础上建立了一个无约束引力模型,如下所示:



由于在本研究中使用了三种旅行时间测度(Cij),因此需要首先讨论它们对人口迁徙流量(Mij)的不同敏感性。图4显示了粤港澳大湾区各城市之间的人口迁徙流量InMij与三种迁徙成本数据InCij的散点图,这些散点图结合了线性回归模型的相应结果。通过对调整后R²值的比较,只乘坐普通列车上的旅行时间比其他两种旅行时间测度对人口迁徙流量变化的解释能力相对较低。因此,本研究将任何公共交通工具的最小行驶时间和最小旅行时间引入到后续的引力模型校准中。

图4:人口迁徙流量(InMij)与三种不同的旅行时间(InCij)的拟合散点图(图片来源:作者自绘)
3.3.2 模型校准方法
由于研究中使用的人口迁徙数据不是实际流动人数,而是来自百度地图的函数化的流动指数,因此本研究采用对数线性回归(上文中的方程4)来校准模型中的参数,而不是泊松回归。此外,本文将通过计算方差膨胀因子(VIF)和相应的公差来识别回归模型中潜在的多重共线性。在本研究中,可接受的系数显著性水平为5%。
3.3.3 针对未来城际轨道交通规划建设的模拟研究方法
在模型校准完成的基础上,经过数据校核的模型将用于进一步模拟未来铁路建设对人口迁徙的影响,其主要体现于城市铁路建设完成后,采用公共交通的最小旅行时间变化。本文对未来铁路建设完成后采取两组预估旅行时间,即到2025年的近期规划建成后的最小旅行时间和到2035年的远期规划建成后的最小旅行时间,将分别取代现状的旅行时间代入模型中,以产生近期和远期的预估人口迁徙流量。需要明确的是,这次进一步模拟并不涉及粤港澳大湾区中各城市社会经济指标的变化。因此,最终结果只能代表城际轨道交通建设后产生的影响,而不是对未来真实的人口迁徙流量的预测。
此外,模拟的近远期人口迁徙流量与原有流量的变化率,将会被用来定量评估这两个规划阶段的影响,详情如下:

未来铁路建设后的预估人口迁徙流量为,
代表i与j之间的原始流量。
04
模拟结果和讨论
4.1 人口迁徙现状及可视化
如图5所示,毫无疑问,广州和佛山之间的人口迁徙互动是粤港澳大湾区中最高的一个。佛山、广州、东莞、深圳和惠州之间的长期迁徙率也明显高于其他城市,形成Z型地理结构(孙文勇等,2019)。从迁徙总量来看,这五个城市也是区域联系结构中最重要的节点。除了这个极具视觉冲击力的Z字形结构外,珠海与中山之间的联系也意义重大。另一方面,江门在人口迁徙方面与其他8个城市联系最少,其次是肇庆和珠海。

图5:粤港澳大湾区9个城市之间的人口迁徙流量现状分布图(图片来源:作者自绘)
其次,本文进一步计算了粤港澳大湾区9个城市之间的人口迁徙的净流量(图6)。肇庆是粤港澳大湾区内人口净流出总量最大的城市,对其他8个城市都是呈现人口净流出状态,流出的两个主要方向是佛山和广州。相反,深圳是唯一一个对其他8个城市都是人口虹吸效应的城市。在人口净流入总量方面方面,东莞和佛山仅次于深圳,这两个城市的人口吸引水平也很高。然而,作为粤港澳大湾区中的另一个中心型城市,广州对东莞和深圳主要呈现人口净流出态势。

图6:粤港澳大湾区9个城市之间的人口净迁徙流量现状分布图(图片来源:作者自绘)
对比图5和图6,可以识别出粤港澳大湾区内部中心城市与周边城市之间功能转移的潜在规律。广州和深圳作为珠三角最发达的中心型城市,虽然有大量的外来人口总数迁入,但其自身也有显著的人口迁居到周边的卫星城市,如佛山、东莞和惠州。这种情况在一定程度上可以归结为中心城市的一些高能级城市功能向周边卫星城转移,比如一些特定的高新产业和居住功能从核心城市转移(孙文勇等,2019)。以佛山向广州的巨大迁入流为例,由于近年来这两个城市之间轨道交通网络的完善,比如彼此之间地铁网络的直连,广州的一些制造业和民营企业开始向佛山转移,越来越多在广州工作的人选择在房价低得多的佛山落户安家(杨培霖,2019)。
4.2 引力模型的参数校核
表2显示了将人口迁徙的历史数据导入引力模型后,得到的变量参数结果。由于本文选用了两种不同的旅行成本Cij,因此最终参数校核结果包含一个使用最小驾驶时间的结果,以及另一个基于任何公共交通的最小旅行时间的结果(结果显示在括号内)。

表2:粤港澳大湾区9个城市之间的人口迁徙引力模型参数拟合结果(表格来源:作者整理)
首先,从调整后R²的数值来看(0.773和0.826),这两个引力模型所用的自变量在很大程度上解释了因变量。同时,由于VIF试验的结果均在10以下,公差均在0.1以上,自变量之间不存在严重的多重共线性。
从所有11个自变量与人口迁徙流量相关的显著性来看,这两个模型结果仅在3个变量上表现出大于5%水平的差异,包括:目的地的第三产业比重、来源地的GDP增长率和目的地教育状况。另一方面,本次模型拟合结果与以往关于人群迁徙的研究在三个指标上有一定的共性(Poot等,2016;Shen,2017),即来源地的常住人口数量、目的地的城镇家庭平均收入水平和两地之间的旅行时间成本对城市间人口迁徙的影响均十分显著(均低于0.01显著水平)。考虑到这两个模型之间的相似性,本文将仅使用基于最小驾车时间的模型结果来确定每个重要变量与人口迁徙流量之间的进一步关系。
4.2.1 人口指标
来源地城市和目的地城市的常住人口变量(Pi,Pj)系数均为正,显著性分别为0.2%和3%,这表明,无论是来源地还是目的地的常住人口增加都可能鼓励它们之间的人口迁徙。同时,通过比较它们的标准化系数(0.296和0.208),发现来源地的人口增加对人口迁徙流量的影响大于目的地人口增加。此外,常住人口众多的城市可能并不意味着就业更饱和,反而是代表对人口迁入更有吸引力。
4.2.2 经济指标
在经济指标的影响方面,目的地的平均收入与人口迁徙流量在1%的水平上呈显著正相关。而且,其系数大于2(2.384),表明城市平均工资水平高的城市对外来人口具有敏感的吸引力。从实证结果来看,来源地和目的地的第三产业比重(TIi,TIj)对人口迁徙流量的影响均不显著。城市经济增长速度对长期移民的影响部分符合预期,即来源地城市快速的经济发展(GDPGi)对人口流出有一定抑制作用,因为在3.3%的显著水平上,系数估计约为-0.533。因此,除了传统的用静态面板数据来表示城市的规模外,城市的一些动态变化也是影响人口流入与流出重要因素,如城市的发展潜力。
4.2.3 房价与教育指标
尽管高房价一直是中国社会讨论的焦点,但在粤港澳大湾区的实证研究中,目的地城市的高房价(Hj)对人口迁徙的负面影响并不显著,这与徐腾和姚洋(2018)的研究结果相似。目的地城市的教育水平(Sj)的变量系数为1.086,表明目的地较好的教育资源可能吸引更多的外来人口流入。
4.2.4 O-D之间旅行成本指标
两地之间的最小驾车行驶时间(Cij)的标准化系数为-0646,是所有变量系数中绝对值最高的一个,意味着在所有变量中其对人口迁徙流量的影响最大。具体而言,基于方程(2)和方程(4),如果粤港澳大湾区内两城市之间的最小行驶时间增加一倍,而其他变量保持不变,则这两个地方之间的人口迁徙流量将仅为原来的17%左右。
4.3 粤港澳大湾区城际铁路规划对人口迁徙模式的影响模拟
为了模拟人口迁徙流量 Mij 在《粤港澳大湾区城际铁路建设规划》实施完成后的情况,采用上述经校核后的模型参数,剔除无显著性变量(5%显著性水平),结合规划中各站点预计的通勤时间(2025年预计各城市间最短通勤时间如下表3),再进行逐步回归处理。结果如模型方程(6)所示,调整后的R²为0.825。



表3:至2025年粤港澳大湾区9个城市之间的最短城际轨道交通通勤时间预估(注:括号内红色数字为至2025年预估时间,表格来源:作者整理)
此外,城际铁路近期规划(2025)和远期期规划(2035)两个方案的增长率计算如下,以定量衡量这两个阶段的影响,其中,

为原始两地间人口迁徙流量,

为近期规划建成后的估计流量,

代表受远期铁路规划建成后影响的流量。


4.3.1 近期铁路建设的影响
受近期铁路建设影响下的模拟的人口迁徙流量如图7所示。通过将这一近期模拟结果与图5所示的当前流量比较,近期的城际铁路建设将大大有助于将原本被边缘化的城市,如中山与广州,拉入区域人口迁徙的紧密城市网络。总的来说,到2025年,现状大湾区“Z形”的人口迁移结构将因佛山、东莞和深圳之间的人口迁徙流量增加而变得更为丰富。此外,从江门到中山的人口迁徙数量预计将大幅上升。

图7:2025年城际轨道建设后粤港澳大湾区9个城市之间的人口迁徙流量模拟情况分布图(图片来源:作者自绘)
此外,受到近期铁路建设影响的所有16个流量的增长率如图8所示。到2025年,大幅增加的人口迁徙可能都将围绕东莞展开,其中佛山与东莞以及广州与东莞之间的人口迁徙数量可能会达到目前的两倍。因此,在未来的几年里,东莞很可能会随着大量来自或流向周边城市的流动人口,成为粤港澳大湾区人口迁徙网络中最重要的焦点。这意味着,随着未来近期城际轨道交通的建设实施,东莞可能会面临更严峻的住房需求和就业竞争问题。

图8:2025年城际轨道建设后粤港澳大湾区9个城市之间的人口迁徙增长率模拟情况分布图(图片来源:作者自绘)
4.3.2远期铁路建设的影响
在实现粤港澳大湾区的“一小时大都市区”目标后,2035年的模拟的人口迁徙结构(图9)与2025年的模拟情况(图7)非常相似。背后的原因可以通过受影响的人口迁徙增长率解释(图10)。虽然远期城际轨道交通的建设将促进许多城市间的人口迁徙,特别是从惠州与其他城市之间的人口流动,但这些流动本来的数值基数很小。因此,这些增加并没有在整个迁徙网络中造成明显的视觉变化。值得注意的是,远期规划可能会大大提高处于粤港澳大湾区地理边缘的四个城市之间的人口流动,包括:惠州、肇庆、江门和珠海。

图9:2035年城际轨道建设后粤港澳大湾区9个城市之间的人口迁徙流量模拟情况分布图(图片来源:作者自绘)

图10:2035年城际轨道建设后粤港澳大湾区9个城市之间的人口迁徙增长率模拟情况分布图(图片来源:作者自绘)
05
结 语
本文主要通过无约束引力模型对粤港澳大湾区内部各城市间人口迁徙流动的相关影响因素进行模拟、分析和可视化,并在此基础上,针对大湾区近期和远期的城际铁路建设规划对这些迁徙流动的潜在影响进行了模拟。此外,根据模型拟合的结果,本文还量化揭示了这些移徙流动与包括社会经济和两地之间通勤时间等因素在内的不同指标之间的关系。这些研究结果可以为规划决策者提供服务,以优化城市功能和公共资源的分配,以应对未来粤港澳大湾区内移民模式的变化。
尽管本研究中使用的引力模型在展示中国聚集空间相互作用方面显示出显著的适用性,但这种模拟方法排除了对系统内个体微观选择机制的解释(Hua and Porell,1979;Sheppard,2010;Yan,2014;2017)。因此,未来的研究可以开拓其他模型来探索在微观层面上的迁徙行为模拟,如介入机会模型和随机游动模型,从而验证或比较本实验的结果。
参考文献(上滑查看全部)
*本文为2023中国城市规划年会论文
【免责声明】本公众号发布的内容仅供学习交流使用,不以任何形式进行牟利。内容版权归原作者所有。如有侵犯您的权益,请及时与我们联系,我们将于第一时间协商版权问题或删除内容。内容为作者个人观点,不代表本公众号立场和对其真实性负责。
你可能还想看这些
读城 | 唱好新时代西部“双城记”

点击图片阅读全文

理论研究 | 樊杰:“十五五”时期中国区域协调发展的理论探索、战略创新与路径选择

点击图片阅读全文

专家视点 | 陆大道:关于中国城市与区域发展格局的深度思考和重磅建议

点击图片阅读全文


原文始发于微信公众号(中国城市规划):理论研究 | 多中心特大城市群人口迁徙模拟——以大湾区为例