写在前面
基于活动的交通需求模型从人的活动需求本源出发,能很好地刻画活动与出行之间的关系,进而建立城市规划或交通规划方案与居民生活之间的关联。回顾国际上从四阶段交通需求模型到基于活动的模型发展,总结北美基于活动的模型软件的模型特点、开发程序和实践经验。根据超大城市的模型应用需求、数据条件、运算速度和开发效率情况,设计了适用于上海市的基于活动的模型框架结构。基于活动的模型包括重构人口个体数据的人口仿真(合成)模型、强制性活动的中长期模型,以及包含出行链和中间停留点的短期模型等模块。重点介绍了模型参数标定的总体情况,并利用居民出行调查、百度位置服务、手机信令等多源数据对模型结果进行多维度校核验证,结果表明模型准确度高、运行速度快。最后指出,基于活动的模型优势显著,但其他城市应用时需权衡开发成本和应用的实际效果,建议以四阶段模型为基础开展基于活动的模型开发。
张天然
上海市城市规划设计研究院 综合交通规划分院院长 正高级工程师
研究背景
传统四阶段模型(Four-Step Model, FSM)是基于出行的模型(Trip-Based Model, TrBM),在过去70年里得到不断改进。四阶段模型是当前国际上交通规划编制的主要分析方法,其雏形见于1953年底特律都会区交通研究(Detroit Metropolitan Area Traffic Study, DMATS),采用了交通生成、交通分布和交通分配3个阶段[1]。1955年开展的芝加哥区域交通研究(Chicago Area Transport Study, CATS)首次提出完整的四阶段预测模型,即交通生成、交通分布、方式划分和交通分配4个步骤[2]。20世纪70年代,美国联邦政府要求在交通模型中考虑交通设施建设对环境的影响,并且倡导多方式交通规划,即在小汽车交通以外关注公共交通和其他交通方式。同时,美国联邦政府要求对交通模型进行改进,提出对包括非集计模型(Disaggregate Model)和均衡分配(Equilibrium Assignment)在内的交通分配方法进行研究,也由此形成了快速反应方法以及基于出行链的模型(Tour-Based Model, TBM)和基于活动的模型(Activity-Based Model, ABM)的雏形。与集计的四阶段模型不同,基于出行链的模型和基于活动的模型是非集计模型,其核心是分析个体的交通出行行为,能很好地反映交通政策及管理措施对出行的影响。1991年,美国交通部联邦公路局(Department of Transportation Federal Highway Administration)启动了“交通模型改进项目”(Travel Model Improvement Program, TMIP),旨在通过整合最新研究成果改进传统四阶段模型、提高模型的分析精确度和应用范围[3]。该项目至今仍在运行,较好地促进了交通模型理论发展和实践创新。除了基于出行链的模型和基于活动的模型外,20世纪90年代也涌现了基于智能体的模型(Agent-Based Model, AgBM)[4-6]以及集计和非集计模块组合的混合交通需求模型(Hybrid Travel Demand Model, HTDM)[7-8]。
在美国,已经有30余个大都市规划组织(Metropolitan Planning Organization, MPO)进行了高级交通需求模型(指TBM、ABM和AgBM,多数为ABM)的实践,有实际可用或者正在开发阶段的ABM的大都市规划组织比例超过70%。基于活动的模型也已经在德国、荷兰鹿特丹、瑞士苏黎世、丹麦哥本哈根、以色列特拉维夫、比利时弗兰德斯、澳大利亚墨尔本、新加坡、日本等国家和城市投入应用。中国自20世纪80年代开始引入交通规划模型,迄今为止,四阶段模型仍然是各大城市实践模型应用的主体,对高级交通需求模型的开发和应用处于长期观望态度。近年来,北京、广州、武汉等城市开始尝试高级交通需求模型的开发和实践应用,特别是武汉和无锡基于相对集计的TBM[9]、广州市黄埔区基于时空推演的ABM[10]是适应中国城市发展特点的交通需求模型的创新探索。
上海交通规划模型已经有40多年的发展历史,经历了公共交通规划模型、市区交通规划模型、市域交通规划模型以及上海大都市圈模型等阶段,有力支持了上海市城市交通建设发展。随着中国城市发展进入新时代,人民对于美好生活的需要日益增长,这对城市与交通规划工作提出了新的要求。过去,上海市面向未来的交通规划和评估工作主要基于传统的四阶段模型展开。传统模型仅考虑集计于交通小区的出行频率,忽略了每个出行者的活动与出行之间的关系,因而无法建立城市或交通规划方案与居民生活之间的关联,无法很好地践行以人为本的规划理念。针对这一问题,需要探索建立上海市基于活动的交通需求模型(以下简称“基于活动的模型”)。作为中国首个超大城市基于活动的模型实践,本文探讨模型的框架结构、模型验证和计算性能并进行展望,为中国其他城市的高级交通需求模型建设提供参考。
基于活动的模型基本概念
出行作为派生需求,根源是人的活动需求。依据行为决策理论,基于活动的模型根据人的活动需求来决策是否出行、去往何处、何时出行以及如何出行。对全日活动模式的模拟和计划时间需要适应活动及出行的特征。例如,通勤类固定活动会优先计划时间,购物、就餐等临时活动会在通勤时段以外进行计划,出行方式受到出行链的影响,若开车外出则要开车返回。
常用的四阶段模型是基于出行的模型,是以出行为单位进行分析的交通需求模型。与基于出行的模型相比,基于出行链的模型更多地考虑了前后出行之间的关系(出行链是指开始或结束于家或工作地的多次出行构成的链)。基于活动的模型则是基于活动停留点(Activity Stops)构成出行链的交通需求模型,包含出行链、出行、活动停留点等要素,与基于出行链的模型差异主要体现在对活动停留的考虑。图1展示了基于活动的模型要素构成,包括一个人的2个出行链(Tours)、7次出行(Trips),第一条出行链有4个活动停留点(工作地、加油站、杂货店、幼儿园)和5次出行,第二条出行链有1个活动停留点(餐馆)和2次出行,其中活动停留点还应考虑活动的持续时长[11]。

图1 基于活动的模型要素构成
资料来源:根据文献[11]绘制。
基于活动的模型最大的特点是非集计,将单个出行者作为研究对象,利用计算机模拟每一个居民一天的活动行程安排,然后模拟出行行为,继而评估整个交通系统的状况。因此,在给出交通系统评价指标的同时,基于活动的模型还能展示居民活动和出行时间的变化,从而更全面地评价城市规划、交通规划对于居民生活方式与生活质量的影响。
基于活动的模型平台开发实践
基于活动的模型实践源于Bowman和Ben-Akiva于1995年[12]开发的一套日活动计划模型,1998年和2001年先后在波特兰和旧金山[13]得到发展并投入应用。2005年,Bowman和Bradley[14]在萨克拉门托开发完成了基于活动的模型程序。2010年以来,基于活动的模型一直是美国交通部联邦公路局TMIP关注的重点之一。2012年,TMIP委托资源系统集团公司(Resource Systems Group, RSG)和栢诚集团(Parsons Brinckerhoff, PB)对基于活动的模型进行半年共12期的培训[11]。2015年美国交通研究委员会(Transportation Research Board, TRB)“战略公路研究计划二期”(The Second Strategic Highway Research Program, SHRP2)项目发布了《基于活动的交通需求模型:入门指南》[15],介绍了基于活动的模型概念以及与实施相关的注意事项,探讨了交通机构在从传统交通需求模型向高级交通需求模型迁移时所面临的实际问题,包括交通机构的重视程度和研发能力、开发成本和周期、数据要求、方法和软件开发、模型应用等。目前北美地区已有30多个城市完成了模型开发并投入使用,实现了由四阶段模型向基于活动的模型转变。
虽然四阶段模型有多个商业软件可以选择,但是基于活动的模型没有固定的模板,欧洲和北美的咨询公司多使用各自开发的模型系统。欧洲典型的基于活动的模型程序结构相对简化,如英国交通部支持开发的DIADEM[16]以及德国PTV公司开发的VISUM出行链模型[17]。北美得到广泛应用的基于活动的模型程序主要包括[18-21]:
1)资源系统集团公司的DaySim是首个基于活动的模型程序,主要应用于西雅图、费城和那什维尔等城市模型。DaySim的前身是Bowman和Ben-Akiva的日活动计划方法,早期版本采用Pascal语言开发。经过10年左右的开发和实践,该公司首次在萨克拉门托市建模过程中开发完成了DaySim程序,随后经过多个功能拓展移植到其他城市使用。DaySim模拟家庭成员的日活动出行安排,并将个人的出行决策分为三层:日活动模式(Day Pattern)、出行链(Tours)、中间停留点及出行(Intermediate Stop and Trips),按分层次序进行模拟,并通过对数和(LogSum)形成下层模型对上层模型的约束,具有较好的一致性[22]。DaySim的开发语言为C#,包含高计算效率的多线程功能,可拓展性较强,于2016年在Github平台上开源。
2)栢诚集团的CT-RAMP是应用最广泛的基于活动的模型程序,主要应用于哥伦布、圣地亚哥和凤凰城等城市模型。该公司自主开发了一个协调出行和地区活动的模型平台(Coordinated Travel-Regional Activity Modeling Platform, CT-RAMP)[23]。CT-RAMP在美国应用最为广泛,不同城市在其基本框架基础上研发了特定模块以适应城市的特殊情况以及满足规划部门的应用需求。CT-RAMP的模型结构与DaySim类似,但日活动计划模型是多层选择结构,第一层先按强制性、非强制性和在家三类选择活动类型,然后再选择具体活动类型和出行链。CT-RAMP使用的理论模型包括离散选择模型、活动持续时间模型、时间使用模型和有约束的个体出行仿真等。CT-RAMP源代码使用JAVA语言编写,可以跨平台开发、运行和维护,具有较强的可拓展性,可根据城市需要改动模型结构。
3)剑桥系统公司(Cambridge Systematics, CS)的TourCast主要应用于丹佛、明尼阿波利斯双子城、休斯敦和巴尔的摩等城市模型[24]。早期采用Pascal语言开发的DaySim并不具有并行计算功能,采用了严格的深度优先算法。该公司在构建丹佛地区基于活动的模型以及为“战略公路研究计划二期”C10B项目整合DaySim时,吸取了DaySim在萨克拉门托市的经验。丹佛地区基于活动的模型使用与DaySim非常类似的模型结构,但采用面向对象的C#语言以及严格的广度优先算法进行开发。而后在休斯敦基于活动的模型建设中,开发了新的模型平台TourCast。TourCast的理论基础也是Bowman和Ben-Akiva的日活动计划方法,但其模型模块混合使用了深度优先和广度优先算法,而早期DaySim采用的深度优先算法、丹佛地区基于活动的模型采用的广度优先算法则是两个极端。TourCast与DaySim和CT-RAMP的不同之处是,日活动计划模型按照个人强制出行、陪伴出行/家庭联合出行、个人非强制出行的优先顺序进行活动和出行链安排。TourCast也采用C#语言进行开发,可以并行计算,运行时间短。
4)资源系统集团公司开发了ActivitySim模型平台,并于2021年发布了《基于活动的模型由用户建立并为用户服务》白皮书(ActivitySim: Activity-Based Travel Demand Modeling Built by and for Users)。该平台的目标是:基于最佳软件开发实践创建并维护先进、开源、基于活动的模型软件,免费向公众发布。ActivitySim由MPO、交通部和其他交通规划机构组成的财团领导,该财团为项目开发提供技术指导和资源。ActivitySim采用Python语言编写,可以跨平台开发,更容易兼容机器学习算法并利用多核计算解决基于活动的模型算力和内存需求;在Linux中可以调用较大内存,根据广州的测试,300万人以上的基于活动的模型消耗内存超过250 G。在ActivitySim中,目的地选择模型是否考虑影子价格影响对算力和内存的要求差别很大。
5)美国得克萨斯大学奥斯汀分校Chandra Bhat博士2003年用C++语言开发了日活动出行模式综合计量经济微观仿真器(Comprehensive Econometric Microsimulator for Daily Activity-Travel Pattern, CEMDAP)[26]。与上述4个平台不同的是,CEMDAP将人分为就业和非就业两大类来分析活动和出行,并首次在时间选择模块中将时间作为连续变量而非离散变量,以提高模型的真实性和详细时间预测的准确性。上述4个平台的模型主要使用多项Logit或分层Logit模型,而在CEMDAP中根据选择集的不同特征使用6种不同的建模方法,包括二元Logit、多项Logit、危险持续时间、回归、有序probit和空间位置选择模型。总的来说,CEMDAP的模拟更加细致但模型复杂度也高,仅在洛杉矶得到了应用。
根据以上平台的实践经验,基于活动的模型开发一般考虑以下因素:1)开发语言是否具有多线程计算能力;2)内存的调用限制;3)模型的配置方法采用文本文件、数据库或是Python程序;4)模型组件的执行顺序是深度优先、广度优先或混合型;5)模型输入输出数据的快速调用采用数据库或矩阵技术。根据模型结构设计和计算性能要求,往往需要对以上因素进行权衡。值得一提的是,北美诸多城市基于活动的模型往往需要特定的计算模型程序与商业交通规划软件结合,以形成实践应用的平台。
上海市基于活动的模型结构设计
1
输入数据和框架
基于活动的模型输入数据包括校核扩样后的居民出行调查数据,以及交通小区人口、就业岗位、用地和交通网络数据等。居民出行调查数据涉及居民一天内的出行起讫点位置、出发到达时间、出行目的、出行方式等信息。由于调查未能反映家庭成员之间陪伴出行情况,因此无法支持开发以家庭为决策单位且考虑家庭成员之间互动情况的基于活动的模型,但可以支持开发以出行者个体为决策单位的基于活动的模型。居民出行调查数据的校核扩样需要融合应用各种交通调查数据和百度位置服务、手机信令等大数据。结合国外基于活动的模型基本框架和具体数据条件,上海市基于活动的模型建立了一个针对某工作日的个人非集计交通需求模型,主要包括人口仿真(合成)模型、中长期模型、包含出行链和中间停留的短期模型(见图2)。

图2 上海市基于活动的模型框架
注:“基于工作地的非工作出行链”指通勤者基于工作地的非通勤出行链,即除通勤出行之外,出行链的起止端均为工作地的出行链;“基于家的非工作出行链”指通勤者基于家的非通勤出行链,即除通勤出行之外,出行链的起止端均为家的出行链。
1)人口仿真(合成)模型。
用于生成上海市家庭及其成员的个体记录,包含各种家庭和人员的属性,用于非集计模型分析。
2)中长期模型。
针对居民强制性活动及长期存在的活动,对就业者和中小学生应用强制性活动位置选择模型、强制性活动日程安排模型和通勤方式选择模型,预测并拟合个体的出行起讫点位置、出发到达时间及出行方式;对每个家庭应用车辆拥有模型,并应用车辆分配模型将车辆数分配到家庭成员。
3)短期模型。
首先,通过工作者工作日外出工作选择模型明确个体是否工作,将短期活动个体分为无强制性户外活动日程安排个体及受强制性户外活动日程安排约束个体。然后,对个体的出行链分别应用出行链频率模型、出行链主目的地选择模型、出行链方式选择模型、出行链时间选择模型等,并将通勤个体的出行分为9个时间点位(见3.4节)分别建立基于家出行链、通勤路上出行链及工作地出行链模型。对于出行链上的中间停留点应用中间停留点频率模型、活动类型选择模型、目的地选择模型、方式选择模型及中间停留时长模型。
2
主要模块
1)人口仿真(合成)模型。
人口仿真(Population Synthesis, PS)又称人口合成,是一种人口个体数据重构的方法。它以家庭和人员样本为种子、以总体特征分布为边界约束条件,推断包含家庭属性和人员属性的城市全体人口数据。家庭和人员的个体记录数据是基于活动的模型构建的基本输入数据。上海市基于活动的模型的人口仿真以居民出行调查数据为种子数据,采用先进的增强的迭代比例更新(Iterative Proportional Updating, IPU)算法在交通小区层面进行模拟。仿真结果与第七次人口普查形成的各个边界约束条件的拟合效果较理想,与人员性别、年龄和就业情况等交叉边界约束条件的拟合效果也比较理想,可以作为基于活动的模型基础输入数据[27]。
2)中长期模型。
该模块包含强制性活动位置选择模型、强制性活动日程安排模型、车辆拥有模型、车辆分配模型及通勤方式选择模型(见表1)。
表1 中长期模型主要模块说明

3)短期模型。
短期模型包含出行链模型和中间停留模型两大部分。首先,应用工作者工作日外出工作选择模型将居民划分为无强制性和受强制性户外活动个体:无强制性户外活动日程安排个体的短期出行链模型包括出行链频率模型、主目的地选择模型、方式选择模型、时间选择模型;受强制性户外活动日程安排约束个体的短期出行链模型包括非强制性出行链频率模型、非工作主活动点位选择模型、基于工作地的非工作出行链模型、通勤路上出行链模型、基于家的非工作出行链模型。两类个体的中间停留模型主要为中间停留点频率模型、中间停留点活动类型选择模型、中间停留点目的地选择模型、中间停留点方式选择模型和中间停留时长模型(见表2)。
表2 短期模型主要模块说明

3
人员与活动类型划分
根据调查样本数据和模型结构设计,模型中人员划分为5种类型,包括就业者、小学生(6~10岁)、中学生(11~17岁)、离退休人员,以及待业无业人员(见表3)。
表3 人员类型划分

根据调查样本与相关研究中的出行目的,户外活动可以细分为12种类型,各类活动的优先度设定为:工作(上学)>外出公务(外出学习)>接送孩子>接送其他人>个人事务>吃饭>购物>探亲访友>文化休闲娱乐。一条出行链包含的所有活动中优先度最高的活动即为该条出行链的类型,优先度最高的活动即为出行链的主活动。“工作中途回家”是一种特殊类型出行链里的“回家”行为,作为此类出行链的主活动,优先度最高。其他类型出行链中的“回家”没有优先度。在模型应用中,根据实际情况和活动的优先度对活动类型进行重新编号(见表4)。
表4 活动类型划分

4
时间与空间划分
时间划分方面,针对工作日的某一天24 h内的个人活动与出行行为进行建模,活动安排以30 min为基本时间单元,将一天划分为48个时段。仅考虑00:00—24:00在上海市域范围内的出行,期间离开上海或从外地抵达上海的人员活动数据不予考虑。此外,将通勤者或学生一天的活动时间划分为9个时间点位:1上班(上学)前,2上班(上学)路上,3工作(上学)上午段,4午饭段(工作者11:30—12:30,学生11:30—13:30),5工作(上学)下午段,6晚饭段(17:30—18:30),7工作(上学)晚上段,8下班(放学)路上,9下班(放学)后。通勤者日活动模式和时间点位关系如图3所示。空间划分方面,采用上海市现有交通规划模型划分的5 762个交通小区。

图3 通勤者日活动模式和时间点位关系
模型参数标定、验证和运行速度
1
参数标定
使用扩样后的居民出行调查数据对基于活动的模型各个子模型的参数进行标定,共涉及参数5 428个,根据模型特点分别采用Python和Nlogit作为标定工具(见表5)。
表5 模型标定情况

2
结果验证
基于活动的模型模拟的总人口为2 459.6万人,总出行次数为5 160万人次。利用多源数据分别从职住联系、出行方式、出行距离分布及主要通道查核线等方面对模型模拟结果进行校核验证。首先,将模型模拟的职住联系结果分别与居民出行调查(扩样)统计的职住联系和百度数据识别的职住联系进行对比,发现模型得到的交通大区之间的职住联系与两者的拟合度较高,R2均在0.95以上(见图4a和图4b)。其次,从出行距离分布情况看,将模型模拟结果与出行调查数据、百度出行大数据中居民的单次出行距离进行比较,三者的出行距离分布基本一致(见图4c),模型与两类数据的R2分别为0.92和0.94;通勤者上下班时间方面,模型模拟结果与居民出行调查结果的分布基本一致(见图4d);从主要越江桥隧交通量以及快速路交通量看,模型模拟分配交通量与现状调查结果也基本一致(见图4e和图4f);从出行方式看,模型模拟结果的各方式出行比例与居民出行调查结果非常接近,通勤者平均误差0.2%、最高不超过1%,非通勤者平均误差0.8%(见图4g和图4h)。可见,各项对比均表明基于活动的模型模拟结果较为准确。

a 模型结果与居民出行调查统计的职住联系对比

b 模型结果与百度数据识别的职住联系对比

c 出行距离分布对比

d 通勤者上下班时间对比
注:每个时段以30min作为时间间隔,一日包含从0~47共48个时段。

e 越江桥隧交通量对比

f 快速路交通量对比

g 非通勤者出行方式对比

h 通勤者出行方式对比
图4 基于活动的模型结果验证
3
运行速度
基于活动的模型普遍特点是运行耗时长、消耗资源多。为了减少资源消耗、提升效率,基于活动的模型(包括基于智能体的模型,如柏林工业大学基于Java开发的能够模拟个体出行及活动行为的开源交通仿真软件MATSim)会采用按1%~10%不等的抽样计算模式,而投入实践应用的模型一般需要全样本计算,这也导致工程实践中MATSim的普及率远不如其在学术研究领域的普及率。
针对将近2 500万常住人口、5 762个交通小区的上海超大城市基于活动的模型,要投入实践应用必须考虑运算效率。因此,在总结国际基于活动的模型平台开发经验的基础上,对开发语言的选择和效率测试十分重要。结合交通规划软件和开发语言的多次测试,最终选择C#语言作为模型主要运算模块的开发语言。C#相对C++具有较高的开发效率,相对其他语言具有较高的运算效率,可以调用TransCAD的矩阵和各类数据,也能够便捷地生成动态链接库以供TransCAD调用。基于C#语言开发的模型主要运算模块包括目的地选择模型、活动持续时间模型、Logit模型、比例数Logit模型、Probit模型、多元有序Probit模型、日程安排模型和车辆分配模型。同时也使用了TransCAD的GISDK开发程序和Python,负责调用C#接口并处理数据。模型运行计算机为Windows 10操作系统,内存256G,频率为2 933 MHz,CPU为Intel Xeon Gold 5222,8核16线程。模型包括6大模块、33个子模块以及106个基础模型,整体运行时长为203 min(不包含模型输出数据后期处理和交通分配等应用模块),子模块运行时长见表5。
写在最后
上海是一个具有将近2 500万常住人口的超大城市,由于基于活动的模型是基于个体的非集计模拟,超大规模的计算对模型开发效率和快速应用具有极大的挑战。上海市基于活动的模型从模型应用需求出发,综合考虑建模数据条件、运算速度和开发效率等要求,设计了相应的模型结构,实现了快速计算与适当简化的平衡。同时,综合考虑了开发语言的多线程计算能力、内存调用限制、模型的配置方法、模型组件的执行顺序(深度优先、广度优先或混合型)以及模型输入输出数据的快速调用(GISDK和Python综合应用)。通过利用居民出行调查、百度位置服务、手机信令等多源数据对模型结果进行多维度校核验证,表明模型准确度高、运行效率快,可为中国其他城市的交通模型建设提供参考。但是,该模型未来还需要进一步深化,如模型的合理性、敏感性等。此外,在现状模型的基础上如何开发规划模型,特别是在人口演化模型和人口仿真模型的结合方面,规划模型的参数调整仍面临挑战。
尽管基于活动的模型优势显著,但相对四阶段模型,其模型结构复杂、对数据的要求更高、模型参数更多,应用时需权衡开发成本和应用的实际效果,性能不佳的基于活动的模型可能还不如普通的四阶段模型。因此,中国城市应以四阶段模型为基础开展基于活动的模型开发。
除了可实现四阶段模型对交通需求预测和交通供给方案的评价外,基于活动的模型还具有精准反映个人出行行为、高精度的时间和空间分辨率、可灵敏反映人口细分和就业岗位变化、更好地进行交通政策评价等优势,因此,基于活动的模型应用范畴更广。基于活动的模型在人的日活动模式安排、中长期模型、短期模型,对居民生活水平评价,职住平衡和用地规划分析,以及“15分钟社区生活圈”规划等方面均具有广阔的应用前景,需要进一步探索。
《城市交通》2024年第4期刊载文章
作者:张天然,王波,宋少飞,朱春节

点击“阅读原文”查看
“案例研究”栏目更多内容

关注解锁更多精彩
2024128期
编辑 | 耿雪 张宇
审校 | 张宇
排版 | 耿雪
原文始发于微信公众号(城市交通):张天然∣超大城市基于活动的交通需求模型建设:上海的探索与实践