
叁
2019
交通数据科学的研究与实践专题
LEARN MORE
智慧交通发展急需交通数据科学
王印海 崔志勇
作为智慧城市的重要组成部分,智慧交通在城市综合发展与新技术的推动下不断发展完善。随着新型智能感知、数据存储、移动通信等领域取得长足发展,交通行为所产生的海量交通数据在以大数据、云计算、人工智能为核心的现代智慧交通研究与应用中扮演着举足轻重的作用。海量交通数据拥有广义大数据所具有的数据量大、种类多、形式多样、产生速度快、价值密度低等特性。云计算以其实时性、易扩展性及泛在的强大计算能力,为海量交通数据的存储、提取、处理、融合和分析提供了可靠硬件保障,也为高效准确地实施管理决策提供了技术支持。而新兴人工智能技术在计算机科学领域与互联网相关产业取得的巨大成就,也给现代智慧交通提供了一个强有力的分析决策手段。在这样的大背景下,一批以智慧城市为代表的“互联网+交通”项目在中国广泛开展并取得了诸多成果,有效提升了城市的智能化水平。
然而,对交通海量数据进行进一步的有效挖掘与使用需要相关的理论支撑。建立在大量理论假定和小样本数据验证基础上的传统交通科学,难以满足新时代智慧交通的发展与建设需求。因此,亟须建立与发展交通数据科学来满足智慧交通的理论与实践需要。顾名思义,交通数据科学是以数据为驱动,通过对海量数据的分析与挖掘来探索交通问题的理论体系与解决方案。交通数据科学将利用多源交通数据,结合交通系统特征及传统交通理论方法,为交通的管理与运营提供切实可靠的决策依据,解决拥堵与安全等交通核心问题,推动新型智慧城市的发展。本文在已有研究基础上简要介绍交通数据科学,总结以海量数据为基础的智慧交通科研与实践所面临的挑战与发展前景。
交通数据科学是利用海量交通数据解决交通问题的计算密集型科学,致力于为交通系统的高效、安全运行提供科学的分析决策手段。其核心是海量交通数据的管理与理论分析,主要包含以下几方面内容:
1)多源交通数据的关联体系。每项交通数据的采集可能来自于交通系统内的某个具体任务,也可能是系统外某项应用的副产品。这些数据具有不同的时空精度、格式、对象。将这些数据有机地组合使用无疑将会带来更大价值。而将各类数据关联的最佳方法往往是将每项数据都绑定到交通系统网络上(例如道路网、航空网等)。
2)数据质量控制。海量交通数据往往伴随各类噪声和杂质,需要去伪存真或者剔除杂质来形成质量可靠的可用数据。
3)针对具体问题并结合各个数据集及采集点的时空关系构建模型。这是一个极具挑战性和创造性的过程,传统的交通系统理论、运筹学理论、机器学习及其他人工智能方法都可以得到充分的展示与应用。
4)运用交通大数据平台或其他云计算平台的强大运算功能求解目标问题。根据结果对模型和计算方法进行适当调整与修正,并从个案中提取普遍规律,逐步完善交通数据科学理论。
当然,现阶段以海量交通数据为驱动的智慧交通在研究和应用层面都面临着诸多挑战,这些挑战也是交通数据科学在建立与发展过程中所要面对的。
首先,多源交通数据的采集、存储、清洗、提取是科学利用交通数据的前提,而新型多源交通数据的体量巨大、数据多元、类型复杂、利用难度高等特点都不是传统交通科学所熟悉的。尽管现阶段交通数据的存储、清洗、处理方法已有显著进步,大部分城市交通系统依然存在交通数据源单一或者多源数据无法融合的问题。
其次,传统交通理论及方法较多依赖数学模型,这些理论模型对现实复杂交通问题的拟合不够准确、全面,难以有效指导参与者类型繁多且过程复杂的实际交通问题。虽然新兴的人工智能技术能够利用大数据解决一些传统理论或模型无法解决的交通问题,但是如何在传统交通理论的基础上,结合新兴人工智能技术,为专门解决复杂的交通问题设计一系列新模型、新方法是我们所面临的巨大挑战之一。
再次,在新模型新方法层出不穷的大背景下,如何验证新方法的有效性、可靠性、可扩展性以及如何依据新方法实现对交通需求及交通行为的精准调控,是基于数据科学的智慧交通系统有待发掘和提升之处。
此外,由于现阶段海量交通数据的采集与利用缺乏统一的管理标准,数据的传输与应用存在较高的安全风险。随着政府与民众对个人隐私和数据安全的关注程度的提升,包含国家安全和交通参与者隐私信息的交通数据的安全性也应在解决交通问题的同时受到足够的重视。值得一提的是,现阶段不同种类的交通数据的采集和存储往往由不同的交通管理部门或商业公司执行完成,如何破除横亘在多源数据之间的壁垒同时简化数据共享、集成的流程是一大挑战。
尽管面临诸多挑战,滴滴、Uber、Lyft等共享出行企业已经基于海量交通数据在出行服务、缓解拥堵、智慧交通平台等领域进行了一些成功的探索。此外,高德、百度、谷歌等推出的众多电子地图应用也在出行导航、出行规划等智慧交通领域取得突出成果。现阶段,基于海量交通数据的人工智能技术在智慧交通、智慧制造和智慧物流等领域的研发与应用方兴未艾。基于海量交通数据的交通数据科学在以下几个方面有着广泛的应用前景:
1)海量交通数据的处理与融合仍在技术与理念上有极大的发展空间。由于大部分交通数据具有时间、空间属性,依据多源交通数据中共享的属性建立互相连接的数据结构或可成为多源数据融合的一种解决方案。例如基于地理空间信息的多源数据融合技术以及具有处理多源数据能力的交通数据平台[4]有能力解决这一问题。
2)将新型机器学习、人工智能方法与传统交通分析理论相结合,形成具有智慧交通特色的理论分析体系,将成为交通领域又一重要前瞻性课题。现阶段人工智能等新技术的应用主要集中在基于深度学习的时空数据、高维数据、视频图像数据的分析以及基于强化学习的交通信号控制、网约车智能调度、高效路径规划、自动驾驶等领域。但作为交通数据科学的决策中枢,模型和方法的选取需要根据具体数据类型和特定的交通问题具体分析、量体裁衣。利用众多新型深度学习模型的强大分析能力,探索复杂交通问题的形成和发展机理值得进一步发掘与创新。与此同时,复杂度极高、参与者极多的大规模城市交通网络以及智能网联自动驾驶汽车也为更高级人工智能技术的产生和发展提供了新的实验与应用场景。
3)由于涉及交通系统的人、车、路、环境等各个方面海量交通数据的加速整合,囊括了汽车制造、共享出行、地图应用等行业的智慧出行生态系统以服务为导向,在出行即服务(Mobility as a Service)领域有着广阔的应用前景。交通数据科学有能力以分析交通历史数据和交通参与者的出行模式为基础,在多种交通基础设施、交通工具的支持下,为多方式组合的综合交通体系提供决策支持。
4)自动驾驶、智能网联汽车、车路协同等将成为多源交通数据、人工智能及智慧基础设施在智慧交通中深入融合与应用的典型场景。作为自动驾驶、车路协同的主要承载者,道路的智能化能够极大地促进人、车、路、环境等各个方面的有机结合。智慧道路已经受到学术界和工业界的关注。以自动驾驶为例,实时多源数据融合、可靠高速数据传输、高精度地图信息、网联道路基础设施等均成为其技术发展的关键模块。
5)交通安全作为交通领域的核心问题之一是所有交通参与者关注的问题。新环境下交通安全的提升也应依托交通数据科学,从数据采集、分析方法、决策建议等方面做出改进。未来多源交通数据有能力覆盖交通事故发生地点及周围环境的时空信息,以此为基础提出或选择适当的分析模型,能够为交通事故提供有效分析并给出改善对策。
当前,国内外城镇化进程持续加速,科技进步日新月异,基于交通数据科学的新型智慧交通必然能在机遇与挑战并存的大环境下,在未来智慧城市的发展中扮演更重要的角色。人工智能技术在计算机视觉、复杂结构数据分析等领域取得的成就也带动了自动驾驶、智能网联汽车在交通领域的研究与应用。随着逐步迈入以自动驾驶和出行即服务为特征的新时代,传统的交通参与者、出行方式,甚至交通规则都会产生巨大变革。未来以数据为驱动的智慧城市综合交通体系的设计和实现将成为城市交通发展的重要方向,而新型城市交通建设因其复杂程度也给城市交通的研究人员、设计者、管理者留下极大的想象与创新空间。因此,在新时代新环境下,通过进一步为海量交通数据的采集和共享提供支持、不断提升解决复杂交通问题的能力,交通数据科学的理论内涵和应用必将得到极大的提升与加强。在交通数据科学的理论指导与支持下,智慧交通的建设将会更加高效并富有成果!
基于手机数据的出行链推演算法
吴子啸
摘要:利用手机数据推演居民出行特征是近年交通研究中的一个热点。尽管已有众多研究成果发表,但现实应用中仍有诸多问题需要解决和改进。提出一种基于手机数据的出行链推演算法,通过构造时空贪婪同化流程来处理手机数据的空间不确定性,并对传统聚类算法进行改进以提高活动地点识别效率。通过个体实际数据验证了算法的有效性。结果显示,与其他方法相比,提出的算法能够高效地锚固居住地、工作地等停留较长时间的出行端点,从而提高出行链推演的效率和准确性。该算法适用于多天、手机基站定位和三角算法定位的混合位置数据,对现实数据有很好的适应性。
手机信令数据识别职住地的时空因素及其影响
钮心毅 谢琛
摘要:使用手机信令数据识别职住地时,采用不同规则和参数取值可能导致结果差异。这种差异对职住地识别结果可靠性的影响程度值得研究。根据手机信令数据特性,提出职住地识别的时间连续性、空间位置分辨率、数据时间序列3个关键时空因素。采用4种时间规则、3种空间聚合距离、3种数据时间序列进行组合,对同一城市同一批手机信令数据进行职住地测算。比较不同时空因素下职住地识别结果的差异,采用识别率、平均直线通勤距离、共同识别用户一致性等指标验证结果的可靠性。研究表明,不同的时空因素对职住地识别结果产生显著影响。最后,探讨在实际应用中时空因素取值需注意的问题,并提出相关建议。
大数据在广州市第三次交通综合调查中的应用
苏跃江 陈先龙 吴德馨
摘要:传统抽样调查往往是调查某个时段某类群体的个体属性和出行信息,难以确定个体的连续活动模式和活动特征。而利用大数据进行连续的特征追踪、动态观测和分析个体的空间活动特征成为可能。首先分析传统抽样调查与大数据挖掘的差别与关系,进而总结北京、上海、广州城市交通综合调查的演变历程及特点。以广州市为例进行实证研究,梳理2017年广州市第三次交通综合调查的框架和特点,从挖掘特殊指标、实现多源数据相互补充与校核两个层面探讨大数据在交通综合调查中的作用。
大数据支撑下的交通需求管理体系研究
熊杰 陈彪 李向楠 陈艳艳 郝世洋
摘要:单纯提高交通供给能力无法从根本上缓解城市交通供需失衡的矛盾,而交通需求管理理念已越来越广泛地应用于相关政策制定中。在阐述城市交通需求管理内涵的基础上,结合大数据与信息化行业应用背景,提出大数据支撑下的交通需求管理体系框架。进而从出行总量控制、出行分布调整、出行时间均衡、出行空间均衡、交通结构优化5个维度分析城市交通需求管理政策的制定思路与作用机理。最后,阐述了大数据对交通需求管理政策绩效评估的支撑作用。
云计算模型在智慧交通系统中的应用研究——以深圳市为例
张爱国 范文强 张迎娅
摘要:为了缓解城市交通拥堵、保障交通安全、提升智慧交通管控水平,采用云计算模型与智慧交通管理系统相结合的方法,构建智慧交通云系统结构框架。通过深圳智慧交通云服务平台的实际案例应用,实证了云计算的超强计算能力、系统融合能力、信息集成能力、个性化服务能力等能弥补目前智慧交通系统中子系统间共享困难、数据分析处理不及时、信息传递延迟等问题。提出加快研究智慧交通云计算系统的推广应用,以便提升交通信息化管理水平、改善城市交通运行状况。
大数据时代的交通模型
Cuauhtemoc Anda, Alexander Erath, Pieter Jacobus Fourie 著 宗晶 译
摘要:通过新的大数据来源诸如手机通信记录、智能卡数据以及社交媒体地理编码记录,可以前所未有地观察和了解出行行为的细节。尽管有如此庞大的大数据来源,但在规划实践中使用的交通需求模型,其数据源仍大多来自交通调查和人口普查等传统方法。对近期利用大数据研究交通行为,以及使交通规划师可以进行假设情景分析的交通需求模型的最新进展进行梳理。从出行识别到出行活动推理,回顾和分析现有数据分析方法,这些传统方法使收集到的出行轨迹信息能响应交通需求模型。未来的研究应该侧重将概率模型和机器学习技术应用于数据科学。设计这些数据挖掘方法是为了处理由手机移动追踪数据衍生的零散和掺杂偏差的数据的不确定性。此外,这些方法还适用于将不同的相关数据组整合到一个数据融合方案中,以便用出行日志信息丰富大数据。总之,建模知识已经在交通运输领域发展成熟,因此强烈建议在交通规划方面应用数据驱动方法时应建立相应领域专业知识的基础。这些新的挑战呼吁交通模型师和数据科学家之间的多学科协作。

点击“阅读原文”查看“专题集锦”栏目更多内容
201957期
编辑:耿雪 张斯阳
王海英
审校:张宇
排版:耿雪

长按二维码关注
原文始发于微信公众号(城市交通):2019•叁期“交通数据科学的研究与实践专题”抢先看