规划问道

研究︱手机信令数据在交通规划方面的应用









































































































































































































导读

手机信令是一种新型的大数据源,与其他类型的数据相比,其具有实时性、完整性、出行时空全覆盖性等其他数据源所不拥有的优势,在各类规划中尤其是交通大数据分析中具有独特的应用优势。本文重点介绍手机信令数据的特征,并介绍其在交通规划方面,尤其是OD反推分析的应用。




研究︱手机信令数据在交通规划方面的应用


一、多源大数据类型对比



大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据在金融、信息、医疗、交通等各个行业都有广泛的应用。


在交通规划方面,大数据的主要用途是获取出行OD,所谓OD,即居民每次出行的起始点。传统的出行OD的获取方法是开展交通调查,耗费大量的人力、物力,调查的时间和费用成本都很高且精度有待提高。在大数据时代,出现了多种不需要开展实地调查的获取出行OD的数据源,包括:手机信令、POI数据、电子导航地图定位数据、公交车IC卡、互联网订票数据等等,通过大数据可以实现不通过交通调查而对出行OD数据的反推。但在上述多源数据中,应用较为广泛、数据来源较为可靠的仅仅指前三种,即手机信令、车载GPS和道路卡口数据,其他的数据来源由于数量及应用范围有限、样本量不够、精度不足等原因,只能用于辅助数据来源。


多源大数据类型对比

研究︱手机信令数据在交通规划方面的应用



研究︱手机信令数据在交通规划方面的应用


二、手机信令数据特征



1、概述




手机信令数据是由手机用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录同一用户信令轨迹所产生,最后经过脱密、脱敏、扩样等处理后可用于居民行为偏好、移动轨迹分析、城镇空间布局等研究。手机信令数据的数据空间分辨率多为基站,时间分辨率则可精确到秒。手机信令数据字段中包含时间和空间位置属性,还有通话和信息记录等信息,通过上述信息的关联可以反推用户的出行轨迹,是用于研究城市居民行为与空间分布较好的数据源。但是同时也存在个人隐私的泄露,因此做好脱敏和数据保护非常重要。


研究︱手机信令数据在交通规划方面的应用

手机信令数据捕获方式示意图


2、主要特征




手机信令具有如下特征:全覆盖性指只要是携带开启的手机,则定位系统将自动捕获用户全天候的动态实时信息,并且范围不局限于手机运营商的属地范围,多数用户都可以获取全国范围的活动轨迹,而全球通等用户还能捕获到其全球范围的活动轨迹;高精度性指手机信令的位置信息有准确的经纬度信息,而时间则精确到秒,数据精度高,便于精确推算用户的活动轨迹;实时动态性指用户的不同时刻的空间信息都将发生变化,位置信息处于不断变化中;信息关联性指除了手机通话属性如通话时间和地点、短信的发送时间、通话对方的号码信息等,还具有通话实时地点等关联的空间信息,两类信息具有关联性。存储冗余性指手机信令数据非常海量,每天产生大量的存储信息,这些信息如果不经过及时处理,会形成非常占用硬盘和服务器空间的海量数据库,其中含有大量的冗余信息。


研究︱手机信令数据在交通规划方面的应用

手机信令数据特征


3、优劣势




基于手机信令数据的特征,可见手机信令的最大优势是:数据覆盖面广,只要用户开启手机,即可捕获出行信息。由于通信部门基站覆盖率很高,且多数手机用户关机仅限于深夜睡眠期或限制开启手机的场所如飞机、保密部门等,因此手机信令数据相比其他大数据源,覆盖面最广,可以捕获出行者在每日全天的出行轨迹信息。由于国内不同方式的出行者都有偏爱手机导航的习惯,虽然老人和儿童用户使用手机频率较少,但由于高龄和低龄用户出行活动范围较小,对整体研究精度影响不大,从而使手机信令数据在研究人群的出行活动规律方面具有很高的可信度和完整度。同时,手机信令数据分析交通出行轨迹也有较为成熟的算法和数据库,在后续的研究工作中具有良好的基础,方便开展下一步的工作。


手机信令数据的劣势:主要是数据存在海量化的特点,运算量较大,运行时间较长,尤其是在大范围、长时间的海量数据库中进行运算时,容易造成数据冗余较多、精度降低等问题,对服务器和软件的配置,以及对算法设计的精度保证等都有较高的要求,因此会带来工作人力、时间等各项成本的提高。同时,在手机进行实名制登记后手机信令数据包含大量涉及用户的个人隐私数据,如姓名、身份证号码、性别、常居住地等信息,这些敏感信息极易造成个人隐私数据的泄露,需要要求加强算法的脱敏性设计。数据脱敏不仅仅是对于客户隐私数据中的某些字段进行加密,还应避免数据之间的关联关系造成其他信息的泄露,如客人的活动轨迹特征信息等。



研究︱手机信令数据在交通规划方面的应用


三、手机信令数据算法基础



1、算法基础步骤




手机信令大数据用于交通规划分析最基础的算法基础就是提取完整的出行链。在经过前期的数据获取、预处理等处理工作后,进入核心工作步骤之出行链提取。所谓的出行链,是指研究范围的一次单独出行,比如上班出行,捕获某手机用户在上午某时刻离开之前未发生变动的活动范围(如居民住所)内,按照一定的速度位置发生不断变化,采集到系列的对应的位置出行信息,直到到达某个地点(办公场所)后,其活动范围在指定时间内和指定阈值规定的小半径范围内,即可认定从起始点到到达点之间的这次系列位置信息对应的出行轨迹为一次完整的出行链。不同的出行链活动半径差异较大,如在城区内部的出行链,其出行距离一般为3-10公里,而城际出行,尤其是乘坐飞机、高铁出行,其单次出行距离可能超过1000公里。因此对于不同研究范围的出行链计算,最重要的是科学设定不同的阈值判定标准,从而准确提取出对应的出行信息。在本文中,我们主要研究的对象是城际出行链。


研究︱手机信令数据在交通规划方面的应用

手机信令数据算法基础步骤


2、算法核心方法:提取出行链




手机信令数据反推交通出规律的核心在于获取出行链。根据某时间段内数据库内的存储和读取纪录,提取在该时间段内所有出行链,并区分相似出行链和相同出行链。形成最初始的出行链基础数据库:


相似出行链:出行轨迹吻合度达80%以上,多出现在相同交通工具搭乘者,包括高铁和飞机、出租车、自驾小汽车、公路客运班车等,但是他们在出行起点之前和终点之后的出行轨迹产生显著的变化。相似出行链则是判定相同交通工具搭乘者的重要依据。


相同出行链:出行轨迹吻合度则高达95%以上,表现在除了提取的出行链内的轨迹高度吻合外,且在出行链起始点之外的轨迹也存在较多的吻合性。较多原因是同名用户拥有2台以上手机的情况,同时也有可能是家庭内部用户的或者相同单位内部的同事出行的情况。相同出行链是数据预处理工作中视具体情况可进行筛除或者去重。


两类出行链的区别情况如下表所示:


相似和相同出行链的对比表

研究︱手机信令数据在交通规划方面的应用



研究︱手机信令数据在交通规划方面的应用


四、手机信令数据算法分析实现



仅仅划分出行链对于后续的规划工作是远远不够的,因为上述的数据仅仅是获取的出行者的活动轨迹,但是却对关键的属性:出行方式未能界定。与道路卡口能精准识别不同车型的出行不同,手机信令的原始数据并未有包含出行方式信息。但是可以通过原始手机信令数据进行二次加工而获取更多有价值的信息,比如包含位置和时间信息可以获取移动速度中,进而通过沿途各个出行点的位置属性、活动时间范围等信息,通过算法实现对各类出行方式的细分。


1、根据移动速度进行初始方式聚类划分




运用某出行链的首末点,根据经纬度计算出距离,用起始点的时间相减得到时间差法,从而计算出移动速度。其中速度在700km/h以上的为飞机160-500km/h的为高铁,200km/h以下的为普通火车或汽车。上述判定数据仅为举例,可优化调整各类判定阈值条件。通过出行移动速度,得到大类交通出行方式的初始聚类划分结果集。


2、对出行链数据进行出行方式细分




主要根据一定的判定原则筛选原理,在算法中根据各种判定条件,运用多条件联合判定方法提高标签判别的精度,重点区分公路运输的各类客车和货车,兼顾区分普通铁路和公路客运。


划分出行方式判定方法举例:如果相似出行链存在100人以上的为铁路,20-50人为大巴,1-4人的小汽车等。对于区别客车、货车:利用出行目的地属性信息判定,行驶地点多数在郊区,且经过多个货运市场的为货车。经过市中心地区较多的则为客车。经过多个铁路站点的为普通铁路客车或货车。其他辅助判定条件:出行时间,如货车多在夜间活动,客车在白天活动,货车的日行驶时间超过8小时,客车则多数在2-8小时之间。客车多选择高等级公路行驶,货车往往在低等级公路行驶等等。


不同出行方式划分参考标准详见下表,主要指标根据不同研究需要可调整:


各类出行方式的划分判定参考条件列表

研究︱手机信令数据在交通规划方面的应用


根据上述判别标准,根据出行沿途各点的位置范围、时刻、起始点属性等关联信息,设计筛选分类算法,对原始的出行链进行方式划分,方式划分是一个不断深入,需要多次迭代的算法,首先划分出行大类(公路、铁路等)再划分车型大小和车辆性质(客货)在实际算法设计中,如果加入的联合判定条件越多,则有益于提高判别精度,但在上述较多的判定条件中,需准确界定“或”和“且”的关系,即充分条件和必要条件的区别,则将有效减少误判的现象。如货车虽然在国省道行驶较多,但在高速公路行驶范围也很广,因此在判定货车还是客车的属性时判定条件对于货车应是:高速公路或国省道周边行驶。科学地选择多个判定条件之间的逻辑关系是提高判定精度的重要保证。通过上述的各个判定条件可进行出行方式划分,但由于各类出行方式存在较多属性交织,即多属性并存的现象。即使科学地设置了判定条件,但是仍会有一定比例的误判、漏判现象。因此判定工作将设计循环迭代计算的流程,直到误判的出行链样本的数量和比例达到可以接受的程度为止。


3、算法实现




手机信令数据经过预处理、出行链提取和后续的深度分析后,则可以生成研究范围内的划分出行方式的OD总表,根据OD表数据进行修正完善后,则可以进行下一步的可视化图形展示,并支持相关的规划决策工作。完整的算法流程如下图所示:



研究︱手机信令数据在交通规划方面的应用

完整算法流程图



研究︱手机信令数据在交通规划方面的应用


五、手机信令数据的应用



在获取手机信令数据,并通过算法得出某研究范围内的交通出行分方式OD表数据后,不仅可以直观地了解研究范围的内部各类交通出行的分布情况,更深层次地还可以为行业管理用户提供规划决策支持。常见的规划决策支持包括用热力图支撑项目选址,出行OD图为路网建设、开设公交客运线路提供支持,公路客运关联度图为开通客运线路的可行性分析等:


1、热力图论证重点项目选址匹配性




热力图是一种常见的大数据可视化图形,以颜色的深度形象地表示区域内部各点的访问对象的密集程度,特殊高亮的形式显示访客热衷的地理区域的图示。热力图在用于交通、用地职住分析等项目中,主要根据出行地的人口数量直观地表现出各地的人口出行需求,出行需求大且地区将显示为深色,而出行需求少的地区则显示为浅色,其他情况根据出行需求指标的大小进行颜色递进变化。从而非常形象地表现出一个地区的出行需求情况。


通过热力图显示区域内出行强度,从而可以为铁路及公路的客货运站等重大项目选址等提供支持,一般情况下,交通基础重点项目设施规划建设应选址在出行需求较大的地方。因此,根据热力图的展示结果,然后和已获取的重点项目规划选址图叠加在一起,小范围内的简单的做法可以直接用肉眼判断、分析项目选址是否合理,如出行需求小的地点出行高等级客货运站场的规划方案,则应调整方案。较大范围内的匹配分析可以将热力图和坐标衔接一致的重点项目规划选址图按一致坐标进行叠加,设置合理的热力图指标和项目位置匹配性指标,进行简要的属性指标匹配分析,符合条件的为合理选址,出现偏差较大的不符合条件类型则为不合理选址。


热力图分析结果常用于论证某地规划项目选址的合理性。以下图的某地热力图为例,通过热力图直观地显示规划区域内部的人口出行强度(或活跃度)情况,中间深红色的的区域代表出行强度高的区域,黄色次之,绿色代表出行强度较低的区域。进而可以将该热力图与客货站场的规划项目选址图进行叠加,进行叠加后属性匹配分析,与热力图匹配度较差的项目可进行选址深入分析,采取迁址或者取消、调整规模的处理方式。


研究︱手机信令数据在交通规划方面的应用
某地的出行强度热力图


2、区域范围内的各组团人口联系图展示




如常见的人口流动分布图,将直观地显示区域内部各组团的联系情况。如下图中可以看出深红色的几条线条代表着人流联系量较大的通道,黄色线条次之,灰色的线条则代表人流联系量较少的通道。该类图形主要为区域内部各个组团之间的道路网规划建设提供数据支撑,如联系较多的通道之间需要提高道路等级或加密道路建设等,联系较少的通道之间则原则上不新建或扩建道路。根据该类图形中展示不同区域的人流联系量需求,可为新区规划建设道路确定道路等级和规模提供参考,同时也可以为已建成区域的道路扩建、改建提供一定的数据支持。


研究︱手机信令数据在交通规划方面的应用


可视化图形展示之某区域各地市人口联系图


3、公路联系关联度分布图(区域联系度)




区域关联度表征城市之间相互联系与交通的程度,常以来往于城市之间的OD量来计算和表征,是城市群发展阶段、态势的重要评估指标。区域关联度包括不同运输方式的关联度,如铁路出行关联度、民航出行关联度,应用最多的则是公路客运关联度,通过分析计算指定空间范围的公路客运联系关联度,可以为各个城市之间开通或者完善已有公路客运线路方案提供可行性分析方案。如下图所示:


研究︱手机信令数据在交通规划方面的应用

区域公路客运关联度分布图



研究︱手机信令数据在交通规划方面的应用


六、小结



相比其他类型的大数据源,手机信令数据具有覆盖面最广、定位信息准确、精度高、能二次辨识信息多等独到的优势.手机信令数据在进行预处理、数据去噪去重、扩样和匹配性、模型分析等系列工作后,用于分析计算出行OD,准确度较高,在进行交通规划及决策工作中具有独一无二的优势。手机信令数据用于交通规划的核心是通过反推计算出分方式的出行OD列表,其中算法的难点在于分方式的复杂判别条件的设定,这需要不同专业工作者通力合作,结合各地交通运行实情,科学制定各类交通方式划定的标准,并通过合理的算法反复迭代运算得出理想结果。


基于手机信令数据预算得出的各类可视化图表可为多类交通规划决策提出支持,包括但不限于对重大基础设施规划选址合理性论证、及时发现公路网的规划建设中的问题,为开通公路客运班车、公交线路提供具体的可行性研究等,与传统基于人口数据预测的“四阶段法”等方法相比,由于手机信令数据是根据实际采集的出行数据反推得出,比四阶段法的准确性更高,在实际运用中,手机信令算法和传统的算法可以互为补充、相互校核,以期得到更加准确的决策支持成果。


部门简介:


大数据中心是国地科技信息化产品与智慧城市建设的技术支持部门,负责信息化产品功能研发、前沿技术与科技课题研究,可提供自然资源与城乡空间规划建设管理信息化一体化解决方案,并致力于推动大数据、人工智能、城市信息模型等新型信息化技术从智慧规划到智慧城市的实践应用。以专业和创新提供一流的行业信息化和智慧城市建设全流程服务。

研究︱手机信令数据在交通规划方面的应用

责任编辑:林冬娜、邓小云

文章审核:张鸿辉、洪良




往期推荐
研究

面向国土空间规划编制的多源人口大数据模型研究

研究

多源大数据辅助学前教育服务设施规划研究 ——以深圳市幼儿园设施为例

研究

平台统筹:从时空大数据平台到智慧城市支撑平台


国地资讯聚焦国内外自然资源、城乡发展、生态环境行业,致力于宣传热点政策,分享新鲜资讯,展示研究成果。


研究︱手机信令数据在交通规划方面的应用

研究︱手机信令数据在交通规划方面的应用

空间规划大数据联盟
关注“空间规划大数据联盟”给你想要的资源!
        

原文始发于微信公众号(国地资讯):研究︱手机信令数据在交通规划方面的应用

赞(0)