规划问道

百家争鸣│互联网公开数据在省域总体规划应用分析——以海南省总体规划为例


“大数据给予了我们一双清澈的眼来观察城市,剩下的路依然要靠自己的双脚走出来”——来自中国城市规划设计研究院城市更新研究所的李晓晖规划师与大家分享他的工作体验,针对海南省总体规划项目所关注领域,利用互联网公开数据,处理分析、提炼规律、验证观点,为海南省总体规划的战略部分提供辅助决策。海南省总体规划是海南省在全国率先开展的省域“多规合一”改革试点工作,项目一直处于紧锣密鼓的状态,作者在紧张的工作状态中利用闲暇时间详实地梳理总结经验与感想,感谢作者的辛勤劳动!


作者已授权发布,联系邮箱:
lixiaohui.s@foxmail.com

1
背景——一个命题作文,一个尝试机会


  本文所述工作为笔者近期参与的《海南省总体规划2015-2030》工作的一部分。海南省总体规划是海南省在全国率先开展的省域“多规合一”改革试点工作。规划工作分为若干阶段,首要阶段通过分析研究编制战略规划,确定全省一体的发展战略和空间结构,作为后续多规合一工作开展的前提共识。

  对于这一新类型规划,尝试新的分析手段和方法,成为了顺其自然的决定。近两年来,随着社会信息化程度的提高,城市相关数据大量累积,大数据分析方法逐渐兴起,如何将其应用到具体规划编制实践过程中去,成为值得探讨的方向。

  于是笔者试图针对项目所关注领域,收集数据、处理分析、发现问题、提炼规律、验证观点,为海南省总体规划的战略部分提供辅助分析。

2
优势——寻找存在的意义


  大数据,尤其是基于互联网公开数据的分析方法与传统方法相比,对于本项目有以下的意义与优势:

  一是来自于大数据分析方法自身的优势
  众所周知,相比传统研究方法,互联网海量数据分析能够更准确地反映城市活动,更直观地呈现分布规律,更综合地进行叠加分析。

  二是来自于以省域空间为代表的宏观空间尺度的应用优势
  首先,大数据方法可以跨越纵向多级别行政主体的数据鸿沟。我国政府体制的分层结构,造成省、市县等多级统计数据存在明显的鸿沟。一是数据类型不同,省级政府所掌握多为指标型数据,市县政府作为基层掌握更为准确的空间型数据;其次,统计结果不一致,各市县数据拼合总数远远大于省级数据统计的现象屡见不鲜,其精确度有待商榷。而大数据没有分层因素,是无数个统计单元的数据集合,现有政府数据是分级缩放,大数据分析则可以实现海量数据的无极缩放。

  其次,大数据方法可以规避同级别多个统计单元之间的数据差异。以省域空间为例,其基层信息统计单元多为各个平行市县,不同市县由于技术实力与管理水平的差异,其统计数据往往在类型、口径、精度、数据完整性、时效性等方面存在差距,以至于无法在宏观单元进行准确的百分百拼合。而以互联网公开数据为代表的大数据分析可以直接以省域范围为统计单元,避免同级别多单元数据拼合产生的误差。

  再次,大数据方法可以弥补宏观统计数据的空间劣势。省域等宏观空间单元统计数据多为宏观国民经济与社会发展数据,多为指标性数据而缺乏空间属性。大数据类型中的地理位置信息数据能够补充宏观数据的劣势,对空间判读与空间规划予以指导。

  另外,宏观研究空间相比微观统计单元能够极大的提升数据量级,增加数据容错率,减小数据误差。一方面大尺度空间包含大范围数据,样本量的增多使得研究结论更为精准;另一方面省域单元空间尺度较大,对单个数据的空间信息精度要求较小。

3
启动——数据源的选取


3.1 理想计划与现实路线

  理想路线之所以称之为理想,是因为现实中总是存在着难以逾越的差距——数据来源的问题。大数据研究的核心从来都不是有关于方法论的,而首先是有关于数据的掌握程度。就好比是采金矿,怎么开采提纯是后面的事情,有没有这个金矿,是否掌握在自己的手里才是前提(图1)。


图1 理想研究路线图


  纵观城市相关数据来源,主要包括城市管理者、第三方服务商、互联网公开数据三个方面。城市管理者跨地域、分部门、多级别、较封闭,相对容易得到的数据以公开发行的统计资料为主,在数据公开的道路上尚任重道远。第三方服务商包括城市基础设施运营服务商、各商业服务机构等;前者领域独立,平台封闭,数据敏感,作为非商业机构数据挖掘动力不足;后者以互联网商业服务机构为代表,掌握大量终端数据,拥有挖掘自由数据潜在价值的商业动力。互联网公开数据可以介于两者之间,又游离于系统之外,一方面来自城市管理者与第三方服务机构的有限公开,另一方面来自社会个体数据生产者的主动集聚。

  由此,从理想回到现实中来,衡量数据获取与处理的难度,考虑现有的工作条件,将互联网公开数据作为主要的数据来源与分析对象。

3.2 技术路线

  专题选取常见的互联网信息渠道,主要包括网页资料、在线地图、社交网络等资源,筛选有效数据,对海南省域进行产业特征判读、空间分布研读、社会发展解读,着重于旅游业的特色产业认知和省域空间结构的特色空间识别两个方面,并形成可视化信息,辅助规划编制。

4
特色产业认识——旅游业


  海南作为我国的唯一热带省份,依托特色的自然资源,旅游业成为其重要的产业之一,2009年国家给予海南“国际旅游岛”的发展定位与目标。海南的旅游业呈现怎样的特征?究竟有多大的吸引力?是否正在实现着“国际旅游岛”的目标?与其他类似旅游目的地相比又处于怎样的发展水平?类似的问题,我们尝试用互联网公开数据予以展示。


4.1 国内旅游客源吸引力对比分析

  大数据自身的特点决定了其对相关关系研究拥有天然优势,因此互联网公开数据为案例分析工作提供了极其方便的量化对比工具。基于同一个数据平台,利用同一套数据体系,更直观,更具体,摆脱了以往以资料收集定性为主的对比模式。作为汇集数据作用的搜索引擎,因其数据内容无偏向、使用者覆盖广,适合用作较为客观的对比分析工具,笔者选择百度指数对比分析国内案例。

4.1.1 旅游市场辐射范围对比

  旅游是互联网搜索引擎的一大内容类别,关于旅游目的地关键词的搜索量能够间接地反映某一旅游目的地的相对热度,而搜索行为的发生地能反映这种关注的空间关系。
  根据百度提供的有关“海南旅游”的搜索量数据,以搜索行为发生地为关注项,选择厦门、青岛、大连、秦皇岛等沿海旅游目的地城市作为比照对象,对比分析各自对应的旅游客源地区,判断其旅游市场覆盖范围(图2 图3 图4 图5)。



图2 海南辐射省份


图3 厦门辐射省份


4 青岛辐射省份


5 大连辐射省份


  结果显示,厦门、青岛、大连搜索来源地分布图呈现明显的峰值曲线,来自本省的搜索量明显高于其他地区,为典型的区域性旅游目的地。海南搜索来源地前四位地区分别是广东、浙江、江苏、北京,曲线整体相对平滑,各地区关注度较为平均,旅游客源辐射范围较广,是典型的全国性旅游目的地(图6)。



图6 不同地区的国内旅游辐射范围示意图


  在此基础上进一步分析2009年到2014年海南客源省份变化情况可以发现,新疆、青海高海拔寒冷地区旅游增长迅速,浙江、山西、西藏、贵州、内蒙等紧随其后,全国绝大部分地区增长幅度相对均衡,海南旅游的全国辐射性体现明显,尤其受到较为寒冷地区游客的欢迎(图7 图8)。



图7 海南旅游国内辐射程度变化趋势09-14年



图8 海南旅游国内各省搜索量增长变化09-14年

  

4.1.2 旅游市场辐射游客年龄段对比

  通过对旅游市场辐射游客的年龄段识别,能够反映旅游目的地主要对应的客户群体年龄特征,判断产业发展趋势,制定针对性的产品定位(图9)。


图9 不同旅游目的地的各年龄段游客吸引力占比


  从百度指数提供的分年龄段搜索数据可以很明显看出,不同特色的旅游目的地吸引的年龄段各有侧重。厦门对29岁以下的游客吸引力最为突出,符合厦门旅游的“文艺范儿”和“小清新”的定位认识;青岛对29岁以下游客的吸引力仅次厦门;大连对于中段的30-39岁年龄段的吸引力最强,旅游定位较为综合,旅游产品较为成熟;秦皇岛在40-49岁年龄段吸引力相对较强,这个年龄段人群多是疗养度假需求;海南对20-29岁游客吸引力最弱,缺乏对青年人的吸引力,而对40岁以上,甚至是50岁以上的游客相对吸引力最强,中年及老年是海南旅游的主力人群,其休闲度假及养老度假的旅游需求相较其它地区更为突出。


4.2 特色的旅游时段吸引力

  通过研究数据跟随时间的变化情况,能够识别不同旅游时段吸引力变化,反应海南旅游的旺季与淡季更替节奏,量化具体峰值大小,能对海南旅游波动性做出认识和了解。

  从百度搜索数据时间变化趋势和国家环保局监测的全年AQI空气指数来看,海南每年春节、暑期、十一均存在显著小高峰,冬季人气最旺,从十一开始进入长达五个月的旅游季,尤其以一月二月热度最高。三亚旅游峰值远大于海口,城市受旅游波动影响最为明显。海南旅游整体波动水平适中,与东南沿海城市全年平稳表现不同,与北方滨海城市的剧烈波动区别明显,且变化周期正好相反(图10)。


图10 海口与三亚全年AQI空气指数变化



图11 百度搜索数据时间变化趋势


4.3 阶梯性的旅游景点吸引力

  互联网公开数据还存在一类文本数据,如文章、评论、游记等,虽然不是直观量化数据,但却真实反映了文本作者的主观意愿。因此,由真实体验过海南的游客所产生的游记,蕴藏了最真实的海南旅游的评价信息,通过对这些游记进行语义分析,能够直接反映出景点热度等关键信息(图12)。

  我们收集了旅游社交网站的2079篇游记,共计1372万文字量,对游记中所提及的景点进行语义分析,以景点的提及频次来反映景点热度与吸引力。可以看到海南旅游景点的吸引力以少数几个主要景点为核心,其它大量次级景点作为补充,同时各景点的吸引力呈现明显的阶梯特征与长尾效应。三亚及周边地区明显表现为的最主要的旅游目的地,以三亚为中心组织周边景点形成了琼南旅游经济圈(图13)。


图12 海南省各旅游点(景区/城市)受欢迎程度的词云图表达



图13 海南省各旅游点(景区/城市)提及频次

5
特色空间识别——省域空间结构


  互联网公开数据中的定位数据是最契合城市规划师空间思维与空间应用的数据类型。对空间数据的收集整理与分析,可以帮助城市规划师对目标城市或地区进行空间的特征识别,辅助制定空间策略。空间数据类型多种多样,笔者选择了服务设施分布与房屋价格分布的空间数据,就城市服务配套与居住空间两大重要组成部分进行探讨评价。

5.1 服务设施空间

  以网络地图和消费评价类网站数据为基础,分别对公共性服务设施与商业性服务设施进行数据采集与整理,进一步分类加权评估,得出服务设施水平空间分布图。公共服务设施与商业服务设施呈现出完全不同的两类空间特征。

  公共服务设施表现为布局的均等化与等级的差异化特征。空间布局以各市县中心城镇为节点分布均衡,形成全覆盖的全岛设施服务网,服务能力水平基本体现市县行政等级,呈现“省域中心城市-区域中心城市-县城中心镇-其它镇”四级结构,以海口、三亚作为南北两极,公共服务设施水平明显最高。

  商业服务设施受市场力量影响,更直观的体现地区经济发展程度与水平,具体表现为外强内弱、北强南弱、东强西弱的差异化空间特征,符合海南省各市县的真实发展差异。作为岛屿滨海地区,商业开发集中于滨海一线,中部山区开发力度较弱,因此外强内弱;东部地区以地产和旅游为主,开发成熟,城市吸引力相比西部地区明显要高,因此东强西弱;北部海口作为省会城市行政吸引力强,同时与大陆交通联系更为紧密,比南部区位更优,长期以来发展更为成熟,因此北强南弱。商业性服务地区整体呈现“北部一极、东部一带、多组团”格局,与海南市场发育度基本一致。

  较为明显的是,商业服务设施在北部形成了连片发展,其中以海口与文昌连片效应最为明显,初步形成一体化发展区域。从空间印证了近期推动的海(口)澄(迈)文(昌)一体化与琼北省会经济圈的空间政策(图14 图15)。



图14 海南公共服务设施与商业服务设施位置分布



图15 海南公共服务设施与商业服务设施水平评价


  由此可见,设施空间评价对区域空间识别有很大的作用。通过公共服务设施空间评价可以直观的反映区域城镇规模等级结构;通过商业服务设施空间识别评价可以直观体现区域空间发展成熟度与相互关系。两者可以进一步辅助决策相应的空间策略。


5.2 房屋价格空间

 房屋相对价格可以反映某一地区的市场认知度与吸引力,一定程度上可以展现未来发展动力的强弱。房屋的空间及价值分布数据可以从互联网租售平台处获取,通过抓取海南各地住房价,进行空间制图,得到海南省房屋价格分布图(图16)。



图16 海南省房屋价格分布图(数据日期有效期2015年3月)


  单纯从海南房价分布图可以看到,房价分布呈现高中低三级结构。其中,高价值地区包含两点一带:海口、五指山、三亚-陵水滨海带。海口作为较为成熟的省会城市,房价与其等级地位相匹配;南部三亚-陵水-五指山依托于山林与热带滨海的自然条件禀赋,体现出其自然环境的高附加值,其中陵水与五指山更是通过高定位的楼盘拉高了整体价格峰值。整个南部形成了以三亚为中心,两翼带动滨海,内部带动山区,中高端产品差异化竞争的高价值空间体系。若是与前文热点旅游景点分布综合研究可以发现,南部三亚-五指山-陵水旅游功能联动发展效应显著,印证了“琼南旅游经济圈”的空间策略。

  房价高低一方面受市场供求关系影响,一方面受产品区位价值与定位高低影响。将海南房屋价格分布图与人口分布图比对来看,可以分析高价格背后的动力因素。海口作为海南人口极化效应最为明显的地区,空间价值的提升主要来自于城镇化发展动力,属于内生动力型发展;三亚-陵水-五指山地区常住人口数量没有优势,其空间价值提升完全来自于自然条件禀赋带动下的外部投资与消费拉动,属于外部动力型发展模式。同时可以发现,除了海口以外的海南其他市县,房屋价格与人口分布匹配程度较低,现状整个海南空间价值的提升与发展,都依赖于外部动力。


5.3 空间识别结论——海南省空间结构图

  通过人口分布空间、设施分布空间、房屋价格空间等空间数据的研究叠加分析,海南呈现明显的两极极化发展态势。北部海口带动周边县市依托行政资源形成城镇一体化发展区,南部三亚联系周边地区依托自然资源形成特色旅游经济圈,东西两翼作为次一级发展带,中部地区呈现生态保育为主的低开发状态,最终形成海南省省域空间发展结构策略——“强化两级、优化两翼、保护中部”(图17)。


图17 空间数据信息叠合辅助判断区域空间结构

6
总结


  本专题以新的分析方法(大数据)应用于新的规划类型(省域总体规划),对特定产业——旅游业从案例对比、客源特征、时段规律、主观认知四个方面利用互联网公开数据进行了比较研究,识别了特定产业的发展特征与发展规律;对特定区域空间——省域范围从公共服务设施分布、商业服务设施分布、人口分布、房屋价格分布四个方面将互联网公开数据空间化,识别区域空间特征,对区域空间策略起到了辅助支撑作用。

6.1 大数据应用的首要原则——掌握多少数据,才能走多远的路

  巧妇难为无米之炊,掌握一定的数据基础是展开大数据分析方法应用的前提条件。规划行业长期并未形成基础数据积累的体系,进行大数据分析将长期依赖于第三方的数据供给。即使是互联网公开数据当中,真正全局、高质、有效的数据库仍然依赖于特定团体的有限公开数据,如本专题所采用的搜索引擎数据、消费评价类网站数据、互联网租售平台数据等利用了第三方商业服务机构的有限公开数据;AQI空气指数数据等采用了城市管理者的有限公开数据;唯有旅游社交网站的游记来自于完全公开的用户自生产数据。所以,城乡规划系统中的大数据分析,是在有限的数据源与较窄的专业方向寻求搭接,匹配仍存在难度,契合仍受到限制,应用仍处于初步阶段。

  值得庆幸和乐观的是,数据公开化是未来发展的趋势,尤其是政府公共管理部门。随着社会信息化程度的快速提高,数据总量越来越大,即使公开的相对成分比例变化不大,即使真正的核心数据依然会有所保留,但公开数据的绝对数量仍是在不断增多的。规划的大数据研究始终有的可做。

  但若要做真正做到规划的大数据化,就要建立并形成自身独立的数据采集、存储、分析、应用体系,既有规划专业并不缺分析应用工具,缺乏的是关键的起步——属于规划系统的数据库。

6.2 城乡规划中的大数据应用本源——来源于空间,回归于空间,服务于空间

  城乡规划是研究城乡空间的一门学科,大数据没有改变城市的本质,也不会改变学科的本质。因此来以空间为研究对象,来源于空间研究,回归到空间判读,以空间规划的成熟管理体系为工具,服务于城乡空间范围,影响城乡空间格局,是大数据方法在城市规划当中应用的本源。
  在本专题中无论搜索引擎的指标数据、网友写作的语义数据、专业服务平台评价数据等,最终都要转化为空间数据,以一个共同的空间范围为工作平台,既进行独立分析,又进行综合叠加,理解特定产业和特色空间,形成空间发展结构策略。


6.3 大数据方法在区域规划中的研究意义——大数据匹配大空间

  一般规划研究经验中,研究尺度越宏观,数据精度越低,对空间的理解也越抽象越困难,大数据方法恰好弥补了不足。当我们从评价类网站抓取数据的时候,得到的是界定区域范围内指定设施类目的所有点位数据,数据是扁平的,全面的;当我们将所有设施点位落空间评价的时候,是允许少量点位信息的陈旧、偏移甚至错误的,因为数据的量级能够弥补这些误差,不求精确万分;当我们落点制图、分析空间特征、制定空间策略的时候,我们需求的是它们的集合表现出来的相对位置关系、布局形态甚至是变化趋势,而非精确的因果逻辑。大数据的全体性、允许不精确、重在相互关系这三点特征,使得其天生适合于大空间尺度的研究范围,既拟补了传统宏观数据的失真,又给予了从宏观视角具象理解空间的工具。

6.4 大数据方法对城乡规划的启示——新思维与老套路

  大数据方法为我们提供了认识城市、了解城市的新视角和新方法,也给予了我们量化比较、理性评价的新工具和新手段。作为一种思维方法,它可以融入到规划的不同层次和不同阶段,从宏观到微观、从规划编制到实施监管。

  城市规划并非完全依赖理性分析,更要经验判断。大数据数据是过去存在状态的日积月累,只能告知过去和当前的状态,即使是对于未来预测也是基于过去的参数,它并不能判断城市的真正未来;大数据只能展现片段的结果和数据的相关性,却不能告知系统的架构和背后的动因,规划仍然离不开经验和主观,大数据在规划的语境中仍要通过现有规划体制来影响城市决策和未来的发展。



作者注:本文有关内容与成果离不开项目外协团队的共同工作,特别感谢。















赞(0)