本刊“学术动态(Planning Reviews)”栏目,推介国内外学术书籍和文献报告、关注国际研究动态和前沿热点、分享规划案例研究。本期 “城乡社区发展与住房建设” 专栏,向大家推介一篇利用社交媒体数据研究城市社会空间不均衡现象的文献。
(专栏编辑:杨辰,同济大学建筑与城市规划学院副教授)
社交媒体与城市:利用用户生成的地理信息数据反思城市社会空间的不均衡现象
来源:SHELTON T, POORTHUIS A, ZOOK M. Social media and the city:rethinking urban socio-spatial inequality using user-generated geographicinformation[J]. Landscape and Urban Planning, 2015,142: 198-211.
大数据为城市的分析和管理提供了一种更加“科学”的方法,但是现阶段对带有地理信息的社交媒体数据的应用,大多数局限于简单的地理分析,将其内容定位到一组经纬度坐标上,但这种单点往往不能反映日常生活与多样性,不能调动对社会空间关系的复杂理解。本研究借助对美国中东部城市——路易维尔市(Louisville) 东西两区不同群体日常活动空间的分析,运用“社会空间关系理论”(relationalsocio-spatial theory),关注用户个人是如何通过空间邻近性或社会相似性与其他人产生联系的,以此探索该城市长期存在的社会空间不平等问题,同时对传统观念上西区独立于该城市其他部分而存在的观点提出质疑。最后,本文旨在为分析社交媒体数据提供一个方法框架,用以探索这些数据所体现的社会空间关系的多样性。
路易维尔市是一个社会不平等现象与种族隔离现象表现明显的城市,社会的不平等同时也体现在空间上,存在“第九街分隔”的传统概念。以其作为分界线,以西主要是贫困人口和非裔美国人,而其他地区以富人和白人为主。
1. 数据收集与处理
本研究收集了路易维尔市自2012年6月到2014年7 月间所有带有地理信息的推特数据,共计570万条。
首先,筛选出在该时段内创建40条以上数据的活跃用户,获取他们在路易维尔市产生的所有推特数据,并进一步筛选个人数据有50%以上位于东西两区之一的用户,便于判定用户所属的主要区域并进行赋值。最终,共筛选出703位东区用户产生的274338条数据与662位西区用户产生的398432条数据。
将该地域划分成直径为1km的六边形单元,并将以上数据聚合在不同的单元中,此过程中需要对数据进行检查与调整。例如,需要将某人短时间内在同一地点产生的多条数据进行合并,否则会其因权重在总数据中占比过大而影响分析结果,因此我们提出了新的处理要求,在任意给定的六边形中每个用户最多仅保留随机选择的5条数据。
2. 数据分析
(1) 对比日常交通流动性
为分析两区推特用户的流动性,计算每个六边形单元中东西区用户产生数据量的比值。在两区内部(传统意义上所划定的两区范围)都展现出本区数据量远超过对方的情况,除此之外,我们也关注在用户前往两区以外的地区所产生的数据差异。
西区用户的数据中,有45%位于第9街以东,而东端用户推文中,只有7%位于第9街以西。西区用户分布在更大的范围内,甚至在东区以东的地域内超过了相对距离较近的东区用户产生的数据量。产生这一现象的原因与地铁线路有关,地铁线路穿越的六边形单元与其附近的其他单元相比,西区用户数据所占比例明显升高。这一现象与传统观点中“阶级与种族隔离是由于群体流动的局限性所导致的”相悖,西区居民(以穷人和黑人为主)因就业与消费需求反而需要前往离家更远的地方,从而展现出更大的流动性。
(2) 探索分区边界
根据两区推特用户所产生的数据分布情况发现,用户主要行为发生地已经突破了传统意义上的分区范围。为基于用户日常活动重新诠释两区边界,依据六边形单元内所含东西两区推特数据量进行筛选,剔除所含数据量低于50条的六边形单元,形成实际意义上的东区两区活动范围。
对比发现,尽管东西两区之间存在空间隔离现象,但两区用户在市中心、滨水区及郊区购物中心等区域上发生了活动范围的重叠。总体而言,重新识别的东区边界与先前依据经验划定的边界差异不大,而重新识别的西区范围则突破了原先设定的边界。同时与经验相悖的是,以白种人和郊区景观为主的南区,在人群特点上与东区相似,但东区用户并没有在此产生大量的数据联系,反而西区用户的活动范围出现了向南区延伸的特征。从历史角度来解读,这一特征的出现与1937年洪水暴发导致西区内白人工人阶级家庭向南区迁移有关。
(3) 不同尺度的时空解读
在大尺度的分析中发现,东西区用户很少在相同的地方同时出现,但如果改变六边形单元的划分尺度,所呈现的结果将有所差异。设施点的存在会影响东西两区用户的隔离情况。将两区分界线的区域划分为更小尺度的六边形单元,发现某些设施点周边的小六边形区域展现出两区用户比例特征的突变。
同样,研究城市社会空间的隔离现象也要将时间维度纳入考虑。以Churchill Downs为例,它是西区用户主导地区内唯一一个东区用户集聚的地区,作为历史悠久的赛马场,仅在赛事期间会聚集更多的东区用户,而其他时间并非如此。
(4) 基于目标情景的定性分析
将大数据具体到每条数据中的内容,可以让我们了解该城市的居民如何在城市中居住、穿行与体验的。基于确定的研究目标,可以选取某一部分的推特数据或内容进行定性分析。
倘若某一地域范围内东西两区用户数据量相似,则可以探讨其内两区用户主要行为的差异。我们在所有六边形单元中选取了东西区用户数量比值为0.8-1.25且两区推特数据总和超过100的单元。将这些地区的推特数据与Foursquare签到数据(一种基于位置的社交媒体平台) 相比较,10.7%的东区推特数据与签到数据相关,然而西区的相关性降到了0.2%。这一情况说明,即使在某一地区有相近数量的东西区推特用户,但两者在此发生的活动是不同的。可以认为,东区用户的行为更符合“炫耀性移动”理论(theories of ‘conspicuous mobility’),他们前往咖啡馆、餐厅、酒吧等娱乐场所,并对这种消费行为进行展示。相比之下,在这些地区活跃的西区用户可能更多的参与当地的社会互动。
除此之外,我们也可以在原始的推特数据库中识别出带有某些关键词的推文。例如,对于提到“贫民窟”一词的推文,有197条来自于西区用户、87条来自于东区用户。这些推文的分布特征与之前所提到的东西区推文分布相似,跨越第9街出现在西区的东区用户推文很少,但西区用户的相关推文则突破了常规认知的西区边界。然而令人诧异的是,东区用户产生的有关“贫民区”的推文中,大多来自于居住在郊区的白种富人,按常理说他们在社会与空间方面都与贫民区没有交集。这些意外的结果,说明个体或集体的日常活动空间与城市空间意象之间存在更为复杂的关系。
本研究中,我们关注的是路易维尔市的隔离、流动性等问题,强调了城市空间上的流动性、网络化和关联性,说明人们是如何居住和使用这些地方的,重新思考与路易维尔市特定的阶级和种族化社区相关的社会空间意象。通过了解来自城市不同区域的人们是如何以不同的方式穿行和体验城市的,我们能够展示出一组更复杂的社会空间活动,而这类社会空间活动通过与他人和空间的相互关系来定义城市和“社区”。
有关社交网络的大数据研究可以且需要结合研究基地的特殊情况进行分析,本文给出了几种分析和使用此类数据的示范,未来的研究中可以更深入地关注不同年龄、性别等分类下的问题。
(供稿:辛蕾,同济大学建筑与城市规划学院硕士研究生)

欢迎在朋友圈转发,转载请联系upforum@vip.126.com
识别二维码 订阅本刊2018年电子阅读版
URBAN PLANNING FORUM Since 1957
创新性、前瞻性、学术性
中文核心期刊、中国科技核心期刊、中国人文社会科学核心期刊、中文社会科学引文索引来源期刊(CSSCI)、中国期刊全文数据库(CJFD)全文收录期刊,中国学术期刊综合评价数据库(CAJCED)统计源期刊,中国科学引文数据来源期刊,RCCSE中国核心学术期刊
官方网站:http://www.upforum.org
投稿链接:http://cxgh.cbpt.cnki.net
Email: upforum@vip.126.com
电话:021-65983507
传真:021-65975019
微信号:upforum
原文始发于微信公众号(城市规划学刊):【学术动态】社交媒体与城市:利用用户生成的地理信息数据反思城市社会空间的不均衡现象| 城乡社区发展与住房建设(杨辰)