
多种多样的人类活动在城市空间中发生,使城市空间呈现出功能性的变化。特定的人类活动决定一个场所特定的城市功能,例如工作区、娱乐区、居住区以及工业区等。对城市功能分布进行深入了解有助于交通管理、公共服务以及智慧城市等多项应用的开展。前人的工作大多只从人类活动的角度对城市功能进行识别,但建筑环境同人类活动一样都能够从不同角度对城市功能进行揭示。类似于面向对象编程,场所作为一个类,建筑环境是其静态属性(static properties),而人类活动则是其动态方法(dynamic behavior)。
社交媒体数据在个体活动的表示方面具有很多优势,不仅其文本能够表达个体活动的类型,而且其数量能够表示个体活动的强度。社交媒体数据具有细粒度的个体活动语义,但其稀疏性(空间分布不均)会导致基于该数据源的部分区域结果不可信如图1(A)所示。街景数据不仅分布广泛而且包含了街道尺度的细粒度的建筑环境信息,能够解决或缓解社交媒体稀疏性所引起的问题。融合社交媒体数据和街景数据识别城市功能能够克服基于单一数据源识别城市功能的有偏性。
因此,本研究从人类活动和建成环境两个角度,提出了对城市功能进行识别的方法。研究首先提取社交媒体动文本中的动词作为人类活动的表示,通过对动词聚类识别城市功能,其次使用神经网络构建建筑环境与城市功能(基于动词)的关系去解决社交媒体稀疏性问题,从而达到对整个研究区域的城市功能识别。
图1 数据分布:A)社交媒体数据;B)POI签到数据;C)街景数据
由于北京五环内区域有明显多类型的城市功能,故其被被选作研究区域。使用的数据包括新浪微博数据、街景数据、POI数据、土地类型数据以及出租车轨迹数据,其数据分布如图1所示。新浪微博数据与街景数据用作城市功能的识别,而其他数据用于结果的验证。
基于“data-human activity-urban functions”的城市功能识别思路,有两个问题需要考虑。其一是如何精确表示人类活动,其二是如何从人类活动识别城市功能。从社交媒体中识别城市功能的路线如图2所示。
首先,使用词性标注对社交媒体文本中的动词进行提取用于表示人类活动。其次使用词嵌入技术将动词表示为矩阵
,用于表示人类活动特征。动词相对于动名词词组在表示人类活动时具有模糊性,因此每个动词可能以不同概率同时隶属于不同的城市功能类型(例如“看”-“看书”-“看电影”)。假设表示相似人类活动的动词在语料中具有相似的结构特征。因此选用Fuzzy Means模糊聚类方法对动词向量进行聚类得到动词对于不同类型城市功能的隶属度矩阵
其中
表示动词表中动词的数量,
表示城市功能类型的数量。接下来,对不同空间分析单元中不同动词的词频进行统计表示为动词词频矩阵
,其中
表示空间分析单元的数量,最后使用公式1对城市功能进行识别:
其中,
为城市功能矩阵,每一行为单个空间分析单元不同城市功能类型的占比。
由于社交媒体数据的稀疏性,基于UFV的城市功能识别结果在数据稀疏区域可能没有明显的统计意义。通过引入街景数据可以缓解数据稀疏性引起的问题。在动词足够的区域通过神经网络建立城市建筑环境与城市功能的关系。随后在动词稀疏区域应用该神经网络预测该区域的城市功能。方法流程如图3所示:
首先使用卷积神经网络ResNet18抽取街景图像特征
,由于每个街景拍摄点有四张街景图片,每个拍摄点的建筑环境特征被表示为公式2所示:
对每个拍摄点250m内统计不同动词的词频。基于动词数量,以动词数量中位数为阈值将拍摄点划分为动词充足和动词稀疏两种拍摄点如图3中的绿色圈拍摄点(动词充足)和红色圈拍摄点(动词稀疏)。将所有动词充足拍摄点作为训练数据,动词稀疏拍摄点作为预测数据,基于街景特征对动词稀疏拍摄点城市功能进行识别。最后对每个空间分析单元中的动词拍摄点城市功能取平均作为该分析单元的城市功能。
最后基于公式3对分析单元基于动词和街景识别的城市功能进行融合:
社交媒体文本中共有1909个动词被抽取作为动词词表,使用Fuzzy CMeans对词表进行聚类生成城市功能隶属度矩阵。当动词对某个城市功能隶属度大于0.8时被选择用于生成城市功能类的词云如图4所示:
其中占比最高的城市功能类分别为shopping, work以及housework。与娱乐活动相关的城市功能类占比高达31.09%包括shopping, recreation, leisure 以及relaxation。其次,日常生活相关的城市功能占比达25.01%,工作占比16.60%。
城市功能的空间分布被分为三种模式:merging, diverging 以及 scatter,如图5所示:
其中,Merging模式包括work, shopping, recreation, 和other,反映出集中于中心城区的活动其强度远高于周围区域。Diverging模式主要包括日常生活和休闲活动,而Scattered模式主要表现出如类似于交通的具有空间离散趋势的城市功能。这三种模式又可以被进一步划分为聚合和分散两种,聚合包括Merging和Diverging,这两种模式的差异是由城市功能和经济隐私的关系所决定的。
具有某种城市功能高占比且空间聚集的区域被看作是该城市功能的典型场所,被用于验证城市功能识别结果,图6中包含了Work和Entertainment两种城市功能的典型区域分布:
图6 城市功能典型场所:A) Work;B) Entertainment.
a)北京大学;b)清华大学;c)中科院区域;d)亚运村;e)三元桥;f)酒仙桥;g)中关村;h)金融街。
这些典型场所都是熟知的北京工作区域,这些工作类型包括科学研究、信息技术、金融以及时尚领域等。
a)东直门;b)望京;c)牛街;d)工人体育馆;e)西单;f)五道口;g)朝阳大悦城;h)王府井;i)亚运村。
这些场所常被用于休闲娱乐、购物、美食等。能够发现从对应的街景中建筑环境也反映了对应的城市功能类型。
进一步对这些典型区域的出租车上下车点数基于时间进行统计作出每个典型区域的出租车活动时序图如图7所示:
图7中(a)(b)(c)为典型工作场所,(d)(e)(f)为典型娱乐场所。可以发现在典型工作场所中会出现上午8点和12点的高峰,而典型的娱乐区域会有中午和傍晚/晚上的高峰。酒仙桥和望京都不仅出现了具有表示工作的早上/中午高峰,还出现了表示娱乐的傍晚/晚上高峰,这是因为这两个场所邻近,具有混合的城市功能。这也表明我们所提出的方法能够精确识别混合城市功能。
该研究所提出的基于多源数据的城市功能识别方法能够有效地对城市功能进行比例识别,所做出的贡献主要有两部分:
(1)动词被用作人类活动的表示去识别城市功能。相较于实词,动词作为人类活动的直接表示能够避免噪声的干扰;
(2)结合社交媒体数据和街景数据从人类活动和城市建筑环境两个方面对城市功能识别。这项工作以数据融合的方式更好地帮助去理解城市结构和人地关系。
Ye, C., Zhang, F., Mu, L., Gao, Y., & Liu, Y. (2020). Urban function recognition by integrating social media and street-level imagery. Environment and Planning B: Urban Analytics and City Science.
https://doi.org/10.1177/2399808320935467

最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”或“在看”,没有把我们“星标”,都有可能出现这种状况。
加“星标”,不迷路!看完文章顺手点点“赞”或“在看”,就可以准时与我们见面了~
原文始发于微信公众号(城市数据派):融合社交媒体与街景数据的城市功能识别丨城市数据派