规划问道

如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


本期推送,我们将为大家带来实验室最新研究成果:新型海岸生态系统文化服务测度——基于社交媒体数据的图像识别与自然语言情感分析。


研究背景
如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派
生态系统文化服务(cultural ecosystem services, CES),是指人们在精神和认知层面从生态系统中获得的非物质收益,由于其主观性、无形性等特点难以被界定、量化。传统的非市场价值评估方法费时费力,利用海量社交媒体数据对CES进行大规模的测度已成为学术研究的热点问题之一。在全球气候变化、海平面上升、人类开发活动等背景下,亟待开展我国海岸带生态系统服务及其价值评估研究。本文使用图像识别技术与自然语言情感分析技术,同时基于社交媒体数据来测定海岸带CES与相关情感的异质性。为海岸地区文化服务综合开发策略制定,促进生态旅游可持续发展提供一定参考和科学支撑。


数据与方法
如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派
研究技术流程
如图1所示,本研究主要包括以下四个步骤(图2):

(1)利用网络爬虫收集和清理游客在研究区内上传的照片与相关文本内容等元数据信息,包括照片ID、用户ID、用户国籍信息、拍摄时间、经纬度信息、照片标题、照片描述、照片自定义标签。采用photo-user-days(PUD)的规则,同一用户仅保留同一天内上传的第一张照片以减少采样偏差。

(2)使用图像识别技术提取照片中的实体标签,筛选出与海岸带CES有关的实体标签,进而量化CES价值。本研究得到424个与CES相关的标签,并根据返回的标签与置信度来计算CES的优势度并加以可视化。

(3)使用自然语言情感分析技术挖掘与海岸带CES有关的情感。返回Sentiment和Magnitude两个情感值,计算每个网格单元中的平均情绪强度并加以可视化。文档的Sentiment表示文档的总体情绪,文档情感的Magnitude表明文档中存在多少情绪化内容。

(4)将CES与相关情感同人口与时间指标(昼夜因子、季节因子以及游客来源地因子)进行回归分析。首先,通过多元线性回归模型研究CES与指标之间的相关性;其次,对经重新编码的两个情感值使用Logistic回归模型研究与指标之间的相关性;通过Kruskal–Wallis检验以及Dunn检验研究不同指标下不同组之间的CES与相关情感的差异性。

如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

图1 基于社交媒体数据的生态系统文化服务(CES)测定的研究技术流程


研究区概况

选择香港海岸线周围500米范围为研究案例区(图2),建立100米*100米的网格单元。

如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

图2 香港海岸研究区地理位置

CES类型定义
根据主流的生态系统服务分类框架以及香港海岸带生态环境特异性,主要关注六类CES类型:运动游憩服务(Recreational services)、景观美学服务(Aesthetic services)、宜居服务(Amenity services)、学习教育服务(Knowledge services)、生物多样性服务(Naturalistic services)、精神和宗教服务(Spiritual services)。


结果与分析
如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派
CES与相关情感的空间异质性
香港海岸带CES热点区域主要是维多利亚湾、香港仔以及大澳等地区。图4表示的是六种CES的空间异质性。具体而言,维多利亚湾与吐露港传递了丰富的运动游憩服务以及景观美学服务价值;维多利亚湾、浅水湾以及长洲的丰富历史文化景观具有较高的精神和宗教服务价值;与宜居服务和学习教育服务相关的照片在研究区内零星分布,而与生物多样性服务有关的照片则广泛分布于香港海岸带之中。图5表示的是与CES相关的情感的空间异质性,可以发现,在香港海岸带旅行的游客的情感整体呈现出一种较为肯定、温和的特征。

如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

图3 与CES相关的照片的空间分布特征


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

图4 香港海岸带CES的空间异质性

分别为:运动游憩服务、景观美学服务、宜居服务、学习教育服务、生物多样性服务、精神和宗教服务。

如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派


如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

图5 与CES相关的情感的空间异质性
分别是:Sentiment情感值、Magnitude情感值

回归分析结果
通过回归分析可以发现:(1)香港本地游客与欧美游客拍摄了最多的与CES相关的照片。(2)春天旅行表现出较高的精神和宗教服务价值;海外与内地游客较香港本地游客来说感知了更高的运动游憩服务价值,然而香港本地游客感知了更高的生物多样性服务价值。(3)夜间旅行表现出更为肯定、温和的情感;不同国籍的游客呈现了不一样的情感特征。

结论与讨论
如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派
(1)以社交媒体数据研究CES与相关情感的技术流程是可行的,适合推广至其他海岸城市的研究之中去。
(2)以香港为例,自然保护区与海岸带文化景观都可以是CES热点地区。
(3)CES与相关的游客情感随人口与时间指标的不同呈现出不同的特征。
(4)研究的不足之处主要在于:首先,由于数字鸿沟的存在,社交媒体对于海岸旅行的游客特征的勾勒存在着误差;其次,使用图像自动识别技术识别CES,无法避免机器对实体标签的误读,在日后的研究中应该结合专家的人工判别,从而提高结果的准确性。

参考文献:
Haojie Cao, Miao Wang, Shiliang Su, Mengjun Kang*. Explicit quantification of coastal cultural ecosystem services: A novel approach based on the content and sentimental analysis of social media. Ecological Indicators, 2022, 137, 108756.

本文转载自微信号:武大城市化研究室


最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”在看,没有把我们“星标”,都有可能出现这种状况。
“星标”,不迷路!看完文章顺手点点“赞”在看,就可以准时与我们见面了~
如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

原文始发于微信公众号(城市数据派):如何基于社交媒体数据的图像识别与自然语言情感分析测度CES?丨城市数据派

赞(0)