规划问道

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派


遥感学报NRSB
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派


SAR图像是开展城市建筑区信息获取与动态监测的重要数据源。中国科学院空天信息创新研究院吴樊、张红、王超等在《遥感学报》发表论文“SARBuD 1.0:面向深度学习的GF-3 精细模式SAR建筑数据集”,该数据样本集获取自覆盖中国不同区域的 27 景高分三号 (GF-3) 精细模式 SAR 图像,从中提取了建筑区SAR样本数据,结合光学图像与专家解译,制作了与样本数据对应的标签图像。

SARBuD1.0数据集包含了不同地形场景类型、不同分布类型、不同区域的建筑区。公开数据包含建筑样本及标签图像共50000个。该数据集可支持研究者对建筑区进行图像特征分析、辅助图像理解,并可对当前热点深度学习方法提供训练、测试数据支持。


🔸 论文信息
题目:SARBuD 1.0:面向深度学习的GF-3 精细模式SAR建筑数据集
作者:吴樊, 张红, 王超, 李璐, 李娟娟, 陈卫荣, 张波
第一作者单位:中国科学院空天信息创新研究院
引用格式:吴樊,张红,王超,李璐,李娟娟,陈卫荣,张波.2022.SARBuD 1.0:面向深度学习的GF-3 精细模式SAR建筑数据集.遥感学报,26(4):620-631[DOI:10.11834/jrs.20220296]


研究背景 
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
传统SAR图像建筑提取多从散射强度、纹理特征、成像几何特征、相干特征等方面进行方法设计。这一过程多依赖于研究者的经验总结,但研究人员通常不能观察到待分类对象的所有样本,所设计出来的特征可能无法表达复杂的映射。因而要实现快速、准确大区域范围的建筑提取仍面临着很多挑战。

近年基于卷积神经网络的深度学习算法在图像多层级特征学习、特征提取方面取得了良好的成果,已成为地物分类的研究热点。针对这一目的本研究基于 GF-3 精细模式 SAR 数据,构建了一个面向大区域多种地形场景的 SAR 建筑区数据集。数据集旨在促进 SAR 建筑区特性分析及建筑物语义分割提取方面的研究,推进国产SAR数据的深入应用。


数据集构建
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

预处理
数据预处理包括幅度图生成、辐射标定、地理编码等基本处理。所获取的GF-3 数据为 SLC数据,为使不同地区的建筑区之间具有可比性,根据数据头文件中提供的标定参数对图像进行辐射标定。采用线性 2% 拉伸方式对经过辐射标定后的图像处理成 8 位图像。几何纠正根据 GF-3 数据产品 RPC 参数文件中的参数,构建 RPC 模型对图像进行纠正。结合与SAR图像成像时间接近的高分辨率光学图像进行人工目视解译制作像素级标签二值图。

2样本集制作
将预处理后的SAR 图像及标注的二值标签图进行裁剪,尺寸为 256 像素×256 像素。为了避免裁剪过程中部分建筑区被切割成小的子区域,确保每个完整的建筑区都能有对应的切片,切片与切片之间保证30 个像素值宽度的重叠区。对切片中包含建筑区范围很少的非完整切片进行剔除。根据相应的二值标注图中是否包含有建筑区,将样本切片区分为正样本(或称为有效标记样本)或负样本,放于不同的子集中,构建用于深度学习网络模型训练的样本集。

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

图1 建筑区样本制作流程

3建筑样本示例
图 2展示了不同建筑区样本切片示例。从图 2中可以看出,建筑分布类型多样化,建立大型样本数据集有利于深度学习网络更好学习不同建筑分布类型的几何结构和纹理特征。

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

图2  不同建筑样本示例

4数据集结构
以支持研究者对 SAR图像进行建筑区与非建筑区的二元分割为目标,数据集主要包含 SAR 图像样本及相应的二分类标签图。二分类标签图是解译专家结合高分辨率光学图像对 SAR 图像进行建筑区解译的结果。整个数据集的组织结构见图3。

数据集获取自27景 SAR 数据,单景 SAR 数据以源数据名命名。每景数据文件中包含对应的SAR 图像强度图、SAR 图像样本切片,相应的标签切片以及后向散射文件,文件格式均为TIFF 格式。此外,数据集还包括图像文件的元数据文件,格式为 XML,元数据文件涵盖了SAR 数据的成像时间、入射角、经纬度等基本信息。

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

图3 数据集结构


数据试验与分析
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
基于本研究数据集,利用多种深度学习模型进行建筑区提取测试,考察本数据集在多类型地形场景的建筑区提取适用性。用于测试的深度学习模型包括多尺度注意力 U-Net(MA-UNet),批归一化 U-Net(BN-UNet)和残差U-Net(Res-UNet)进行测试,并对结果进行分析。

选取河北省某一地区为试验区,试验区包含密集城市建筑区、山区村镇和散落分布、规模不等的田间村落,场景多样复杂。数据采用样本集外的一景GF-3精细条带 II模式图像,幅宽约为 100 km×100 km。结合高分辨率 Google Earth 光学影像随机选择 SAR 图像的建筑区和非建筑区各10000个样本点验证结果。

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

图4  建筑区提取结果

表1 3种方法的提取结果比较

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派


图 4 和表 1分别展示了不同模型方法得到的建筑区提取结果及精度评价。从中可以看出,3类网络模型的建筑区提取的总精度都在80% 以上,本数据集对基于深度学习方法的建筑区提取均有很好的数据支持。


研究结论
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
本研究建立了一套较完备的大型SAR图像建筑样本集。该数据集采集于 GF-3 FSII模式 SAR 图像。基于本数据集利用不同深度学习方法对不同地形、地域的建筑区进行建筑区域提取试验,试验结果表明该数据集可很好支持面向大数据的深度学习方法。

人工智能深度学习方法依赖于海量数据的训练学习与模型精化。虽然目前有仿真模拟、迁移学习等基于少量样本或样本不充分条件下的模型训练处理方法。但真实数据仍是提高模型处理能力和泛化能力的基础与关键。因此数据集的不断扩充、完善与测试验证 (如:针对不同传感器、不同波段、不同分辨率、不同极化等参数的 SAR 图像,在不同国家/地区的建筑类型等条件下获取样本数据) 仍是非常重要的工作。


 数据集及论文下载
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
关注城市数据派微信号,在微信号对话框中输入 “ 0616 ”,即可获得数据集及论文PDF下载方式。

由于数据量过大,请按网页提示进行下载使用,研究者可在此数据集基础上开展建筑散射特性分析与建筑区语义分割提取方面的研究。

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派


团队简介
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
第一作者
吴樊 ,可持续发展大数据国际研究中心,中国科学院空天信息创新研究院副研究员,研究方向为SAR图像处理与信息提取。
E-mail: wufan@aircas.ac.cn

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
通信作者
张红,可持续发展大数据国际研究中心,中国科学院空天信息创新研究院研究员,研究方向为SAR大数据智能处理、极化SAR、干涉SAR处理方法与应用。
E-mail: zhanghong200307@aircas.ac.cn

【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派
王超,可持续发展大数据国际研究中心,中国科学院空天信息创新研究院研究员,研究方向为SAR信息提取机理与方法、大数据智能处理与分析。
E-mail: wangchao@radi.ac.cn


相关论文
【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

吴樊,李娟娟,张波,王超,张红,陈富龙,李璐,许璐.2021.时间序列SAR图像不可移动文物水域淹没监测.遥感学报,25(12):2431-2440


Wu F, Wang C, Zhang H, Li J, Li L, Chen W, et al. Built-up area mapping in China from GF-3 SAR imagery based on the framework of deep learning. Remote Sensing of Environment. 2021, 262:112515.


Li J, Zhang H, Wang C, Wu F, Li L. Spaceborne SAR Data for Regional Urban Mapping Using a Robust Building Extractor. Remote Sensing. 2020, 12(17):2791.


最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”在看,没有把我们“星标”,都有可能出现这种状况。
“星标”,不迷路!看完文章顺手点点“赞”在看,就可以准时与我们见面了~

原文始发于微信公众号(城市数据派):【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集丨城市数据派

赞(0)