用户名
密码
(30天内有效)
注册
注册
+ 我要分享数据和工具
你手上有闲置的数据、开发的工具或产品,
免费或有偿分享,立享知识变现!
  • 绿点

    【研究数据分享】面向深度学习的GF-3 精细模式SAR建筑数据集

    遥感学报NRSBSAR图像是开展城市建筑区信息获取与动态监测的重要数据源。中国科学院空天信息创新研究院吴樊、张红、王超等在《遥感学报》发表论文“SARBuD 1.0:面向深度学习的GF-3 精细模式SAR建筑数据集”,该数据样本集获取自覆盖中国不同区域的 27 景高分三号 (GF-3) 精细模式 SAR 图像,从中提取了建筑区SAR样本数据,结合光学图像与专家解译,制作了与样本数据对应的标签图像。SARBuD1.0数据集包含了不同地形场景类型、不同分布类型、不同区域的建筑区。公开数据包含建筑样本及标签图像共50000个。该数据集可支持研究者对建筑区进行图像特征分析、辅助图像理解,并可对当前热点深度学习方法提供训练、测试数据支持。论文信息题目:SARBuD 1.0:面向深度学习的GF-3 精细模式SAR建筑数据集作者:吴樊, 张红, 王超, 李璐, 李娟娟, 陈卫荣, 张波第一作者单位:中国科学院空天信息创新研究院引用格式:吴樊,张红,王超,李璐,李娟娟,陈卫荣,张波.2022.SARBuD 1.0:面向深度学习的GF-3 精细模式SAR建筑数据集.遥感学报,26(4):620-631[DOI:10.11834/jrs.20220296]研究背景 传统SAR图像建筑提取多从散射强度、纹理特征、成像几何特征、相干特征等方面进行方法设计。这一过程多依赖于研究者的经验总结,但研究人员通常不能观察到待分类对象的所有样本,所设计出来的特征可能无法表达复杂的映射。因而要实现快速、准确大区域范围的建筑提取仍面临着很多挑战。近年基于卷积神经网络的深度学习算法在图像多层级特征学习、特征提取方面取得了良好的成果,已成为地物分类的研究热点。针对这一目的本研究基于 GF-3 精细模式 SAR 数据,构建了一个面向大区域多种地形场景的 SAR 建筑区数据集。数据集旨在促进 SAR 建筑区特性分析及建筑物语义分割提取方面的研究,推进国产SAR数据的深入应用。数据集构建1 预处理数据预处理包括幅度图生成、辐射标定、地理编码等基本处理。所获取的GF-3 数据为 SLC数据,为使不同地区的建筑区之间具有可比性,根据数据头文件中提供的标定参数对图像进行辐射标定。采用线性 2% 拉伸方式对经过辐射标定后的图像处理成 8 位图像。几何纠正根据 GF-3 数据产品 RPC 参数文件中的参数,构建 RPC 模型对图像进行纠正。结合与SAR图像成像时间接近的高分辨率光学图像进行人工目视解译制作像素级标签二值图。2样本集制作将预处理后的SAR 图像及标注的二值标签图进行裁剪,尺寸为 256 像素×256 像素。为了避免裁剪过程中部分建筑区被切割成小的子区域,确保每个完整的建筑区都能有对应的切片,切片与切片之间保证30 个像素值宽度的重叠区。对切片中包含建筑区范围很少的非完整切片进行剔除。根据相应的二值标注图中是否包含有建筑区,将样本切片区分为正样本(或称为有效标记样本)或负样本,放于不同的子集中,构建用于深度学习网络模型训练的样本集。图1 建筑区样本制作流程3建筑样本示例图展示了不同建筑区样本切片示例。从图2中可以看出,建筑分布类型多样化,建立大型样本数据集有利于深度学习网络更好学习不同建筑分布类型的几何结构和纹理特征。图2 不同建筑样本示例4数据集结构以支持研究者对 SAR图像进行建筑区与非建筑区的二元分割为目标,数据集主要包含 SAR 图像样本及相应的二分类标签图。二分类标签图是解译专家结合高分辨率光学图像对 SAR 图像进行建筑区解译的结果。整个数据集的组织结构见图3。数据集获取自27景 SAR 数据,单景 SAR 数据以源数据名命名。每景数据文件中包含对应的SAR 图像强度图、SAR 图像样本切片,相应的标签切片以及后向散射文件,文件格式均为TIFF 格式。此外,数据集还包括图像文件的元数据文件,格式为 XML,元数据文件涵盖了SAR 数据的成像时间、入射角、经纬度等基本信息。图3 数据集结构数据试验与分析基于本研究数据集,利用多种深度学习模型进行建筑区提取测试,考察本数据集在多类型地形场景的建筑区提取适用性。用于测试的深度学习模型包括多尺度注意力 U-Net(MA-UNet),批归一化 U-Net(BN-UNet)和残差U-Net(Res-UNet)进行测试,并对结果进行分析。选取河北省某一地区为试验区,试验区包含密集城市建筑区、山区村镇和散落分布、规模不等的田间村落,场景多样复杂。数据采用样本集外的一景GF-3精细条带 II模式图像,幅宽约为 100 km×100 km。结合高分辨率 Google Earth 光学影像随机选择 SAR 图像的建筑区和非建筑区各10000个样本点验证结果。图4 建筑区提取结果表1 3种方法的提取结果比较图 4 和表 1分别展示了不同模型方法得到的建筑区提取结果及精度评价。从中可以看出,3类网络模型的建筑区提取的总精度都在80% 以上,本数据集对基于深度学习方法的建筑区提取均有很好的数据支持。研究结论本研究建立了一套较完备的大型SAR图像建筑样本集。该数据集采集于 GF-3 FSII模式 SAR 图像。基于本数据集利用不同深度学习方法对不同地形、地域的建筑区进行建筑区域提取试验,试验结果表明该数据集可很好支持面向大数据的深度学习方法。人工智能深度学习方法依赖于海量数据的训练学习与模型精化。虽然目前有仿真模拟、迁移学习等基于少量样本或样本不充分条件下的模型训练处理方法。但真实数据仍是提高模型处理能力和泛化能力的基础与关键。因此数据集的不断扩充、完善与测试验证 (如:针对不同传感器、不同波段、不同分辨率、不同极化等参数的 SAR 图像,在不同国家/地区的建筑类型等条件下获取样本数据) 仍是非常重要的工作。 数据集及论文下载关注城市数据派微信号,在微信号对话框中输入 “ 0616 ”,即可获得数据集及论文PDF下载方式。由于数据量过大,请按网页提示进行下载使用,研究者可在此数据集基础上开展建筑散射特性分析与建筑区语义分割提取方面的研究。团队简介第一作者吴樊 ,可持续发展大数据国际研究中心,中国科学院空天信息创新研究院副研究员,研究方向为SAR图像处理与信息提取。E-mail: wufan@aircas.ac.cn通信作者张红,可持续发展大数据国际研究中心,中国科学院空天信息创新研究院研究员,研究方向为SAR大数据智能处理、极化SAR、干涉SAR处理方法与应用。E-mail: zhanghong200307@aircas.ac.cn王超,可持续发展大数据国际研究中心,中国科学院空天信息创新研究院研究员,研究方向为SAR信息提取机理与方法、大数据智能处理与分析。E-mail: wangchao@radi.ac.cn相关论文吴樊,李娟娟,张波,王超,张红,陈富龙,李璐,许璐.2021.时间序列SAR图像不可移动文物水域淹没监测.遥感学报,25(12):2431-2440Wu F, Wang C, Zhang H, Li J, Li L, Chen W, et al. Built-up area mapping in China from GF-3 SAR imagery based on the framework of deep learning. Remote Sensing of Environment. 2021, 262:112515.Li J, Zhang H, Wang C, Wu F, Li L. Spaceborne SAR Data for Regional Urban Mapping Using a Robust Building Extractor. Remote Sensing. 2020, 12(17):2791.
    免费
免费
  • 绿点

    2021年09月全国370+地级市空气质量监测数据

    地域范围:全国370+地级市数据来源:国家环保部数据中心数据时间:2021年09月1日-30日,每日每小时数据,部分时刻有缺失数据格式:excel格式包含字段:CITY:城市名称AQI:空气质量指数,即air quality index,是定量描述空气质量状况的无纲量指数CO:一氧化碳1小时平均CO_24h:一氧化碳24小时滑动平均NO2:二氧化氮1小时平均NO2_24h:二氧化氮24小时滑动平均O3:臭氧1小时平均O3_24h:臭氧日最大1小时平均O3_8h:臭氧8小时滑动平均O3_8h_24h:臭氧日最大8小时滑动平均PM10:颗粒物(粒径小于等于10μm)1小时平均PM10_24h:颗粒物(粒径小于等于10μm)24小时滑动平均PM2.5:颗粒物(粒径小于等于2.5μm)1小时平均PM2.5_24h:颗粒物(粒径小于等于2.5μm)24小时滑动平均SO2:二氧化硫1小时平均SO2_24h:二氧化硫24小时滑动平均Date:数据采集日期Hour:数据采集时刻 数据条数:270000条 数据顶部缩略图:数据底部缩略图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty (请备注:会员+网站昵称)。
    会员¥0
会员¥0
  • 绿点

    2021年08月全国370+地级市空气质量监测数据

    地域范围:全国370+地级市数据来源:国家环保部数据中心数据时间:2021年08月1日-31日,每日每小时数据,部分时刻有缺失数据格式:excel格式包含字段:CITY:城市名称AQI:空气质量指数,即air quality index,是定量描述空气质量状况的无纲量指数CO:一氧化碳1小时平均CO_24h:一氧化碳24小时滑动平均NO2:二氧化氮1小时平均NO2_24h:二氧化氮24小时滑动平均O3:臭氧1小时平均O3_24h:臭氧日最大1小时平均O3_8h:臭氧8小时滑动平均O3_8h_24h:臭氧日最大8小时滑动平均PM10:颗粒物(粒径小于等于10μm)1小时平均PM10_24h:颗粒物(粒径小于等于10μm)24小时滑动平均PM2.5:颗粒物(粒径小于等于2.5μm)1小时平均PM2.5_24h:颗粒物(粒径小于等于2.5μm)24小时滑动平均SO2:二氧化硫1小时平均SO2_24h:二氧化硫24小时滑动平均Date:数据采集日期Hour:数据采集时刻 数据条数:279000条 数据顶部缩略图:数据底部缩略图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty (请备注:会员+网站昵称)。
    会员¥0
会员¥0
  • 绿点

    2021年07月全国370+地级市空气质量监测数据

    地域范围:全国370+地级市数据来源:国家环保部数据中心数据时间:2021年07月1日-31日,每日每小时数据,部分时刻有缺失数据格式:excel格式包含字段:CITY:城市名称AQI:空气质量指数,即air quality index,是定量描述空气质量状况的无纲量指数CO:一氧化碳1小时平均CO_24h:一氧化碳24小时滑动平均NO2:二氧化氮1小时平均NO2_24h:二氧化氮24小时滑动平均O3:臭氧1小时平均O3_24h:臭氧日最大1小时平均O3_8h:臭氧8小时滑动平均O3_8h_24h:臭氧日最大8小时滑动平均PM10:颗粒物(粒径小于等于10μm)1小时平均PM10_24h:颗粒物(粒径小于等于10μm)24小时滑动平均PM2.5:颗粒物(粒径小于等于2.5μm)1小时平均PM2.5_24h:颗粒物(粒径小于等于2.5μm)24小时滑动平均SO2:二氧化硫1小时平均SO2_24h:二氧化硫24小时滑动平均Date:数据采集日期Hour:数据采集时刻 数据条数:279000条 数据顶部缩略图:数据底部缩略图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty (请备注:会员+网站昵称)。
    会员¥0
会员¥0
  • 绿点

    2021年06月全国370+地级市空气质量监测数据

    地域范围:全国370+地级市数据来源:国家环保部数据中心数据时间:2021年06月1日-30日,每日每小时数据,部分时刻有缺失数据格式:excel格式包含字段:CITY:城市名称AQI:空气质量指数,即air quality index,是定量描述空气质量状况的无纲量指数CO:一氧化碳1小时平均CO_24h:一氧化碳24小时滑动平均NO2:二氧化氮1小时平均NO2_24h:二氧化氮24小时滑动平均O3:臭氧1小时平均O3_24h:臭氧日最大1小时平均O3_8h:臭氧8小时滑动平均O3_8h_24h:臭氧日最大8小时滑动平均PM10:颗粒物(粒径小于等于10μm)1小时平均PM10_24h:颗粒物(粒径小于等于10μm)24小时滑动平均PM2.5:颗粒物(粒径小于等于2.5μm)1小时平均PM2.5_24h:颗粒物(粒径小于等于2.5μm)24小时滑动平均SO2:二氧化硫1小时平均SO2_24h:二氧化硫24小时滑动平均Date:数据采集日期Hour:数据采集时刻 数据条数:270000条 数据顶部缩略图:数据底部缩略图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty (请备注:会员+网站昵称)。
    会员¥0
会员¥0
  • 绿点

    重庆市部分学校AOI数据(2020年)

    学校:主要指小学、初中、高中、高等院校等数据时间:2020年数据格式:shp坐标系统:WGS1984属性字段:ID序号,名称数据条数:1384数据展示图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty(请备注:会员+网站昵称)。
    会员¥0
会员¥0
  • 绿点

    重庆市部分绿地AOI数据(2020年)

    绿地:主要包括一般绿地、山地、绿化带、林地等。数据时间:2020年数据格式:shp坐标系统:WGS1984属性字段:ID序号,名称数据条数:58729数据展示图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty(请备注:会员+网站昵称)。
    会员¥0
会员¥0
  • 绿点

    重庆市部分出入口数据(2020年)

    出入口:主要包括餐饮场所、高速公路、交通设施、金融机构、零售购物场所、旅游景区、卫生医疗机构、文化教育机构、小区、娱乐休闲场所及其他出入口。数据时间:2020年数据格式:shp坐标系统:WGS1984属性字段:ID序号,名称数据条数:13623数据展示图:使用说明:1、此数据非商业级数据,有部分的缺失和误差或错误,仅供个人学习使用。2、此内容为【城市数据派会员】专享。如需下载,请成为【城市数据派会员】,点击我要成为会员。3、如有疑问,请咨询客服微信:ahai_udparty(请备注:会员+网站昵称)。
    会员¥0
会员¥0
没有更多数据……