1. 为什么你的地物分类总不准可能第一步就错了做遥感影像地物分类的朋友估计都遇到过这样的困惑同一套数据别人跑出来的分类图清晰准确自己做的却总是一团浆糊地物边界模糊甚至把湖泊错分成建筑。我以前也踩过这个坑折腾了好几天又是调分类器参数又是换算法结果收效甚微。后来才发现问题可能出在最基础、也最容易被忽视的一步——大气校正。你可以把大气层想象成一块脏兮兮的、厚薄不均的毛玻璃。卫星传感器在几百公里外看地球光线必须穿过这块“毛玻璃”才能被接收到。这块“玻璃”会散射、吸收光线尤其是水汽、气溶胶这些“污渍”会严重扭曲地物真实的反射信息。我们拿到的原始遥感影像DN值就像是透过这块脏玻璃看到的画面自带一层“滤镜”。直接用这个带滤镜的画面去做地物分类就像让一个色盲去分辨颜色基础信息就是错的后面算法再厉害也白搭。所以大气校正的核心任务就是把这层“大气滤镜”给去掉还原地物本身真实的反射率。今天我就结合自己处理Landsat 8数据的实战经验来深度对比三种最常用的大气校正方法绝对大气校正FLAASH、快速大气校正QUAC和辐射定标只做定标不进行大气校正。我们不空谈理论就聚焦在一个实际场景对同一幅包含湖泊、茂密植被和城市建筑物的影像分别用这三种方法处理然后看看处理后的图像亮度变化、地物波谱曲线最关键的是它们最终对地物分类的精度影响到底有多大。我会带你一步步操作从ENVI里的参数设置到结果对比分析把每个方法的优缺点、适用场景和那些容易踩的“坑”都讲明白。无论你是刚入门遥感的学生还是需要快速处理数据的工程师这篇文章都能给你一份清晰的“方法选择指南”。2. 实验准备从“原始数据”到“待比对的起跑线”在开始“神仙打架”之前我们得先把“擂台”搭好让三位选手站在同一起跑线上。这个擂台就是我们的实验数据。我这次用的是Landsat 8 OLI的一景数据覆盖区域包含清澈水体、茂密森林和一片城市建成区正好对应我们要分析的湖泊、植被和建筑物。第一步也是所有遥感处理的基石辐射定标。很多人会把辐射定标和大气校正混为一谈其实它们有本质区别。卫星传感器直接记录的是数字量化值DN值这个值和地物反射的光线能量之间是一个仪器决定的、固定的数学关系主要是增益和偏置。辐射定标就是利用卫星数据自带的这个关系参数把DN值转换成具有物理意义的辐射亮度值单位是W/(m²·sr·μm)。你可以理解为把相机拍到的“RAW格式”照片转换成标准的、包含亮度信息的数字文件。在ENVI里的操作很直接在工具箱里找到Radiometric Correction-Radiometric Calibration。选择你的Landsat 8数据在定标类型Calibration Type里务必选择Radiance辐射亮度值。这是我们后续所有处理的基础。输出格式我强烈建议选BILBand Interleaved by Line。这是有血的教训的ENVI里一些高级的大气校正模块比如待会要用的FLAASH对输入数据的格式有要求BIL格式兼容性最好。如果你选了别的格式很可能到下一步就会报错让你从头再来。输出数据类型选Float保留更多小数位精度更高。点击Apply FLAASH Settings按钮这个操作会帮你预填一些FLAASH需要的元数据非常省事。最后指定输出路径我给文件起名叫radiometric_result.dat点击确定。完成后我们得到了第一个关键中间产品辐射定标后的影像。现在它记录的是地物和大气共同作用后到达卫星传感器的辐射亮度。请注意此时大气的影响依然存在。我们可以快速对比一下定标前后的影像。直观上看图像整体会有一个线性的拉伸变得更亮了但地物之间的色彩关系没有根本性改变。建筑物还是灰白的植被是深绿色的湖泊是深蓝色的。这就像我们把照片的曝光整体调亮了一些但玻璃上的污渍还在。3. 方法一绝对大气校正FLAASH—— 追求物理精度的“重武器”绝对大气校正目标是得到地物真实的地表反射率。它通过复杂的物理辐射传输模型模拟光在大气中的传播过程反演出大气参数如能见度、水汽含量从而精确扣除大气影响。ENVI里的FLAASH模块就是这类方法的代表。它功能强大但设置繁琐对输入数据和参数非常敏感。用我们上一步得到的radiometric_result.dat作为输入打开FLAASH模块。里面参数一大堆新手看了都头大。我挑几个最关键的说传感器类型Sensor Type和飞行时间软件一般能根据元数据自动识别一定要核对。大气模型Atmospheric Model根据影像所在的地区和季节选择比如中纬度夏季。选错了会影响水汽和臭氧的校正。气溶胶模型Aerosol Model城市、乡村还是海洋这直接影响对雾霾、灰尘的估算。我这张图有城市通常选“城市”。初始能见度Initial Visibility这个参数估计最让人头疼。FLAASH提供了基于暗像元如纯净深水体或浓密植被反演能见度的选项我强烈建议你勾选Use Tiedown Image如果数据有深水体或K-T方法进行估算这比手动瞎猜一个40公里靠谱得多。设置完毕点击运行喝杯咖啡等待计算量不小。完成后我们来看FLAASH的“手术”效果。首先是视觉对比。校正前后的图像放在一起最明显的感觉是图像整体亮度显著增强了而且色彩变得更加鲜艳、通透。之前灰蒙蒙的感觉一扫而空植被的绿色更翠水体的蓝色更清。这是因为FLAASH不仅去除了大气散射造成的“薄雾”还校正了大气吸收特别是水汽吸收带的影响让地物的真实颜色得以显现。但视觉好看不等于分类好用我们得看“内功”——波谱曲线。我在同一片健康的阔叶林区域取了一个点对比它校正前后的波谱曲线如下图示意。左边是校正后右边是校正前即辐射定标后的辐射亮度曲线。波谱曲线示意图文字描述 校正前曲线在蓝光波段~0.45-0.52μm和红光波段~0.63-0.69μm有两个明显的吸收谷但在近红外波段~0.76-0.90μm的反射峰不够高、不够陡峭整体曲线形态略显“扁平”。 校正后曲线蓝光、红光的吸收谷更加深邃近红外波段的反射峰陡然上升形成一个非常典型且尖锐的“陡坎”。整个曲线形态与教科书上健康的绿色植被反射波谱曲线高度吻合。这个对比非常关键植被在近红外波段的高反射特性是其最重要的光谱特征。FLAASH成功还原了这一特征使得植被与其他地物在特征空间里的距离拉大了。这意味着在后续分类时算法能更容易地把植被像素区分出来。对于湖泊清澈深水FLAASH校正后其在可见光波段的反射率会降到极低波谱曲线变得非常平滑且位于底部与植被和建筑物的区分度极大。对于建筑物混凝土屋顶其波谱曲线通常在各波段较为平缓FLAASH校正后其与植被在近红外的差异、与水体在蓝绿光的差异都更加明显。所以FLAASH的优势很突出物理模型严谨理论上精度最高能获得真实的地表反射率便于不同时间、不同传感器数据的对比研究。但它也是个“大爷”参数多且设置复杂依赖大气参数输入计算速度慢而且如果区域缺乏适合的暗像元或者天气状况复杂反演可能失败或精度下降。它适合对定量化精度要求极高的科研项目或者需要长时间序列分析的应用。4. 方法二快速大气校正QUAC—— 效率至上的“快刀手”如果你手头项目时间紧、任务重或者研究区域找不到可靠的大气参数那么快速大气校正QUAC可能就是你的“救命稻草”。QUAC的核心思想很巧妙它不试图去精确计算大气成分而是基于一个统计假设——整幅影像中所有像素的平均波谱应该接近于整个大气层的平均波谱。通过从每个像素的波谱中减去这个“平均大气波谱”来实现相对校正。在ENVI中操作QUAC简单得令人感动找到Quick Atmospheric Correction工具选择我们辐射定标后的数据radiometric_result.dat指定输出路径几乎不用设置任何参数点击OK几十秒到几分钟就搞定了。它的效果如何呢我们把QUAC的结果和FLAASH、原始辐射定标结果放在一起对比。从视觉上看QUAC处理后的图像其亮度和色彩鲜艳度介于辐射定标和FLAASH之间。它去除了很大一部分“灰蒙蒙”的感觉图像对比度得到改善地物细节更清晰但没有FLAASH结果那么“鲜亮夺目”。再看波谱曲线我们同样提取那片植被的波谱。QUAC校正后的曲线形态在整体形状上已经非常接近FLAASH的结果了近红外反射峰明显红谷和蓝谷可见。但与FLAASH相比QUAC曲线在各个波段的反射率绝对值可能会有一个整体的偏移平移并且曲线的一些细微起伏可能不够FLAASH那么精准。例如植被在红边区域红光到近红外的过渡的陡峭变化QUAC模拟得可能稍缓一些。这意味着什么对于地物分类来说分类器如支持向量机、随机森林更关注的是不同地物类别在特征空间中的相对位置和可分性而不是反射率的绝对数值。QUAC虽然不能给你“真实”的反射率但它通过去除影像内部共有的“大气背景信号”极大地增强了不同地物之间的光谱对比度。建筑物、植被、水体这三类地物在QUAC处理后的影像中其光谱特征的差异已经被充分放大足以让分类器进行有效区分。QUAC的优势极其明显速度快、无需任何大气参数、完全自动化、操作傻瓜式。它的劣势在于是一种经验性、相对性的校正结果不是真实地表反射率不能用于严格的定量反演或不同景影像间的直接数值比较。它最适合用于单景影像的快速预处理以服务于地物分类、变化检测等需要突出内部差异的应用。5. 方法三辐射定标不进行大气校正—— 被忽略的“基准线”最后我们特意把“只进行辐射定标不做任何大气校正”的情况作为一个对比项。这其实代表了很大一部分新手或者对精度要求不高的简单应用的实际做法觉得做了定标数据就是“物理量”了可以直接用了。我们把radiometric_result.dat这幅图像本身作为第三种“校正”结果。它的波谱曲线我们之前已经看过是受到严重大气影响的“扭曲”版本。现在我们把三种植被、湖泊、建筑物的波谱曲线分别放在三种处理结果辐射定标、FLAASH、QUAC下进行对比。我们可以用下面这个表格来概括核心差异地物类型处理方式波谱曲线关键特征对分类的影响茂密植被辐射定标近红外峰不明显红谷较浅曲线扁平。植被与某些潮湿土壤、阴影区建筑光谱易混淆分类精度低。FLAASH校正近红外反射峰高耸陡峭红谷深形态标准。特征极其鲜明与其他类区分度最大利于高精度分类。QUAC校正近红外峰明显整体形态与FLAASH相似但可能有平移。特征得到增强与建筑物、水体区分清晰分类精度接近FLAASH。清澈湖泊辐射定标因大气散射在蓝绿波段亮度偏高曲线不平滑。易与阴影或深色建筑屋顶混淆。FLAASH校正各波段反射率极低且曲线平坦尤其在近红外接近0。光谱特征独特极易与其他所有地物区分。QUAC校正整体亮度压低曲线较平坦暗部特征突出。能很好地区分于亮色地物分类效果良好。混凝土建筑辐射定标曲线较为平缓但受大气影响整体抬升与植被在近红外有重叠。与植被、某些裸土难以区分。FLAASH校正曲线仍较平缓但在近红外波段与植被形成巨大反差。光谱位置明确分类边界清晰。QUAC校正平缓曲线特征保留与植被的光谱距离被拉大。分类效果显著改善。这个对比清晰地告诉我们跳过大气校正直接使用辐射定标数据进行分类是在“沙地上盖房子”。大气效应严重压缩了不同地物之间的光谱差异特别是削弱了植被最关键的近红外特征同时抬高了暗色地物深水、阴影的亮度导致光谱混淆严重。你的分类算法即使调参到极致也会因为输入特征本身“模糊不清”而性能大减。6. 实战检验三种方法在地物分类中的终极对决理论分析再好也得实战检验。我使用同一幅影像分别用上述三种处理结果辐射定标后数据、FLAASH结果、QUAC结果作为输入采用同一种分类方法比如最常用的支持向量机SVM使用相同的训练样本对湖泊、植被、建筑物三类进行监督分类。分类后的精度验证结果这里用混淆矩阵的总体精度和Kappa系数表示最能说明问题使用辐射定标数据未大气校正分类结果惨不忍睹。城市里的许多建筑被错分为植被因为近红外波段混淆湖泊边缘与建筑阴影混在一起总体精度可能只有60%-70%Kappa系数很低。分类图看上去斑斑点点噪声极多。使用FLAASH绝对大气校正数据分类效果最佳。地物边界清晰类别纯净度高。特别是植被区域连续且完整水体轮廓准确。总体精度轻松达到85%甚至90%以上Kappa系数很高。这说明输入数据的质量直接决定了分类的天花板。使用QUAC快速大气校正数据分类效果让我有点惊喜。其总体精度和Kappa系数非常接近FLAASH的结果很多时候差距在2%-5%以内。在目视效果上主要地物都能被正确区分虽然可能在一些光谱特征复杂的过渡区域如植被与建筑物的交界、浑浊水体细节上略逊于FLAASH但完全满足大多数生产性项目的需求。这个实战测试给了我们一个非常明确的结论对于地物分类这个目标进行大气校正无论是绝对的还是快速的是必不可少的步骤其带来的精度提升是质的飞跃。而在绝对校正FLAASH和快速校正QUAC之间如果你追求极致的定量精度和结果的物理真实性且有时间有参数选FLAASH如果你的首要目标是快速、稳健地获得一个用于分类的优质数据且不想在参数上折腾那么QUAC是性价比超高的选择它的效果在分类任务上常常好得出乎意料。7. 如何选择给你的实用决策指南讲了这么多最后落到实际项目上到底该怎么选我根据自己的经验给你画个决策流程图首先问自己我的最终应用目标是什么如果是进行精确的地物分类、变化检测、目标识别那么大气校正必须做。此时进入下一个问题。如果是需要反演叶面积指数、 chlorophyll-a浓度等生物物理参数或进行多时相定量对比那么你必须选择绝对大气校正FLAASH或类似模型以获取真实反射率。对于地物分类应用接着问项目对时间和易用性的要求如何如果项目时间充裕有可靠的大气参数或影像包含深水体等可用于反演的区域且你愿意花时间学习并调试参数选择FLAASH。它能给你最扎实、最可信的结果尤其当你的研究区大气条件复杂时。如果项目周期紧需要处理大量数据或者你是新手又或者研究区缺乏大气参数如无云但雾霾重毫不犹豫地选择QUAC。它快、稳、省心在分类效果上完全能打是生产效率的保障。一个我常用的混合策略是对于大范围、多景影像的分类项目我会先用QUAC进行批量快速处理快速得到分类初稿和整体精度评估。如果发现某些关键区域或特定地类分类效果不理想再针对这些区域或单景影像启用FLAASH进行精细处理作为局部优化。这样既能保证整体效率又能在关键点上追求精度。记住没有“最好”的方法只有“最适合”你当前项目约束条件和目标的方法。理解每种方法的原理和代价你就能做出明智的选择。至少看完这篇文章后别再直接用辐射定标后的数据去做分类了这个“坑”咱们就别再踩了。