Ⅰ 矿物识别方法和工作流程
目前,矿物识别制图的方法是特征谱带识别和基于相似性测度的识别:①利用岩石矿物的特征谱带构造识别技术,该方法相对直观,简单可行,但是单一的特征往往造成岩石矿物的错误识别,其精度难以达到工程化应用的需求,同时对成像光谱数据的信噪比、光谱重建的精度要求较高;②从岩石矿物光谱的整体特征出发,与成像光谱视反射率数据进行整体匹配、拟合或构造模型进行分解,这也是目前研究的重点,能有效地避免因岩石矿物光谱漂移或光谱变异而造成的单个光谱特征的不匹配,并能综合利用弱的光谱信息,避免局部性特征(如单一特征构建的识别方法)造成识别的混淆,识别的精度高。
对于成像光谱上百个波段而言,数据量非常之大,尤其在目前无论是航空成像光谱数据,如AVIRIS、CASI、HyMap等,还是在轨的航天成像光谱数据,如Hyperion航带都普遍比较窄,一般在3~10km,给大面积应用带来很多不便,增加了大面积数据处理的难度,并使工作量在目前微机配置的条件下成倍增加。因此,无论是从岩石矿物光谱的局域特征还是整体特征开展对矿物的识别,在保证识别精度要求的条件下进行工程化的处理,必须探索新的技术流程。
在对成像光谱数据特征与识别方法的比较研究中,结合工作实际以及进行工程化处理的初步要求,在确保识别精度的条件下,设计出标准数据库光谱+光谱-特征域转换+矿物识别方法的技术流程。该流程的主要作用:
(1)直接开展蚀变矿物的识别与信息提取:在对试验区岩石类型、构造、热液活动以及矿产综合研究的基础之上,提炼与矿化关系密切的蚀变矿物,利用标准库的光谱或野外实测光谱作为参考光谱。
(2)进行光谱域与特征域的转换,实现数据减维与数据压缩,降低工作量,提高工作效率:成像光谱数据波段上百,不同的航带宽度与记录长度使单次处理的数据量达1Gbytes,中间过渡文件单航带可达10Gbytes;在以前的处理中常常将航带分割成较小的区域进行处理后再进行拼接,利用MNF技术可以将整个光谱域空间转换到特征域空间,消除原有光谱向量间各分量之间的相关性,从而去掉信息量较少噪声较高的向量,使数据处理从成百的光谱域集中到去噪的特征域中进行,减低数据量,缩短数据处理时间,提高数据处理的效率。
(3)特征分离,增加不同矿物的可分性,提高矿物识别的精度:在成像光谱数据MNF变换并剔除噪声波段的特征域空间中,不同的波段被赋予了不同的物理或数学意义,地物的光谱特征在特征域发生分离,地物的细微特征得到放大,增加了数据的可分性。
4.4.2.1 光谱特征域转换
光谱分辨率的提高,一方面提高了数据的分类识别的精度以及应用能力,另一方面,增加了数据的容量,也使数据高冗余高相关。有效的数据压缩与特征提取势在必行。一般地,利用传统的主成分变换进行相应的变化,衍生出一系列的成像光谱数据压缩与特征提取方法,如MNF变换(Kruse,1996;Green et al.,1998),NAPC(Lee et al.,1990)、分块主成分变换(Jia et al.,1998)以及基于主成分的对应分析(Carr et al.,1999)等。空间自相关特征提取(Warner et al.,1997)、子空间投影(Harsanyi et al.,1994)和高维数据二阶特征分析(Lee et al.,1993;Haertel et al.,1999)也得到相应的重视。利用非线形的小波、分形特征(Qiu et al.,1999)也在研究之中。
主成分分析(PCA)是根据图像的统计特征确定变换矩阵对多维(多波段)图像进行正交线性变换,使变换后新的组分图像互不相关,并且把多个波段中有用信息尽可能地集中到少数几个组分图像中(图4-4-1)。一般地,随着主成分阶次的提高,信噪比逐渐减小。但在波段较多时并不完全符合这一规律。
为改善主成分在高光谱维中的数据处理能力,相应地利用最大噪声组分变换(MNF)的方法(甘甫平,2001;甘甫平等,2002~2003)。该方法是利用图像的噪声组分矩阵(ΣNΣ-1)的特征向量对图像进行变换,使按特征值由大到小排序的变换分量所包含的噪声成分逐渐减小,而图像质量顺次提高。Σ为图像的总协方差矩阵,ΣN为图像噪声的协方差矩阵。MNF相当于所有波段噪声方差都相等时的主成分分析,因此可分为两步实现,第一步先将图像变换到一个新的坐标系统,使变换后图像噪声的协方差矩阵为单位阵;第二步再对变换后的图像施行主成分变换。此改进的算法称为“噪声调节主成分变换(NAPC)”。
对P波段的高光谱图像
Zi(x),i=1,2,…,p (4-4-1)
可以假设
Z(x)=S(x)+N(x) (4-4-2)
这里,ZT(x)={Z1(x),…,Zp(x)},S(x)和N(x)分别为Z(x)中不相关的信息分量和噪声分量。因此,
Cov{Z(x)}=∑=∑S+∑N (4-4-3)
∑S和∑N分别为S(x)和N(x)的协方差矩阵。因此,可以定义第i波段噪声分量,
Var{Ni(x)}/Var{Zi(x)} (4-4-@4)
选择线形转换,MNF变换可以表示为
成像光谱岩矿识别方法技术研究和影响因素分析
在变换中,确保
成像光谱岩矿识别方法技术研究和影响因素分析
同时,为使噪声与信息分离,S(x)分别与Z(x)和N(x)正交。
图4-4-1 MNF变换的特征值曲线
MNF有两个重要的性质,一是对图像的任何波段作比例扩展,变换结果不变;二是变换使图像矢量、信息分量和加性噪声分量互相垂直。乘性噪声可通过对数变换转换为加性噪声。变换后可针对性地对各分量图像进行去噪,或舍弃噪声占优势的分量。MNF变换的特征值曲线如图4-4-1。
4.4.2.2 特征分离
在MNF变换后的特征域中不同波段具有不同物理与数学意义。比如变换后的第1波段表示地物的亮度信息,第7 波段或第8 波段表示地形信息。在MNF变换中,通过信号与噪声分离,使信息更加集中于有限的特征集中,一些微弱信息则在去噪转化中被增强。同时在MNF转换过程中,使光谱特征向量集汇聚,增强分类信息。
图4-4-2是一些矿物光谱通过MNF变换前后的曲线剖面图,从右图可见信息与噪声分别有序地集中在一些有限的波段内。通过舍弃噪声波段或其他处理,相应地降低或消除噪声的影响。同时信息也比原始数据更易区分。
4.4.2.3 矿物识别
矿物识别主要选用光谱相似性测度的方法。基于整个谱形特征的相似性概率的大小,能有效地避免因岩石矿物光谱漂移或光谱变异而造成的单个光谱特征的不匹配,并能综合利用弱的光谱信息。
图4-4-2 矿物光谱MNF变换前后特征比较
基于整个光谱形特征的识别方法主要有光谱角技术、光谱匹配滤波、光谱拟合与线形分解等。利用大气校正后的重建光谱数据,可选择性地利用上述矿物识别技术开展端元矿物的识别。光谱角方法可直接选择端元矿物进行匹配,最终生成二值图像,简单易行,在阈值合理可靠的前提下能够获取较高的识别精度。
在成像光谱岩矿地质信息识别与提取方法中,光谱角技术是一种较好的方法之一(王志刚,1993;刘庆生,1999)。光谱角识别方法是在由光谱组成的多维光谱矢量空间,利用一个岩矿矢量的角度测度函数(θ)求解岩矿参考光谱端元矢量(r)与图像像元光谱矢量(t)的相似性测度,即:
成像光谱岩矿识别方法技术研究和影响因素分析
这里,‖*‖为光谱向量的模。参考端元光谱可来自实验室、野外测量或已知类别的图像像元光谱。θ介于0到π/2,其值愈小,二者相似度愈高,识别与提取的信息愈可靠。通过合理的阈值选择,获取矿化蚀变信息的二值图像。
4.4.2.4 阈值的选择与航带间信息的衔接
无论是光谱角技术还是光谱匹配以及混合光谱分解,都存在对非矿物信息的分割,因此阈值的选择是一个必须面临的重要问题。这不仅关系到所识别矿物的可靠度,也关系到矿物分布范围大小的界定。同时由于是分航带提取,不同航带间因大气校正的误差和噪声的影响而使同一地物的光谱特征存在差异,可能使所提取的矿物空间展布特征在航带之间所有诊断和一致性,增加了制图的困难。因此对于阈值的选择,需遵循以下原则:在去除明显假象信息、保留可靠的矿化蚀变信息情况下考虑整体的一致性以及航带的过渡性。
4.4.2.5 技术流程
结合成像光谱数据预处理,根据实际应用情况,可以总结出成像光谱遥感地质调查工作的技术流程,如图443所示。
Ⅱ 对吐哈盆地相邻两幅遥感图像的辐射匹配
在以研究吐哈盆地地浸砂岩型铀矿成矿规律为前提的遥感图像处理过程中,为了获得更大范围的地面影像,通常需要将多幅图像拼接成一幅影像图以达到整体呈现研究区的目的。这就涉及遥感图像的数字镶嵌操作问题。但由于时间的差异,太阳光强及大气状态的变化,或者遥感器本身的不稳定,致使获取的不同图像上的对比度及亮度值会有差异,因而有必要对图像之间进行辐射匹配。这样不仅可均衡化镶嵌后输出图像的亮度值和对比度,提高视觉效果;而且有助于对研究区域中的指数进行一致性评价,对整个区域砂岩型铀矿的成矿分析具有重要意义。
本次研究选取了位于盆地内的相邻两幅同为1~7个波段的ETM139-30和ETM140-30遥感图像为例。经过各自必要的大气矫正之后,在ERDAS IMAGINE8.4 的支持下,先对两幅图像运用常见的辐射匹配方法进行匹配处理。同时为了降低匹配时存在的人为误差,又提出了一种新的辐射匹配方法——多样本均值法。最后,通过对各方法匹配结果的比较,要选取出一种最为适当的方法以用于对整个盆地的辐射匹配处理,从而为后期吐哈盆地的深入研究做好基础。
一、常见的辐射匹配方法及比较
相邻遥感图像间辐射匹配的方法一般都是以图像的重叠区域为基础,通过各种平滑过渡来消除辐射上的差异。目前常见的有:基于相邻图像直方图、基于相邻图像方差、均值等的辐射匹配方法。
(一)直方图匹配法
遥感数字图像是由一系列依次排列的像元组成的一个数字矩阵,对于一幅图像可以计算其像元灰度等级的分布状态。数字图像的灰度编码是从0,1,……,2N-1,每一个灰度等级都可统计出整幅图像中出现的该灰度值的像元个数mi,如果整幅图的像元总数为M,则某一灰度值的概率为Pi=mi/M,将2N个P值绘制出的统计图称为图像的直方图,这种直方图随图像的改变而改变。众所周知,图像的直方图反映图像的统计特性,它表达了图像中取不同灰度值或像素数在整幅图像中所占的比例,通过直方图我们可以求出一幅图像中所含的信息量。而所谓图像的直方图匹配法就正是利用影像的灰度直方图能客观地反映出一幅影像的灰度分布,相邻影像的重叠区域的灰度直方图在理想条件下应是一致的特点,通过转换一幅图像的直方图,使其和另一幅图像的形状相似,进而使图像间的辐射差异缩小,最终达到辐射匹配的目的。
图2-9-7 吐哈盆地两幅ETM 遥感图像(ETM741)
其中,利用重叠区对应像元各波段直方图的均值差来进行相邻图像的辐射匹配,可视为一种简便的直方图匹配方法:首先将两幅图像重叠区对应各波段的均值相减,得到波段的均值差;再将其中的一幅图像作为参照图,另一幅图则以参照图的均值大小为基准,每个波段相应的加减均值差,使被调整图像的均值与参照图的相一致,从而实现两幅图像间的辐射匹配。下面是所选取的相邻两幅分别经过大气校正的吐哈盆地ETM遥感图像,目视其辐射差异较大(图2-9-7):左边的是图像色调较为鲜艳明亮的ETM140-30,右边的是色调较为灰暗低沉的ETM139-30。此时以左图作为参照图,运用直方图加减均值差的匹配方法调整图像间明显存在的辐射差异,得到匹配后色调变得较为一致的图像(图2-9-8)。
图2-9-8 利用直方图匹配法匹配后的遥感图像(ETM741)
另外,还有一种直方图匹配方法是:在图像重叠区域的两个直方图上分别选取出几个对应的频率像元所表示的灰度值并且读出灰度值对应的点;然后利用分段拉伸功能,把一图像上选出的灰度值对应点拉伸到与相应的参照图像一致后,中间的灰度值按比例内插。经过这样处理两幅图像上的辐射就基本一致了。但此法有一定的局限性:当相邻图像辐射差异不太大时,即重叠区域的直方图形状相近时,直接采用其进行调整,有计算量小、效果较好的优点;但当两幅图像间的辐射差异较大时(图2-9-7),就不宜采用。图像间的辐射差异一旦变大,重叠区的相同地物灰度值和其直方图整体趋势的变化也就相应提高,这时要想准确选取同一地物对应的灰度值点对,进行分段拉伸就变得困难。所以在对两幅吐哈盆地的遥感图像进行辐射匹配处理时,没有选用这种方法。
比较以上两种直方图匹配方法,它们各具优缺点:①就操作处理而言,前者要比后者显得简便容易。因为它仅仅是利用均值差的加减来达到匹配的目的;而后者不仅要选取对应的灰度值点对,还要进行分段拉伸及内插,操作起来繁琐些。②就运用效果而言,当图像的辐射差异不太大时,选用后者进行比较细腻的对比性调整,其匹配效果——特别是在一些细节的匹配上,要比前者来得理想。鉴于均值是描述各波段中心趋势的值,所以当辐射差异较大时,利用它实现图像整体辐射的大幅度调整,不仅可避免在选取灰度值点对不当时造成的误差,又可减少计算量,加快处理速度。
(二)方差均值法
方差均值法也是一种常见的图像辐射匹配方法:设要进行匹配的相邻两幅图像为f(x,y)和g(x,y),x和y是图像上每个像元的行列坐标,希望把f(x,y)图像的辐射调整到与g(x,y)图像一致。又设a(x,y)是f(x,y)图像相对于g(x,y)图像的增益变化,β(x,y)是f(x,y)图像相对于g(x,y)图像的零线漂移量。为了使问题简化,假设卫星成像系统在同一幅图像成像时a(x,y)和β(x,y)变化很小,即图像中的a和β都是一个常数。于是预使f(x,y)图像的辐射调整到与g(x,y)图像一致,就可归结为求a和β。也就是使泛函数:
I=∬[af(x,y)+β-g(x,y)]2dxdy (2-9-1)
为最小,根据最小二乘法求极值的原理,也就是使:
中国西部中亚型造山带中新生代陆内造山过程与砂岩型铀矿成矿作用
中国西部中亚型造山带中新生代陆内造山过程与砂岩型铀矿成矿作用
整理得到:
β=Mg-aMf (2-9-4)
式中
中国西部中亚型造山带中新生代陆内造山过程与砂岩型铀矿成矿作用
S是图像面积。
由均值的定义可知,Mg和Mf正好是图像灰度的均值。再将(2-9-4)代入(2-9-3)式,整理后得:
中国西部中亚型造山带中新生代陆内造山过程与砂岩型铀矿成矿作用
式中:
a值求出后,把它代入(2-9-4)式即可求出β值:
中国西部中亚型造山带中新生代陆内造山过程与砂岩型铀矿成矿作用
a和β的值确定后,就意味着被调整的f(x,y)图像与相邻g(x,y)图像的辐射较为一致了,或者说相邻两幅图像的辐射差异达到了最小。
观察方差均值法的原理,我们不难发现它与加减均值差的直方图匹配方法非常相似,即都利用到了图像各波段的中心趋势值——均值(Mg,Mf)进行匹配处理;不同之处则在于它还考虑到了图像的方差(
由于带入了一个系数——
(三)几点结论
经过对上述不同辐射匹配方法的原理认识及运用,在此得出了几点在处理过程中需遵循的结论,以便达到较好的匹配效果:
图2-9-9 利用方差均值法匹配后的遥感图像(ETM741)
1)匹配前都首先要在相邻图像上选择一个共同的区域——重叠区,然后利用该区域内同名地物的灰度值来建立辐射匹配方程。为了使方程更具代表性和普遍性且适用于整幅待匹配的图像,要尽可能大地选择重叠区。所以说区域选择的大小是非常重要的一点,它会影响最后的匹配结果。
2)选择有代表性的区域用于辐射匹配也是很重要的。在遥感图像上有时会有云或各种噪声,在选择匹配区域时要尽量避开这些区域,否则会对匹配方程产生影响,从而降低辐射匹配的精度。要想选择有代表性的区域、建立准确的辐射匹配方程,应认真仔细地分析对比相邻两图像公共区域的图像质量和特点,然后采用不规则的多边形(而不是简单的矩形)来界定用于建立匹配方程的图像区域。这样既可避开云、噪声,又可获得尽可能大的、有代表性的图像匹配区域。
3)对图像辐射匹配时,首先必须要以一幅图像为基准,将其视为参照图像;然后运用上述方法建立匹配方程,对另一幅图像的整个区域进行辐射变换。文章在以图2-9-7为例,不论使用以上哪种方法对其进行辐射的匹配处理时,均遵循着上述要求(图2-9-10):使用多边形来灵活地确定要截取的重叠区域边界,并尽可能大的选取重叠区域;选取时尽量避开图像上云的噪声干扰;匹配前也确定了参照和待匹配的图像。同时,为了比较不同方法的匹配效果,处理时截取的重叠区和确定的参照图都是固定的。
二、多样本均值辐射匹配方法
以上所提到的辐射匹配方法都是在以截取一个重叠区样本的前提下进行的。由于在选取样本时存在所不可避免的人为因素(例如重叠区的选取及其大小的不同),有时对单个样本的选取并不十分恰当,这就会造成因此得来的匹配方程存在着弊端,致使最后的匹配结果不理想。
为了降低选取样本时人为因素的影响和图像间截取区域的重叠率大小所造成的同一地物位置配准误差的影响,在此提出一种新的、较可行的辐射匹配方法——多样本均值法。这种方法以选取的多个重叠区样本作为匹配研究对象,通过对样本的回归分析,建立了图像间更具普遍代表性的回归匹配方程。
同样以图2-9-7为例,运用其进行辐射匹配的具体步骤如下:
图2-9-10 匹配示意图(ETM741)
(1)确定截取的最佳像元数
在以一个像元为误差的几何配准前提下,计算截取不同重叠区域时相邻图像间的像元重叠率(如表2-9-2所示),并选取适当的像元数,以期将由重叠率造成的位置配准误差降至最小。在此选用96%的像元数——44×44,按地物类别分类截取多个重叠区样本,这样做有助于各样本内部的辐射统一。
表2-9-2 像元重叠率计算
(2)利用回归分析,建立匹配方程,进行辐射匹配
回归一词最早是由英国遗传学家弗朗西斯·哥尔顿(F.Golton)在研究成人子女的身高与其父母平均身高的关系时所采用的词汇,现在则是一种借助于数学表达式(即回归方程)来分析研究变量间数量关系的方法。根据变量之间的相互关系来模拟的回归方程具有严密的数学逻辑,从而能准确地反映出变量之间的关系。基于以上特性,利用两幅图中截取的多个重叠区样本对应各波段的均值来做回归分析,分别建立了7个波段的均值匹配方程(表2-9-3),反映出图像间对应波段的相互关系。
表2-9-3 各波段匹配方程
按照匹配方程所反映出的图像间均值关系建立匹配模型,得到辐射匹配后的图像(图2-9-11)。
图2-9-11 利用多样本均值法匹配后的遥感图像(ETM741)
三、对三种辐射匹配方法的匹配结果进行定量性验证比较
图2-9-8(直方图匹配法)、图2-9-9(方差均值法)、图2-9-11(多样本均值法)依次为应用不同的辐射匹配方法所得到的三幅匹配效果图。单从匹配后的图像上观察,两图像间的色调变得较为统一,辐射差异确实是变小了,实现了图像间的辐射匹配。但究竟是哪一种方法的匹配效果最好,还要通过下面定量性的验证比较。
(一)相关性对比
表2-9-4清楚地显示出运用不同的匹配方法,匹配之后的图像与参照图之间对应波段的相关性。经比较,运用多样本均值的辐射匹配方法,其匹配结果表明图像间具有较高的相关性;运用方差均值法,匹配之后图像间的相关性则低于前者,但高于后者——直方图匹配法。
表2-9-4 两图像间对应各波段的相关系数
(二)匹配结果的统计特征对比
随机地在分别用三种匹配方法匹配好的两图像重叠区域内各选取20个相同的样本区,通过对各样本均值和标准差的观察来定量地比较不同方法的匹配结果(见文后附表)。
1.均值比较(Mean)
在随机所选取的20个样本区中:有17个样本区在应用多样本均值的辐射匹配方法时,7个波段的均值误差整体相比为最小;有16个样本区在应用方差均值的辐射匹配方法时,7个波段的均值误差整体相比是次之较小的;而有16个样本区在应用直方图匹配方法时,7个波段的均值误差整体相比是三种方法中最大的。
2.标准差比较(Std Dev.)
同样参照附表,我们对三种匹配结果的标准差误差进行比较:在随机所选取的20个样本区中,有19个样本区在应用多样本均值的辐射匹配方法时,7个波段的标准差误差整体相比为最小;有20个(即全体)样本区在应用方差均值的辐射匹配方法时,7个波段的标准差误差整体相比是次之较小的;而在应用直方图匹配方法时,有20个(即全体)样本区的标准差误差整体相比是三种方法中最大的。
表2-9-5 误差对比表
由此可见(如表2-9-5所示),无论是在均值上,还是在标准差上,应用多样本均值的辐射匹配方法,能极大地缩小与参照图间的均值匹配误差和标准差匹配误差,使已匹配图与参照图的统计特征变得最为接近,从而获得比运用其他两种方法更为理想的辐射匹配结果;应用方差均值的辐射匹配方法,其匹配结果与参照图的统计特征接近程度就较为次之;而应用直方图匹配方法,其匹配结果与参照图间的统计特征误差是三种方法中最大的。
表2-9-5说明了在尽量缩小匹配图像间统计特征误差方面,多样本均值法占有很大的优势,它可使图像在大体上(约90%)的统计特征变得与参照图最为接近;而在相同大体上(约90%),方差均值法使图像间的统计特征变得较为接近,直方图匹配法使图像间的统计特征接近程度则不及前两种方法。
通过对三种匹配结果的定量性验证比较得出:多样本均值的辐射匹配是继直方图匹配和方差均值法之后的另一种可行的、极具优势的辐射匹配方法。用它来进行图像间的匹配处理,经证明能达到颇为理想的匹配效果。另外,当图像间重叠区的噪声较多时,匹配时采用选取多个小范围样本的方式——多样本,能更为灵活的避开噪声的干扰,建立出适当的匹配方程。
四、结束语
利用遥感技术进行地质分析与成矿找矿勘探是目前一种方便、高效的技术方法,值得选用,但之前要对图像间实行辐射匹配,这是必不可少的一步。
在对吐哈盆地遥感图像的研究处理过程中,经验证比较,我们选用多样本均值的辐射匹配方法,可获得更加理想的匹配结果。这为后期盆地内地浸砂岩型铀矿成矿规律的准确分析评估提供了坚实的基础。
参考文献
吴伯林,徐高中,李卫红,龚斌利,张复新.2004.吐哈盆地地浸砂岩型铀矿成矿条件与盆地动力学演化.地质论评,14(3):9~18
邵磊,杜裴,Kstattegger.2001.从砂岩成分探讨吐哈盆地构造演化.地质论评,17(1):19~26
章孝灿等.1997.遥感数字图像处理.杭州:浙江大学出版社,91~95
汤国安,张友顺,刘咏梅等.2004.遥感数字图像处理.北京:科学出版社,125~126
赵英时等.2004.遥感应用分析原理与方法.北京:科学出版社,181~182
戴昌达,姜小光,唐伶俐.2004.遥感图像应用处理与分析.北京:清华大学出版社,139~140
朱祯玺,赵振伦.1991.回归分析和相关分析.大连:东北财经大学出版社,78~79
(刘蓉蓉,黄美化,李社,林子瑜,管太阳)