通过成像技术获得的高光谱数据是一个三维数据立方体,根据高光谱图像的特点,通过图像空间表示方式、光谱空间表示方式和特征空间表示方式表示高光谱数据。在实际应用中,我们根据不同的数据处理要求,选用相应数据的表示方式。
高光谱图像数据三种描述模型
(1)图像模型表达方式:针对某一光谱波段,描述高光谱数据中的每个像元在图像中的位置及它与邻近像元之间的相互关系。该表达方式符合人类视觉特征,能够形象的表述地物分布情况,为高光谱数据分析提供像元空间信息。
(2)光谱模型表达方式:高光谱遥感图像中的每个像元包含多通道的连续光谱辐射信息,描述类别光谱响应与波长之间的对应关系。
(3)特征模型表达方式:在一个多维空间中,将高光谱数据中的像元表示为与之空间坐标相对应的点的集合,高光谱数据中每个像元由一个N维向量表示,能够有效地体现地物类别之间的可分性。因此,在高光谱图像分类中数据多采用特征空间描述方式。高光谱遥感图像具有的大量光谱波段,为地物信息提取提供了丰富的信息,有助于地物更加精细的分类和目标识别。但是高光谱图像波段较多,相邻波段之间存在着重叠具有一定的相关性,这就使得高光谱数据在一定程度上存在冗余现象,提高数据处理的复杂性。具体表现在:
(1)相对庞大的数据:高光谱图像包含上百个波段,使得数据在储存,处理过程中的复杂性增加;
(2)数据计算量增加,为降低计算机的计算复杂度需要对数据进行预处理;
(3)样本个数有限。而光谱波段数量相对来说较少,因此得到地物参数统计误差相对较大,以分类问为例,高精度的分类结果往往建立在大量的样本统计规律之上[l]。
因此,对高维度数据进行特征信息提取之前,需要对数据进行降维处理,用较少的综合变量来代替原来较多的变量,同时综合变量要尽可能多的反映原来多变量包含的信息。高光谱数据降维是以简化数据量、优化图像特征为目的,获得的新的特征信息,利用低维数据来有效地表达高维数据的信息,使其能更好地反应对象本质,适合分类器的处理。
目前高光谱数据波段降维主要有两种途径:一是从许多波段中挑选感兴趣的若干波段,即波段选择;二是利用所有波段,通过数学变换来压缩数据,常用的如主成分分析法(PCA)等。波段选择和特征提取主要基于光谱特征、空间特征或者两者结合的光谱空间特征,既可以对特定地物或像元进行光谱维特征挖掘,又可以从图像空间维和光谱维进行综合挖掘。