Гиперспектральное и мультиспектральное моделирование урожайности сельскохозяйственных культур и классификациятипов для миссии HyspIRI

Isabella Mariotto a,b,⁎, Prasad S. Thenkabail b, Alfredo Huete c, E. Terrence Slonecker d, Alexander Platonov e
a Soil, Water & Environmental Science Department, The University of Arizona, USA
b U.S. Geological Survey, Flagstaff Science Center, Flagstaff, AZ 86001, USA
c Plant Functional Biology and Climate Change, University of Technology Sydney, Australia
d U.S. Geological Survey, Eastern Geographic Science Center, Reston, VA, USA
e International Water Management Institute (IWMI), Tashkent Office, Uzbekistan
Аннотация

Точный мониторинг биомассы и урожайности сельскохозяйственных культур имеет решающее значение для управления растениеводством и его прогнозирования. Целью данного исследования было сравнение данных гиперспектрального узкополосного (HNB) и мультиспектрального широкополосного (MBB) отражения при изучении характеристик орошаемых пахотных земель, выращиваемых под пятью ведущими мировыми культурами (хлопок, пшеница, кукуруза, рис и люцерна) с целью: 1. Моделирования продуктивности сельскохозяйственных культур и 2. Выделения типов сельскохозяйственных культур. Данные HNB были получены с помощью гиперспектрального сканера Hyperion и полевого спектрорадиометра ASD,а данные MBB были получены с помощью пяти широкополосных сенсоров: Landsat-7 Enhanced ThematicMapper Plus (ETM+), AdvancedLand Imager (ALI), Indian Remote Sensing (IRS), IKONOS и QuickBird. Большой набор полевых спектральных и биофизических переменных был собран для 5 сельскохозяйственных культур в Центральной Азии в течение вегетационных сезонов 2006 и 2007 годов. В целом, биофизические модели сельскохозяйственных культур на основе HNB и гиперспектрального вегетационного индекса (HVI) объяснили примерно на 25% большую изменчивость по сравнению с соответствующими моделями MBB. Как правило, от 3 до 7 HNB в моделях множественной линейной регрессии для данной переменной сельскохозяйственной культуры объясняли более 93% изменчивости в моделях сельскохозяйственных культур. Оценка графиков зависимости λ1 (400–2500 нм) от λ2 (400–2500 нм) различных биофизическихпеременных сельскохозяйственных культур показала, что наилучшие двухполосные нормализованные разностные HVI включали HNB с центрами на: (i) 742 нм и 1175 нм (HVI742–1175), (ii) 1296 нм и 1054 нм (HVI1296–1054), (iii) 1225 нм и 697 нм (HVI1225–697) и (iv) 702 нм и 1104 нм (HVI702–1104). Среди наиболее часто встречающихся HNB в различных биофизических моделях сельскохозяйственных культур 74% располагались в спектральном диапазоне 1051–2331 нм, за ним следовали 10% в чувствительном к влаге диапазоне 970 нм, 6% – в красном и красно-краевом (630–752 нм), а оставшиеся 10% распределялись между синим (400–500 нм), зеленым (501–600 нм) и ближним инфракрасным (760–900 нм) спектрами.

Дискриминантные модели, используемые для различения 3, 4 или 5 типов сельскохозяйственных культур, показали значительно более высокую точность при использовании HNB (N90%) по сравнению с данными MBB (от 45 до 84%).
Наконец, исследование выявило 29 HNB Hyperion, которые оптимальны для изучения сельскохозяйственных культур и потенциально важны для предстоящей миссии NASA HyspIRI. Определение оптимальных и избыточных диапазонов для данного приложения поможет преодолеть феномен Хьюза (или проклятие высокой размерности данных).

1. Введение

Точная количественная оценка сельскохозяйственных биофизических параметров критически важна для эффективного и устойчивого управления сельскохозяйственными угодьями. Точный мониторинг биофизических величин, в частности биомассы (кг/м²) и урожайности зерна (т/га), позволяет фермерам оптимизировать продуктивность сельскохозяйственных культур (продуктивность на единицу площади; кг/м²) и применять наилучшие методы ведения сельского хозяйства. В настоящее время широко признано, что данные, методы и подходы дистанционного зондирования предоставляют наилучшие возможности для характеристики сельскохозяйственных угодий большой площади, а также информацию, необходимую для точного управления сельским хозяйством, путем точного картирования и выявления таких факторов, как более высокие и более низкие уровни биомассы и урожайности внутри сельскохозяйственных полей и между ними (Alchanatis & Cohen, 2011; Moran, Inoue, & Barnes, 1997; Thenkabail, 2003).

Тем не менее, традиционные данные мультиспектральных широкополосных датчиков имеют известные ограничения насыщения сенсора (Thenkabail, Enclona, ​​Ashton, Legg, & De Dieu, 2004; Thenkabail, Enclona, ​​Ashton, & VanDer Meer, 2004; Thenkabail, Smith, & De-Pauw, 2000) и отсутствие специфических узких полос для выделения и выделения определенных биофизических и биохимических параметров (Gitelson, 2011; Gitelson, Gritz, & Merzlyak, 2003). Эти факторы приводят к значительной неопределенности в спектрально-биофизическом и/или биохимическом моделировании сельскохозяйственных культур. Необходимость использования специфических узких полос для изучения спектральных свойств растительности очевидна, учитывая, что молекулярный состав растительного материала отражает, поглощает и излучает электромагнитную энергию на определенных длинах волн и с определенными закономерностями. Получение точной спектральной информации о растительности, основанной на различных сочетаниях типов и количеств растительных пигментов (например, хлорофилла a и b, каротиноидов и антоцианов), оводненности листьев, живой и стареющей биомассы, распределении листьев, плотности растений, а также биофизических величин, таких как биомасса, индекс листовой поверхности (ИПЛ), высота растений и урожайность зерна, требует высокого спектрального разрешения (Asner, 1998; Govender, Dye, Weiersbye, Witkowski, & Ahmed, 2009; Hill, 2004).

Действительно, было показано, как гиперспектральные данные могут обеспечить значительное улучшение спектральной информативности по сравнению с широкополосными данными в: (a) моделировании биофизических и урожайных характеристик сельскохозяйственных культур (Thenkabail et al., 2000; Thenkabail, Smith, & De-Pauw, 2002), (b) измерении содержания хлорофилла в растениях (Blackburn & Ferwerda, 2008), (c) измерении тонких изменений в концентрации пигментов в листьях (Blackburn & Ferwerda, 2008), (d) извлечении биохимических переменных, таких как азот и лигнин (Houborg & Boegh, 2008), (e) обнаружении изменений влажности растений (Colombo, Busetto, Meroni, Rossini, & Panigada, 2011), (f) оценке абсолютного содержания воды
в листьях растений (Jollineau & Howarth, 2008), (g) выявление небольших различий в проценте зеленой растительности (Chen, Wang, & Wang, 2008), (h) выявление стресса растений (Thenkabail, Enclona, ​​Ashton и Van Der Meer, 2004) и (i) различение типов почвенно-растительного покрова (Thenkabail, Enclona, ​​Ashton, Legg, etal., 2004). Эти исследования достигли значительных прогрессов в понимании, моделировании и картографировании различных биофизических и биохимических показателей сельскохозяйственных культур.
Тем не менее, пробел в знаниях в полном использовании гиперспектральных узкополосных данных для исследований сельскохозяйственных угодий все еще весьма значительный.

• Во-первых, для построения надежных глобальных моделей различных биофизических и биохимических параметров по-прежнему необходимы обширные гиперспектральные исследования спектральных характеристик сельскохозяйственных культур, которые используют данные за разные даты, разные сезоны, разные культуры и разные участки по всему миру.
• Во-вторых, в связи с существующей неопределенностью, требующей более обширных наборов данных из различных агроэкосистем по всему миру, гиперспектральные узкие полосы (HNB) и гиперспектральные индексы растительности (HVI) все еще изучаются для наилучшего моделирования изменчивости различных сельскохозяйственных площадей пахотных земель (Thenkabail, Lyon, & Huete, 2011).

• В-третьих, на различных семинарах и симпозиумах Национального управления по аэронавтике и исследованию космического пространства (НАСА) по гиперспектральным инфракрасным изображениям (HyspIRI) широко признано, что сравнительные исследования гиперспектральных и многоспектральных спутниковых данных необходимы для различных приложений, особенно в исследованиях, связанных с характеристикой растительности, с целью углубления нашего понимания, моделирования и картирования состояния и типов растительности Земли с использованием данных в узких и смежных диапазонах волн шириной 10 нм, например, от 380 до 2500 нм (длина волны HyspIRI от ультрафиолетового до коротковолнового инфракрасного диапазона).
• В-четвертых, вычислительная обработка гиперспектральных данных по-прежнему представляет собой сложную задачу из-за огромного объема данных, представленных для каждого пикселя (сотни каналов) (Varshney & Arora, 2004), и более глубокое понимание оптимальных диапазонов волн необходимо для снижения высокой размерности данных (Thenkabail et al., 2011); кроме того, количество избыточных каналов часто превышает количество полезных каналов, что неизменно приводит к феномену Хьюза (Thenkabail et al., 2011) и к большим объемам зашумленных данных.

• В-пятых, недавние исследования показали, что оптимальная информация, необходимая для количественной оценки биофизических характеристик сельскохозяйственных культур, представлена в нескольких конкретных узких диапазонах (Chan & Paelinckx, 2008; Thenkabail, Enclona, ​​Ashton, & VanDerMeer, 2004), и что данные Hyperion, расположенные в определенных участках спектра, могут значительно улучшить возможности дискриминации и точность классификации для различных сельскохозяйственных культур по сравнению с широкополосными, такими как Landsat Thematic Mapper (TM) и Système Pour l'Observation de la Terre (SPOT) High Resolution Visible (HRV) (Lee, Cohen, Kennedy, Maiersperger, & Gower, 2004; Thenkabail, Enclona, ​​Ashton, Legg, et al., 2004)
Необходимы многочисленные исследования по всему миру для точного определения оптимальных диапазонов волн и эффективного понимания возможностей этих оптимальных HNB и HVI в характеристике сельскохозяйственных культур.

Это позволит разработать эффективные временные рамки стратегии вычислительной обработки для пользователей гиперспектральных данных в области продуктивности сельскохозяйственных культур и картирования их типов.
• В-шестых, более обширные наборы данных со всего мира помогут создать спектральные библиотеки сельскохозяйственных культур, которые все еще находятся в зачаточном состоянии.

Однако в гиперспектральных данных количество чистых спектральных сигнатур (конечных элементов) обычно превышает реальное число, присутствующее в пикселе, в то время как в мультиспектральных данных обнаруживаемое количество конечных элементов, как правило, ниже реального числа (Schaepman et al., 2009). Это приводит к дискуссиям об использовании двух технологий и указывает на необходимость дальнейших сравнительных исследований.

Учитывая вышеизложенное, цель данного исследования — сравнить данные Hyperion и узкополосного (400–2500 нм) полевого спектрорадиометра с данными Enhanced Thematic Mapper (ETM+), Advanced Land Imager (ALI), индийских спутников дистанционного зондирования (IRS), IKONOS и широкополосных данных QuickBird для изучения орошаемого земледелия 5 ведущих мировых культур: пшеницы, хлопка, кукурузы, риса и люцерны. Конкретные цели были следующими: 1. моделирование урожайности сельскохозяйственных культур и 2. различение типов сельскохозяйственных культур. Результаты данного исследования помогут установить оптимальные HNB и HVI, которые наилучшим образом подходят для моделирования биофизических переменных и типов сельскохозяйственных культур. Исследование основано на обширном наборе полевых биологических данных in-situ, собранных в течение вегетационных сезонов 2006 и 2007 годов на обширных интенсивно орошаемых территориях засушливого бассейна реки Сырдарья в Центральной Азии, где недавние исследования показывают, что запасы талой воды из Гималаев стремительно сокращаются.

2. Методы

2.1. Район исследования

Исследование проводилось на орошаемых пахотных землях бассейна реки Сырдарья (БРС) в Узбекистане, Центральная Азия. БРС занимает площадь 444 000 км², включая части Узбекистана, Кыргызстана, Таджикистана и Казахстана (рис. 1). Он получает сток талых вод с Гималаев, который в последние годы стремительно сокращается в результате изменения климата (Гиркен, Батиха, Селис и ДеПау, 2005). Годовой водоотвод из БРС практически равен общему годовому притоку, что имеет серьезные экологические последствия для Аральского моря. Климат умеренно континентальный и субконтинентальный со средней температурой 28–32 °C в июле и 0–4 °C в январе, и небольшим количеством осадков – 100–200 мм/год, выпадающих в основном с ноября по март. Данные были собраны в сельскохозяйственных районах Галаба и Кувина в Узбекистане, одном из крупнейших мировых производителей хлопка. Также выращиваются кукуруза, пшеница, рис и люцерна — все основные мировые культуры. Эти пять культур занимают около 50% всех пахотных земель мира (Thenkabail et al., 2012). Рельеф местности относительно ровный, с высотой над уровнем моря от 277 до 284 м в хозяйстве Галаба и от 464 до 470 м в хозяйстве Кувина.

2.2. Характеристики гиперспектральных и мультиспектральных данных

Были проанализированы гиперспектральные изображения Hyperion, полученные на борту спутника Earth Observing-1 (EO-1), мультиспектральные изображения Landsat-7 Enhanced Thematic Mapper Plus (ETM+), Advanced Land Imager (ALI) и RESEOURCESAT-1 (Indian Remote Sensing IRS-P6), а также мультиспектральные гиперпространственные снимки со спутников QuickBird и IKONOS. Количество снимков и характеристики этих изображений представлены в Таблице 1. Несколько тысяч гиперспектральных данных спектрорадиометра ASD были последовательно собраны для каждой точки наземной съемки (на высоте 1,2 м в поле зрения надира 18°) — с пространственным разрешением 0,1134 м и спектральным разрешением 1 нм в диапазоне от 400 до 2500 нм. Измерения проводились для пяти культур – пшеницы, хлопка, кукурузы, риса и люцерны – в течение 59 разных дней (41 день в 2006 году и 18 дней в 2007 году) в течение вегетационных сезонов 2006 и 2007 годов.
Рис. 1. Район исследования: поля фермерских хозяйств Галаба и Кува в бассейне реки Сырдарья, Центральная Азия. Виды сельскохозяйственных культур показаны для Галаба.
2.2.1. Обработка изображений

Для прямого сравнения сенсоров Hyperion, ETM+, ALI, IRS, IKONOS и QuickBird с различным радиометрическим разрешением их соответствующие цифровые номера (DN) были преобразованы в абсолютные единицы яркости , затем в отражательную способность спутника (%) (Thenkabail, Enclona, ​​Ashton, Legg и др., 2004; Thenkabail, Enclona, Ashton, & VanDerMeer, 2004; Thenkabaile и др., 2002, 2011) и, наконец, в отражательную способность поверхности (%) после атмосферной коррекции. Атмосферная коррекция была выполнена с использованием инструмента быстрого анализа спектральных гиперкубов (FLAASH) в ENVI4.8 (ExelisVisualInformation Solutions), который включает в себя код переноса излучения MODTRAN4 (Berk et al., 1999). Все изображения были георектифицированы и перепроецированы в общую систему координат UTM и датум WGS84.

Изображение Hyperion состоит из 242 смежных спектральных каналов, из которых только 198 радиометрически калиброваны (Beckmann & Mckinney, 2006). Из этих 198 диапазонов для данного исследования были выбраны следующие 158 диапазонов без каких-либо шумов и эффектов атмосферного окна: диапазоны 8–57 (426,82–925,41 нм), 79–119 (932,64–1336,15 нм), 133–164 (1477,43–1790,19 нм), 183 и 184 (1981,86–1991,96 нм) и 188–220 (2032,35–2355,21 нм) (Thenkabail, Enclona, ​​Ashton, Legg и др., 2004; Thenkabail, Enclona, Ashton и VanDer Meer, 2004). Длины волн спектрорадиометра (1 нм) усреднялись на расстоянии 10 нм от центра полос 158 выбранных полос Hyperion (ширина 10 нм). Пример данных спектрорадиометра по отражательной способности хлопка представлен на рис. 2. Значения отражательной способности пикселей, пересекающих точки данных на поверхности Земли, были извлечены из каждого спутникового снимка для каждой полосы с использованием ГИС.

2.3. Наземные данные

Данные с полевых участков собирались для пяти культур (пшеница, хлопок, кукуруза, рис и люцерна) в течение летних вегетационных сезонов (апрель–октябрь) 2006 и 2007 годов каждые 15–20 дней, совпадающих с датами измерений полевым спектрорадиометром, и совпадающих – или максимально с разницей в 1 день – с датами пролёта спутника. Измерения проводились в 1232 случайно выбранных точках, разбросанных по фермерским участкам (кукуруза n = 125; пшеница n = 220; рис n = 37; люцерна n = 57; и хлопок n = 778) (рис. 1). В каждой точке регистрировались GPS-координаты и тип культуры, а также сырая и сухая биомасса (кг/м²) и/или урожайность (кг/м² или т/га). Биомасса и урожайность измерялись путем срезания и взвешивания образцов (для урожайности хлопка измерялся ворс) в течение всего сезона исследования. Покрытие полога, почвы и сорняков оценивалось визуально (%).

2.4. Моделирование продуктивности сельскохозяйственных культур с использованием гиперспектральных и мультиспектральных данных

Модели продуктивности сельскохозяйственных культур, включая биомассу и урожайность, обычно рассчитываются либо с использованием физического подхода, либо с использованием статистической регрессии (Thenkabail et al., 2011). Однако в настоящее время не существует единого наилучшего подхода к определению оптимального количества каналов (Chen et al., 2008; Jollineau & Howarth, 2008). Поэтому в данном исследовании используются модели со строгими критериями поиска или анализа данных для определения оптимальных гиперспектральных узкополосных данных, включающих сотни каналов и тысячи индексов растительности (Thenkabail, Enclona, ​​Ashton, Legg et al., 2004; Thenkabail, Enclona, ​​Ashton, & VanDerMeer, 2004; Thenkabail et al., 2000, 2002, 2011). В данном исследовании были выбраны два различных статистических подхода к моделированию биофизических моделей сельскохозяйственных культур с использованием HNBs, а также мультиспектральных широкополосных данных (MBB): (a) пошаговые модели множественной линейной регрессии (SMRM) (Hocking, 1976); и (b) корреляционный анализ (Glahn, 1968) между величинами урожая биомассы и двухполосными индексами растительности (при использовании гиперспектральных данных они будут обозначаться как HVI из-за огромного количества индексов, которые используются, см. раздел 2.4.2 для получения подробной информации; при использовании многоспектральных данных они будут обозначаться как TBVI).

Таблица 1 Характеристики использования гиперспектральных узкополосных и мультиспектральных широкополосных данных в данном исследовании.
2.4.1. Модели пошаговой множественной линейной регрессии

Процедура пошагового максимального улучшения (MAXR) в SAS 9.3 (SAS Institute Inc., 2011) использовалась для расчета моделей пошаговой множественной линейной регрессии (SMRM). Процедура MAXR итеративно определяет комбинацию диапазонов, которые дают наилучшую однополосную модель, двухполосную модель, трёхполосную модель… и вскоре наилучшую n-полосную модель биомассы и урожайности сельскохозяйственных культур для каждого типа сельскохозяйственных культур. Эта процедура позволяет получить наилучшие оценки параметров множественной линейной регрессии (максимальные значения R2), рассматривая инкрементальную объясняющую силу каждой переменной в наборе данных регрессии с помощью уравнения в следующем виде:
где i = переменная обрезки, a = коэффициент отражения в диапазоне длин волн j (j = 1ton) для переменной i, и R = коэффициент отражения в диапазоне длин волн j. Эта процедура была применена к данным отражения как HNB (n = 158), так и MBB (n = 4–9) в зависимости от типа датчика — см. Таблицу 1.

2.4.2.Двухполосные индексы растительности

Линейный и нелинейный (логарифмический и экспоненциальный) корреляционный анализ между величинами урожая биомассы и двухполосными индексами растительности Индексы (HVI и TBVI, уравнение (2)) узкополосных и широкополосных данных отражения рассчитывались для каждого типа сельскохозяйственных культур с использованием процедуры корреляции (CORR) в SAS, учитывая все возможные двухполосные комбинации входных диапазонов:
где i = диапазон i, j = диапазон j, а R = коэффициент отражения (%) диапазонов волн. Для Hyperion и спектрорадиометра была получена матрица размером 158 × 158 =24 964 HNB. Учитывая, что индексы над и под диагональю матрицы транспонированы друг к другу, было использовано только 12 403 уникальных индекса [(24 964–158)/2]. Из такого большого количества HVI были выявлены избыточные индексы и связанные с ними диапазоны волн, а также наиболее ценные индексы и их конкретное применение.

Также были рассчитаны широкополосные индексы растительности (TBVI; Rouse et al., 1973) для ALI, ETM+, IRS, IKONOS и QuickBird. Для 7 каналов Landsat ETM+ было всего 21 (7 × 7 = 49 − 7 = 42/2 = 21) уникальный TBVI. Результаты корреляции между значениями R2, связанными с HVI и TBVI, с биофизическими переменными (например, биомассой, урожайностью) были представлены на контурных диаграммах лямбда (λ1, или диапазоны длин волн от 1 до 158) и лямбда (λ2, или диапазоны длин волн от 2 до 158). Коэффициенты, имеющие p-значение <0,05 (уровень достоверности 95%), были оценены и представлены
Рис.2.Сезонные спектры растительности (май-сентябрь), измеренные с помощью полевого спектрорадиометра ASD для хлопкового поля, и несколько фотографий, показывающих их предполагаемый рост
2.5. Различение типов сельскохозяйственных культур и определение оптимального диапазона с использованием узкополосных и широкополосных данных

Доступность данных в дискретных узкополосных диапазонах посредством гиперспектральных данных предоставляет множество возможностей для изучения характеристик сельскохозяйственных культур и изучения потенциала более точного разделения и классификации типов сельскохозяйственных культур по сравнению с ограниченными возможностями, предоставляемыми широкополосными данными.
Методы, используемые для различения типов сельскохозяйственных культур, обсуждаются ниже.

2.5.1. Метод наименьших квадратов для различения типов культур

Метод наименьших квадратов (Bretscher, 1995) анализировался для оценки различий в отражательной способности полос между тремя, четырьмя и пятью типами культур (пшеница, хлопок, кукуруза, рис и люцерна) по месяцам с использованием гиперспектральных и мультиспектральных датчиков. Парные сравнения средних значений для вышеуказанных комбинаций были получены с использованием процедуры обобщенной линейной модели (GLM) с методом LSMEANS в SAS. Тесты проводились с использованием данных за разные месяцы, чтобы определить, в какие месяцы культуры лучше всего разделены друг от друга, и какие HNB или MBB обеспечили наилучшие результаты. Тесты на значимость были проведены с 95%-ной степенью достоверности.

2.5.2. Метод пошагового дискриминантного анализа для различения типов сельскохозяйственных культур

Пошаговый дискриминантный анализ (процедура STEPDISC в SAS, SAS Institute Inc., 2011) — это мощный подход к выбору подмножества диапазонов волн, которые наилучшим образом разделяют типы сельскохозяйственных культур. Существует два различных метода дискриминантного анализа: (a) лямбда Уилкса (Wilks, 1935) и (b) PillaiTrace (Pillai, 1955). Лямбда Уилкса — это критерий отношения правдоподобия (отношение внутригрупповой дисперсии к общей дисперсии) со значениями в диапазоне от 0 до 1. Чем выше лямбда Уилкса, тем ниже разделимость между типами сельскохозяйственных культур (0 означает 100% разделимость пшеницы, хлопка, кукурузы, риса и люцерны). При применении к 158 полосам Hyperion, например, этот анализ начинается без переменных волнового диапазона в модели. На каждом шаге, если полоса, вносящая наименьший вклад среди 158 полос в дискриминационную способность модели, измеряемую лямбдой Уилка, не соответствует критерию сохранения, то эта полоса удаляется. В противном случае в модель включается полоса, не входящая в модель, которая вносит наибольший вклад в дискриминационную способность модели. Когда все полосы в модели удовлетворяют критерию сохранения и ни одна другая не удовлетворяет критерию вхождения, процесс останавливается. Поскольку проводится множество тестов значимости, и общая вероятность отклонения хотя бы одной истинной нулевой гипотезы намного превышает уровень значимости каждого шага, использовался очень низкий уровень значимости, α = 0,999. Это было сделано для того, чтобы избежать включения любой полосы, не вносящей вклад в дискриминационную способность модели (SAS Institute Inc., 2011). Наконец, значения лямбда-коэффициента Уилкса строятся в зависимости от количества полос, чтобы определить количество полос, достаточное для наилучшего разделения 5 культур (когда кривая становится асимптотической или близкой к асимптотике) и их центров длин волн. Аналогичный подход используется для лямбда-тестов Уилкса с любым другим широкополосным или узкополосным датчиком.

2.5.3. Метод анализа главных компонент для различения типов сельскохозяйственных культур

Анализ главных компонент (PCA) (Pearson, 1901) устанавливает выделенные полосы, наиболее важные для фиксации наибольшей дисперсии в данных, и помогает устранить избыточность данных, выявляя и исключая менее важные полосы. PCA исследуется для каждой культуры (пшеница, хлопок, кукуруза, рис и люцерна) отдельно, чтобы определить, как лучше всего отражаются характеристики этой культуры. PCA был выполнен с использованием процедуры PRINCOMP в SAS. Полученные собственные значения объясняют изменчивость данных, объясняемую различными PCA, а полученные собственные векторы, связанные с каждой полосой, помогают определить важность полосы (чем выше собственный вектор, тем выше важность полосы). PCA применяются как к HNB, так и к MBB.

2.5.4. Корреляция между узкими полосами для определения оптимальных узких гиперспектральных полос

Хорошо известно, что подавляющая часть гиперспектральных узких полос (HNB) и производных от них HVI являются избыточными для любого конкретного приложения. В данном исследовании было проведено обширное исследование избыточных и полезных гиперспектральных узких полос (HNB) для Hyperion и спектрорадиометров. Корреляция между всеми возможными комбинациями узких полос привела к получению в общей сложности 12 403 коэффициентов Пирсона. Квадраты значений коэффициентов R2 были представлены на графиках лямбда (λ1) и лямбда (λ2) для определения центров HNB и их ширин, которые обеспечивают наилучшую и избыточную информацию.

2.5.5. Дискриминантная модель и матрицы ошибок для определения оптимальных гиперспектральных узких полос

Для оценки точности датчиков в различении типов сельскохозяйственных культур была построена линейная дискриминантная функция на основе объединенной ковариационной матрицы с использованием дискриминантного анализа (PROC DISCRIM – SAS).

Данные об отражательной способности гиперспектральных и мультиспектральных полос 5 типов сельскохозяйственных культур подаются в дискриминантную модель. Входными диапазонами волн были наиболее часто встречающиеся диапазоны волн, полученные из средних значений по методу наименьших квадратов, лямбда Уилка, PCA и графиков лямбда-лямбда гиперспектральных и мультиспектральных данных, как обсуждалось в предыдущих разделах. В результате получаются матрицы ошибок (Congalton & Green, 2009). Ошибки пропуска рассчитывались как отношение ложноотрицательных результатов к общему количеству пикселей, принадлежащих конкретному типу сельскохозяйственных культур. Ошибки комиссии рассчитывались как отношение числа ложноположительных результатов к общему количеству пикселей, принадлежащих определённому типу культуры. Общая точность классификации рассчитывается как:
где n — общее количество проверочных пикселей, nii — количество пикселей, отнесенных к типу обрезки i (диагональное согласование матрицы ошибок), а k — количество типов обрезки.
3. Результаты

Во-первых, будут обсуждаться результаты биофизического моделирования биомассы и урожайности 5 сельскохозяйственных культур с использованием Hyperion и спектрорадиометра HNB и HVI, а также сравнение их с данными MBB и TBVI, полученными с 5 многоспектральных сенсоров: Landsat ETM+, Advanced Land Imager (ALI), IndianRemote Sensing Satellite (IRS), IKONOS и QuickBird.

Во-вторых, будут представлены и обсуждены результаты оценки способности HNB и MBB различать 5 сельскохозяйственных культур. Как при моделировании урожайности сельскохозяйственных культур, так и при различении типов сельскохозяйственных культур результаты получены несколькими методами. Это обеспечивает надежность полученных результатов.

В-третьих, синтез результатов позволит определить оптимальные диапазоны волн (центры и ширины полос) и индексы, которые наилучшим образом характеризуют, моделируют и различают орошаемые культуры.

Таблица 2

Гиперспектральные узкополосные и мультиспектральные широкополосные пошаговые мультилинейные регрессионные модели влажной биомассы и урожая. Примечание: пустые области указывают либо на отсутствие данных, либо на малый размер выборки (nb7).
3.1. Моделирование продуктивности сельскохозяйственных культур

3.1.1. Модели продуктивности сельскохозяйственных культур с использованием гиперспектральных узкополосных датчиков и мультиспектральных широкополосных датчиков

Результаты моделей пошаговой множественной линейной регрессии (SMRM) представлены в таблице 2. SMRM на основе спектрорадиометров Hyperion и ASD показали более высокие коэффициенты детерминации (R2), чем мультиспектральные датчики, во всех случаях (9 из 9): 0,94bR2b 0,99 для Hyperion и 0,65bR2b0,99 для спектрорадиометра. Обычно, при использовании от 3 до 8 HNB, будь то Hyperion или спектрорадиометр, значения R2 достигают 0,93–1,0, за исключением биомассы хлопка, где значение R2 = 0,65 для спектрорадиометра. Комбинация узких полос в основном локализовалась в коротковолновой ИК-области (1300–2500 нм) и ближней ИК-области, или коротковолновой ИК-области и видимой (400–700 нм) областях спектра.

Более конкретно, 53,6% этих узких полос представлены средней инфракрасной (EMIR, 1301–1990 нм) и дальней средней инфракрасной (FMIR, 1901–2350 нм) областях, причем наиболее часто встречающиеся полосы сосредоточены на 1371, 1731, 2121, 2181 и 2191 нм.

Данные спектрорадиометра также показали высокую частоту в дальнем ближнем инфракрасном диапазоне (FNIR, 1051–1300 нм), причем 1054 и 1104 были наиболее частотными диапазонами. Более низкие коэффициенты детерминации были получены широкополосными датчиками, в частности, ALI и гиперпространственными IKONOS и QuickBird, с R2 в диапазоне от 0,09 до максимального значения 0,56. Среди широкополосных датчиков ETM+ и IRS показали лучшие результаты (0,55bR2b0,79 и 0,36bR2b0,73 соответственно). В целом, эти значения R2 для HNB были выше на 0,09–0,35 (чаще ≥0,25) по сравнению с MBB. Подавляющая доля HNB находится в коротковолновой инфракрасной области (SWIR), за которой следует дальняя инфракрасная область. В большинстве случаев около 4 HNB было достаточно для получения максимальных значений R2, часто достигающих 0,9. Из MBB, IRS, ALI, и ETM+ показали примерно одинаковые результаты, значительно лучше, чем IKONOS и QuickBird, но значительно хуже, чем HNB Hyperion и спектрорадиометра. Это также указывает на то, что даже самое высокое пространственное разрешение (2–3 м) IKONOS и QuickBir недостаточно без высокого спектрального разрешения, доступного таким датчикам, как Hyperion.

3.1.2. Модели продуктивности сельскохозяйственных культур с использованием двухполосных индексов вегетации

Матрица корреляции Lambda(λ1) и Lambda(λ2) между всеми возможными комбинациями двухполосных индексов вегетации (TBVI и HVI) и биомассой (влажной и сухой) и урожайностью была получена с использованием HNB и MBB (рис. 3a, b, c и таблица 3). Лучшие линейные и нелинейные модели (логарифмические или экспоненциальные) представлены в таблице 3. HVI показали более высокую корреляцию с биомассой и урожаем хлопка и кукурузы (R2 = 0,92–0,96, и R2 = 0,80–0,97, соответственно; p < 0,5) по сравнению с TBVI (максимальный полученный R2 составил 0,79 Для модели ETM + биомасса пшеницы). HVI в основном представляли собой комбинацию полос ближнего ИК- и/или коротковолнового ИК-диапазона. В частности, наиболее часто встречающиеся полосы располагались в ближнем ИК-диапазоне (при 1245, 1276 и 1296 нм) и ближнем ИК-диапазоне (при 1498, 1508, 1689 и 1699 нм), за которыми следовал FM-ИК-диапазон (при 2194, 2285 и 2305 нм). Сообщается о различиях между лучшим узкополосным и лучшим широкополосным R2. Биомасса и урожай пшеницы лучше всего коррелировали со спектрорадиометром HVI, чем HyperionHVI и IRS, ALI и IKONOSTBVI. Биомасса риса также лучше определялась спектрорадиометром HVI по сравнению с ETM+, IRS и QuickBird TBVI. Сообщается об одном случае более высокой корреляции IRS TBVI с биомассой люцерны (R2 = 0,83), чем со спектрорадиометром (R2 =0,64). В целом, гиперспектральные HVI превзошли многоспектральные TBVI в 8 из 9 случаев (разница между лучшим узкополосным и лучшим широкополосным R2 в таблице 3).

Контурные диаграммы зависимости лямбда (λ1) от лямбда (λ2) R2 (рис. 3а, б, в) отражают корреляцию между HVI и выходом биомассы. Из матрицы R2 сохраняются только значения выше или ниже диагонали (12,403), поскольку они транспонированы друг в друга. Области «бычьего глаза» представляют собой области максимального информационного содержания, где определяются наилучшие центры и ширины полос. Например, значения R2 0,96 и 0,94 были достигнуты с помощью Hyperion HVI697-1221 (HNB с центром на 697 нм и 1221 нм) и HVI1201-1171 (HNB с центром на 1201 нм) и 1171 нм) соответственно.

В целом, модели ступенчатой ​​множественной линейной регрессии (SMRM) и двухполосные индексы растительности дали значительно лучшие результаты, чем широкополосные данные, из-за более высокой чувствительности в конкретных гиперспектральных узкополосных точках к пигментации растений, структуре полога и условиям роста (Thenkabailetal., 2011, 2002). В частности, 74% HNB были расположены в диапазоне спектра 1051–2331 нм, включая FNIR (1100–1300 нм), около 10% были расположены во влагочувствительной ближней инфракрасной области (MSNIR, 951–1050 нм), 6% – в красной и красной области (630–752 нм), а остальные 10% были распределены между синим (400–500 нм), зеленым (501–600 нм) и ближним ИК (760–900 нм).

3.2. Различение типов сельскохозяйственных культур с использованием гиперспектральных и мультиспектральных данных

3.2.1. Различия в средних спектрах HNB и MBB между типами сельскохозяйственных культур

Значимые (p < 0,05) парные сравнения всех возможных комбинаций среднего коэффициента отражения трёх культур (хлопок, кукуруза и пшеница; или хлопок, кукуруза и люцерна), четырёх культур (хлопок, кукуруза, пшеница и рис), и пяти культур (хлопок, кукуруза, пшеница, рис и люцерна) для месяцев июнь, июль и август с использованием HNB и MBB представлены в Таблице 4. Данные спектрорадиометра позволяют достоверно различать три типа сельскохозяйственных культур (хлопок, кукуруза и пшеница) в июне и июле, а также четыре культуры виды (хлопок, кукуруза, пшеница и рис) в июле, когда они находятся в стадии полного роста, с полосами, расположенными в основном в ближнем инфракрасном диапазоне (1330–1900 нм) и ближнем инфракрасном диапазоне (1901–2350 нм), за которыми следует красная часть (600–700 нм) спектра. Однако он показал плохие результаты при различении люцерны от других видов культур. Со второй половины июня до конца июля увядание листьев люцерны, а также эффект высокого почвенного фона могли повлиять на отражение и сделать спектральную дифференциацию люцерны от других культур более сложной. Только полосы с центром на 2441 и 2551 нм были способны достоверно дифференцировать все пять видов культур. Действительно, полосы в инфракрасной области спектра каждой фермы особенно чувствительны к фоновому эффекту почвы и стрессу растений (Thenkabail, Enclona, ​​Ashton, & VanDerMeer, 2004). Тем не менее, классификация отражательной способности пикселей люцерны в течение всего вегетационного периода была точной на 100% с использованием данных спектрорадиометра (см. Таблицу 7).
Рис. 3. Модели биомассы сельскохозяйственных культур с использованием гиперспектральных индексов растительности. Значения нелинейной логарифмической корреляции R2 λ1–λ2: (a) Гиперион HVIs относительно сырой биомассы хлопка (ниже диагонали) и кукурузы (выше диагонали); (b) Спектрорадиометр HVIs относительно сырой биомассы хлопка (ниже) и люцерны (выше); (c) Спектрорадиометр HVIs относительно сырой биомассы кукурузы (ниже) и риса (выше).
Таблица 3
Линейные и нелинейные зависимости между индексами двухполосной растительности и урожайностью биомассы. Примечание: пустые области указывают либо на отсутствие данных, либо на малый размер выборки (nb7).
Многочисленные полосы Hyperion значительно различались среди хлопка, кукурузы и пшеницы в августе. Эти три типа сельскохозяйственных культур были так различены некоторыми многоспектральными датчиками: в июне — ALI, но не ETM+; в июле — IRS, ETM+ и гиперпространственными датчиками IKONOS и QuickBird; и в августе — ETM+. В июне и июле четыре и пять типов сельскохозяйственных культур были различены IRS, но не QuickBird. В целом, большое количество HNBs Hyperion и спектрорадиометра предоставляет гораздо большие возможности, чем MBB, для дифференциации большего количества сельскохозяйственных культур.

Действительно, растительность имеет весьма отличительную спектральную сигнатуру, зависящую от разной концентрации молекул воды (пик в ближнем ИК-диапазоне), пигментов, таких как хлорофилл (видимый, ближний ИК-диапазон), каротиноидов (УФ) и антоцианов, а также структурных полисахаридов клеточной стенки, таких как целлюлоза и лигнин (коротковолновый ИК-диапазон) (Gitelson, 2011; Thenkabail, Lyon и Huete, 2011). Следовательно, большее количество узких полос полезно для обнаружения и моделирования этих специфических особенностей. Кроме того, когда сельскохозяйственные культуры трудно дифференцировать в MBB, можно найти один HNB или другой (или комбинацию HNB), которые могут помочь дифференцировать типы сельскохозяйственных культур. Это особенно полезно, когда данные дистанционного зондирования доступны только в течение нескольких месяцев.

3.2.2. Пошаговый дискриминантный анализ типов сельскохозяйственных культур

Способность данных HNB и MBB различать типы сельскохозяйственных культур была исследована с помощью пошагового дискриминантного анализа. Степень разделимости (при pb 0,0001; уровень достоверности 99%) среди хлопка, кукурузы и пшеницы с использованием данных HNB от Hyperion и спектрорадиометра, а также данных MBB от ALI, ETM+ и IKONO показана на рис. 4. Следует отметить, что более низкое значение λ Уилкса обеспечивает большую разделяемость культур.
Высокая степень почти идеальной (~100%) дискриминации (λ Уилкса ≈ 0) между хлопком, кукурузой и пшеницей была достигнута с помощью Hyperion использования 54 диапазонов длин волн (рис. 4а). Из этих 54 диапазонов 48% приходилось на ближний ИК-диапазон, 33% на коротковолновый ИК-диапазон и 19% на видимый диапазон спектра. Тот же уровень разделимости с использованием спектрорадиометра (λ Уилка ≈ 0) был достигнут при использовании 14 диапазонов длин волн, 79% из которых находятся в видимом диапазоне и 21% в ближнем ИК-диапазоне. По сравнению с HNB, MBB показали гораздо худшие результаты при разделении типов сельскохозяйственных культур: ETM+ достигает λ Уилка 0,6094 с 4 нетепловыми диапазонами; IKONOSa — λ Уилка 0,5644 с 4 диапазонами; и ALI — λ Уилка 0,2728 с 7 диапазонами. Тем не менее, спектрорадиометр показал лучшие результаты (λ Уилка = 0,00144), чем ETM+ (λ Уилка =0,5594), дифференцируя хлопок, кукурузу и рис, используя только шесть каналов, из которых 67% в видимом диапазоне и 33% в ближнем ИК-диапазоне, по сравнению с тремя каналами ETM+ (рис. 4b). Это демонстрирует существенное смешение между типами сельскохозяйственных культур.

3.2.3. Анализ главных компонент гиперспектральных узкополосных данных

Целью анализа главных компонент (PCA) было сохранение уменьшение избыточности гиперспектральных волновых диапазонов путем вычисления минимального набора уникальных диапазонов (до 5), которые наилучшим образом объясняют изменчивость отражательной способности. В таблице 5 представлены PCA Hyperion и узкополосных спектрорадиометров для различных типов сельскохозяйственных культур. Для Hyperion первый PCA объясняет 66% общей дисперсии на хлопковых полях, второй PCA объясняет 24%, до пятого, объясняя 1%. Два-пять PCA обеспечивают точное обобщение данных, при этом два PCA объясняют 90% общей дисперсии, а пять — 98%. Наиболее важные HNB Hyperion, связанные с PCA1 хлопка, были 1608 нм, 1588 нм, 1568 нм, 1578 нм и 1598 нм (таблица 5). В целом, для хлопка PCA1 определялся HNB в EMIR (1300–1900 нм), а PCA2 – в ближнем ИК (760–900 нм). Для кукурузы первые два и первые пять PCA объясняли 79% и 93% дисперсии соответственно, причем первый PCA определялся в основном EMIR, а PCA2 – в FMIR. Для пшеницы первые два и первые пять PCA объясняли 93% и 98% дисперсии соответственно. PCA1 определялся EMIR. и PCA2 по FNIR. Для спектрорадиометра первые два и первые пять кумулятивных главных компонентов объясняли соответственно 93% и 99% изменчивости отражательной способности полей люцерны, 88 и 99% хлопковых полей, 94 и 99% кукурузных полей, 97 и 100% рисовых полей и 93 и 100% пшеничных полей. Как и в Hyperion, доминирующие диапазоны волн в спектрорадиометре PCA1 были расположены в EMIR, а в PCA2 – в NIR для пяти культур. В целом, по всем культурам, для Hyperion или спектрорадиометра первые два PCA объясняли около 90% изменчивости и доминировали HNB в EMIR (1300–1900 нм) и NIR (760–900 нм). с добавлением полос других длин волн.
3.2.4. Корреляция между гиперспектральными узкополосными данными

Корреляционный анализ между 158 узкими полосами Hyperion и спектрорадиометром дал 12 403 значения R2 для каждого. Контурные диаграммы λ1–λ2 хлопка и пшеницы для Hyperion и спектрорадиометра показаны на рис. 5 и 6. Области высокой корреляции (высокие значения R2, пустые области) между двумя волновыми диапазонами указывают на избыточность диапазонов; таким образом, области с наибольшим значением R2 являются наиболее информативными. Для пшеницы наиболее информативные полосы как Hyperion, так и спектрорадиометра расположены в ближней ИК- и визуальной части спектра, за которыми следуют FMIR и EMIR. Для хлопка наиболее распространенные полосы Hyperion расположены по всему спектру, в основном в красном крае и FNIR, а наиболее распространенные полосы спектрорадиометра расположены в синей, красной и FMIR.

3.2.5. Частота встречаемости HNB и MBB, точность классификации типов сельскохозяйственных культур и выбор наилучших диапазонов

Точность недискриминации типов сельскохозяйственных культур проверялась с помощью дискриминантного анализа с использованием наиболее часто встречающихся диапазонов волн, полученных с помощью метода наименьших квадратов, лямбда Уилкса, главного компонента и матрицы корреляции лямбда-лямбда для гиперспектральных датчиков, а также метода наименьших квадратов и лямбда Уилкса для мультиспектральных датчиков (рис. 7).
Таблица 4
Среднеквадратичное среднее значение коэффициента отражения типов сельскохозяйственных культур демонстрирует значительную статистическую дискриминационную способность при pb0,05 (уровень достоверности 95%) для гиперспектральных узких полос и мультиспектральных широких полос.
Рис. 4. Распознавание типов сельскохозяйственных культур (исследовано 3 культуры) с использованием гиперспектральных узких полос: (a) Лямбда-разделимость Уилкса для хлопка, кукурузы и пшеницы для спектрорадиометра, Hyperion, ALI, ETM+ и IKONOS. (b) Лямбда-разделимость Уилкса для хлопка, кукурузы и риса для спектрорадиометра и ETM+. Примечание: чем меньше Лямбда Уилкса, тем выше разделимость. n = количество исследованных пикселей.
Ранжирование лучших полос использовалось в качестве входных полос для классификации типов сельскохозяйственных культур. Когда полосы, ранжированные внутри одной группы (например, 680 нм и 690 нм), содержали избыточную информацию, только одна полоса выбиралась в качестве входных данных. Такой подход помогает преодолеть феномен Хьюза (Thenkabail et al., 2011). На основе этого подхода были выбраны лучшие 3, 5, 9, 12, 15 и 29 полос Hyperion (таблица 6). Общая точность 90,2% была достигнута при использовании 29 узких полос при классификации хлопка, кукурузы и пшеницы. Для достижения точности классификации 92% потребовалась 21 полоса спектрорадиометра (таблица 6). Результаты матрицы ошибок для 21 лучшего диапазона волн спектрорадиометра показаны в Таблице 7. При сравнении типов культур наилучшая точность классификации была обнаружена для люцерны и кукурузы (100%), за ними следуют хлопок (97,7%), пшеница (95,6%) и наименьшая – для риса (30%). Наибольшая ошибка наблюдалась для пикселей риса, ошибочно классифицированных как пшеница, с ошибкой пропуска 70%, вероятно, из-за отражения водного фона. Напротив, общая точность MBB в различении типов культур ниже, чем у узкополосных даже при использовании всех диапазонов и только для двух культур (хлопка и пшеницы), как в случае IRS (общая точность = 92,6%) (Таблица 6).

Сравнивая точность распознавания тех же трёх культур – хлопка, кукурузы и пшеницы – между мультиспектральными ALI и IKONOS и гиперспектральным Hyperion, последний превзошёл результат всего с 12 каналами (общая точность = 86%). ALI и IKONOS достигли максимальной точности 83,9% и 76,8% соответственно, используя 9 и 4 канала соответственно. Общая точность 6 нетепловых каналов ETM+ составила 54,3% при распознавании четырёх типов культур (хлопок, кукуруза, пшеница и рис), что ниже, чем у спектрорадиометра, который, используя только одну полосу с центром на 432 нм, мог распознавать те же четыре типа культур, а также пятую культуру – люцерну, с точностью 71,2%. Однако важно отметить, что с помощью HNB можно достичь точности классификации более 90%, даже при использовании большего количества типов сельскохозяйственных культур, как показано для 5 культур с использованием данных спектрорадиометра (таблица 7). Для MBB точность классификации быстро снижается с увеличением количества типов сельскохозяйственных культур.

4. Обсуждение и выводы

В данном исследовании изучалась эффективность гиперспектральных узкополосных данных, полученных с помощью Hyperion и спектрорадиометра, в сравнении с многоспектральными широкополосными данными, полученными с помощью ETM+, ALI, IRS, IKONOS и QuickBird, при оценке биомассы и урожая сельскохозяйственных культур, а также при различении пяти ключевых мировых культур (хлопок, пшеница, кукуруза, рис и люцерна). Наилучшие биофизические модели были разработаны на основе: 1. ступенчатых множественных линейных моделей, включающих гиперспектральные узкие полосы (HNB) и мультиспектральные широкополосные полосы (MBB); и 2. линейных и нелинейных моделей, полученных на основе двухполосных вегетационных индексов (TBVI), полученных из MBB, и гиперспектральных вегетационных индексов (HVI), полученных из HNB.

Лучшие модели HNB объясняли изменчивость биофизических параметров с точностью свыше 93%, что примерно на 25% выше, чем у лучших моделей MBB. При сравнении Hyperion с Landsat ETM+ и ALI, имеющими одинаковое пространственное разрешение 30 м в диапазонах видимого, ближнего и ближнего инфракрасного (VIS, NIR и MIR), каналы одиночного отражения Hyperion и VI показали лучшие результаты при обнаружении биомассы сельскохозяйственных культур и различении типов сельскохозяйственных культур. Среди многоспектральных датчиков наилучшие результаты показал IRS, а затем ETM+. Наименьшие коэффициенты корреляции были получены с помощью гиперпространственных IKONOS и QuickBird. Это связано с различиями в спектральном, временном и пространственном разрешении изображений (таблица 1). Во-первых, проблема спектрального разрешения: IKONOS и Quickbird имеют только 4 спектральных канала в видимой и ближней ИК-областях (450–900 нм) по сравнению с большим количеством спектральных каналов и/или спектральных каналов, распределенных по видимому, ближнему инфракрасному и коротковолновому инфракрасному (таблица 1). Во-вторых, проблема временного разрешения : количество проанализированных изображений составило всего два в случае IKONOS и одно в случае QuickBird; для сравнения, было 5 изображений ETM+, 2 ALI (обратите внимание, что это 9 каналов) и 13 изображений IRS. Лучшие результаты с IRS можно объяснить, в частности, большим временным охватом. В-третьих, проблема пространственного разрешения: естественно, что при более высоком пространственном разрешении, полученном с помощью QuickBird и IKONOS, наблюдается большая пространственная изменчивость, тогда как при использовании снимков с более низким разрешением, таких как Landsat ETM+, происходит большее «усреднение» изменчивости, что во многих случаях приводит к большей корреляции с биофизическими величинами, особенно в сильно изменчивых гетерогенных хозяйствах. Кроме того, следует отметить, что Hyperion и спектрорадиометр ASD не дали абсолютно одинаковых результатов, хотя они были проанализированы с одинаковым спектральным разрешением (10 нм). Действительно, они различались по следующим 3 факторам: 1. Время получения (изображения Hyperion были получены в течение нескольких дней после измерений спектрорадиометром); 2. Количество снимков (3 снимка Hyperion в 2007 г., в отличие от данных спектрорадиометра, полученных каждые 15–20 дней в течение всего вегетационного периода 2006 и 2007 гг.); и 3. Пространственное разрешение (30 м для Hyperion и 0,1134 м для спектрорадиометра). При разных масштабах изменчивость отражательной способности и VI различается, поскольку при очень мелком масштабе хорошо обнаруживаются почва, тень и другие эффекты, тогда как при более грубом пространственном разрешении эти элементы смешиваются и агрегируются.

При сравнении Hyperion с сенсорами Landsat ETM+ и ALI, имеющими одинаковое пространственное разрешение 30 м в диапазонах видимого, ближнего ИК и среднего ИК, отдельные полосы отражения и VI Hyperion показали лучшие результаты при обнаружении биомассы сельскохозяйственных культур и различении типов сельскохозяйственных культур. Следовательно, обнаружение биофизических свойств растений теряется при более грубом спектральном разрешении. В будущих исследованиях эти факторы следует учитывать при сравнении результатов датчиков. Хотя данное исследование не фокусировалось на вопросе пространственного масштаба, открытым вопросом для будущих исследований является установление масштаба, необходимого для определения продуктивности сельскохозяйственных культур и различения типов, что можно было бы сделать, например, путем простой передискретизации размера пикселя изображений. Будущий спутник HyspIRI проектируется с более низким пространственным разрешением – 60 м – чем Hyperion в коротковолновом инфракрасном диапазоне (VSWIR: 380–2500 нм), и равным спектральным разрешением в 10 нм смежных диапазонах (Национальное управление по аэронавтике и исследованию космического пространства, 2013). Следовательно, сравнение моделей HyspIRI с моделями сельскохозяйственных культур Hyperion HNB может дать представление о проблеме пространственного масштаба.
Таблица 5. Лучшие гиперспектральные узкополосные центры для первых пяти PCA, выбранных на основе факторных нагрузок (собственных векторов) для различных типов сельскохозяйственных культур.
Изучение спектров отражения, полученных с помощью гиперионометров и спектрорадиометров, позволило определить наиболее часто встречающиеся и, следовательно, наиболее ценные HNB для прогнозирования биомассы. Из них 74% были локализованы в спектральных диапазонах FNIR, EMIR и FMIR (1051–2331 нм); 10% – во влагочувствительном 970 нм (NIR); 10% – в диапазонах 400–550 нм (синий), 501–600 нм (зеленый) и 760–900 нм (NIR); и 6% в красном и красном крае (630–752 нм). Аналогично, лучшие HVI для биофизического моделирования сельскохозяйственных культур и различения типов сельскохозяйственных культур включали HNB, центрированные на: (i) 742 нм и 1175 нм (HVI742–1175), (ii) 1296 нм и 1054 нм (HVI1296 1054), (iii) 1225 нм и 697 нм (HVI1225–697) и (iv) 702 нм и 1104 нм (HVI702–1104). Эти лучшие полосы в подавляющем большинстве (70%) расположены в дальней ближней инфракрасной области (БИК) (1051–1300 нм) и 30% – в красной (701–750 нм) или наиболее поглощающей части красного (670–700 нм). Роль полос БИК (751–1050 нм) и БИК в определении биофизических свойств и продуктивности сельскохозяйственных культур в последнее время привлекла внимание из-за их чувствительности к содержанию хлорофилла в растениях. Действительно, БИК и БИК гораздо лучше отслеживают фотосинтез, чем поглощающая видимая часть спектра (Ollinger, 2011). Это связано с тем, что видимые полосы (узкие и широкие) насыщаются в первом слое листьев, с которым он сталкивается (поскольку 95% сигнала поглощается на этой стадии), но ниже полога находятся другие слои листьев с большим количеством хлорофилла. Недавно Гительсон (2011) сообщил о ~ 2–4-м слое листьев в пологе кукурузы, имеющем максимальное содержание хлорофилла. Единственные полосы дистанционного зондирования, которые могут видеть средние слои листьев полога, находятся в ближнем ИК-диапазоне или ближнем ИК-диапазоне (поскольку этот диапазон предположительно может проникать через семь слоев листьев). Следовательно, ближний ИК-диапазон может косвенно воспринимать много информации, ценной для биофизического моделирования и моделирования продуктивности сельскохозяйственных культур. Кроме того, известно, что как ближний ИК-диапазон, так и ранний средний инфракрасный (1301–1900 нм) Чувствительны к биомассе и низкоинтенсивному инфракрасному излучению (Thenkabail, Enclona, ​​Ashton, Legget и др., 2004), в то время как как ранний средний инфракрасный диапазон, так и особенно ближний средний инфракрасный диапазон (1901–2500 нм) предоставляют ценную информацию о содержании лигнина, целлюлозы и крахмала в растении, а также о геометрической структуре полога, оптических свойствах подстилающих почв (Boyd и Ripple, 1997 и Boydetal., 1999), а также при обработке сложных разнородных стадий роста и условий выращивания (Thenkabail и др., 2002; Thenkabail и др., 2000). Высокая доля волновых диапазонов в ближнем ИК-диапазоне, раннем среднем инфракрасном диапазоне (EMIR), Обнаруженные в данном исследовании данные в ближнем инфракрасном диапазоне (FMIR) и далее в ближнем инфракрасном диапазоне (FNIR) указывают на важность использования этих областей волновых диапазонов при определении характеристик сельскохозяйственных культур, которые часто игнорируются традиционными широкополосными индексами NDVI, основанными на красном и ближнем инфракрасном диапазонах. Это открытие подтверждает аналогичные результаты, полученные в предыдущих исследованиях Калацкой и Санчес-Азофейфы (2008), Тенкабайля, Энклоны, Эштона, Легга и др. (2004) и Тенкабайля, Энклоны, Эштона и Ван дер Меера (2004), которые установили, что MIR и FNIR являются наиболее информативными областями диапазонов для характеристики определенных сельскохозяйственных культур или других параметров растительности.
Рис. 5. Избыточность данных и анализ гиперспектральных узких полос. Значения корреляции Hyperion R2 между λ1 и λ2 для хлопка (над диагональю) и пшеницы (под диагональю).
Примечание: Чем меньше значения R2, ​​тем выше уникальность между двумя полосами. Чем больше значения R2, ​​тем выше избыточность.

Изучение спектров отражения различных типов сельскохозяйственных культур показывает, что гиперспектральные данные предоставляют множество возможностей для различения различных сельскохозяйственных культур, используя либо отдельные полосы, в основном расположенные в средней инфракрасной области, а некоторые – в красной или красной, либо комбинацию полос во всем спектре, но обычно в ближней ИК-области и ближней ИК-области. Эти полосы, опять же, полезны для определения биохимических свойств растений, биомассы и роста растительности, которые различаются у разных видов растений.

Действительно, общая точность распознавания типов сельскохозяйственных культур превышала 90% при использовании около 20 HNB, что значительно выше, чем у любого из широких полос, которые обеспечивали точность от 45 до 84%. Лучшие HNB Hyperion, достигшие наибольшей точности распознавания типов растений, перечислены в Таблице 6. Диапазон точности варьируется от 81,1% для 3 HNB до 90,2% для 29 HNB. Центры длин волн 29 HNB Hyperion составляли: 447, 508, 579, 651, 681, 722, 803, 824, 885, 933, 943, 953, 963, 983, 1064, 1084, 1094, 1124, 1134, 1144, 1195, 1205, 1488, 1528, 1982, 2123, 2143, 2264 и 2274. Точность Спектрорадиометр, различающий пять типов сельскохозяйственных культур, также показал высокий диапазон от 92% при использовании 21 полосы до 93,7% при использовании 80 полос (таблица 6). Мы рекомендуем использовать 21 полосу из 80, поскольку при использовании 59 дополнительных полос получается всего на 2% больше информации. Это означает, что большое количество HNB, как правило, избыточно при классификации типов сельскохозяйственных культур или моделировании биофизических или биохимических характеристик сельскохозяйственных культур. Из вышеупомянутых 21 полосы спектрорадиометра, различающих хлопок, кукурузу, пшеницу, рис и люцерну, три полосы были общими с полосами Hyperion, различающими хлопок, кукурузу и пшеницу: полосы 681, 1124, и 1982. Волновая полоса 681 (красная) является областью поглощения света. хлорофиллина зеленой растительности, и было сообщено (более конкретно, о полосе с центром при 680 нм) Thenkabailetal. (2000) как о наиболее часто встречающейся и наиболее важной полосе для различения культур. Это также было сообщено Galvãoetal. (2009) как о фундаментальной полосе Hyperion для различения сортов сои, и Cleversetal. (2007) для прогнозирования биомассы злаковых трав. Полоса волн 1124 (FNIR) соответствует отражению после пика 1 в диапазоне 1050–1300 нм, которая особенно чувствительна к биомассе и LAI, и было сообщено Thenkabaile, Enclona, ​​Ashton, Legg и др. (2004) и Thenkabail, Enclona, ​​Ashton и VanDerMeer (2004) как одна из информативных гиперионных полос для объяснения изменчивости растительности, а также Galvãoetal (2009), опять же, как важная гиперионная полоса для различения сортов сои. Диапазон волн 1982 (EMIR) соответствует отражению после пика 2 в MIR, который чувствителен к биомассе, целлюлозе и лигнину.
Рис. 6. Избыточность данных и анализ узких гиперспектральных полос. Значения корреляции спектрорадиометра R2 между λ1 и λ2 для хлопка (выше диагонали) и пшеницы (ниже диагонали). Примечание: Чем меньше значение R2, тем больше уникальность между двумя диапазонами. Чем больше значение R2, тем больше избыточность.
Рис.7. Частота встречаемости узких полос Hyperion в методе наименьших квадратов, лямбда Уилкса, PCA и λ1–λ2R2. Группы наиболее часто встречающихся близких узких полос (частота ≥ 6) ранжированы по возрастающим числам над столбцами (1 = наиболее часто встречающаяся).
Таблица 6
Общая точность, определенная с помощью дискриминантной модели, для лучших многоспектральных широкополосных сигналов и лучших гиперспектральных узкополосных сигналов при различении от 2 до 5 типов культур.
Таблица 7
Матрица точности классификации 5 культур с использованием лучших узких полос спектрорадиометра (синий, красный, ближний ИК, ближний ИК, восходящий ИК, ближний ИК).
Эффективность гиперспектральных данных при различении типов культур варьировалась в течение вегетационного периода в зависимости от стадии роста культур. Например, данные отражения спектрорадиометра позволили различить хлопок, кукурузу, пшеницу и рис в июле, но не в июне, когда рис находился в ранней стадии роста, а посев производился в последнюю неделю мая (Caietal., 2009) (см. Таблицу 4). Кроме того, как в июне, так и в июле люцерна не была отделена от вышеупомянутых культур спектрорадиометром. Учитывая, что в июне люцерна находилась в стадии старения (уборка урожая была проведена в июле), почвенный фон мог повлиять на отражательную способность, обнаруженную спектрорадиометром в таком мелком масштабе. (0,1134 мкм). В мае Hyperion смог отличить кукурузу от хлопка (в нескольких диапазонах NIR, FNIR и EMIR) и кукурузу от пшеницы (в нескольких диапазонах NIR и FNIR); однако он не смог отличить хлопок от пшеницы (а также все три культуры одновременно), вероятно, потому что хлопок находился на ранней стадии роста с высоким содержанием почвенного фона, а пшеница – на стадии старения с преобладанием желтых пигментов в листьях и стеблях. С другой стороны, и Hyperion, и спектрорадиометр достоверно различали типы культур, когда все находились в стадии полного роста. Эти результаты ясно указывают на важность времени получения изображения для оптимального распознавания культур. и моделирование. HyspIRI, с временем наблюдения 19 дней в видимом и коротковолновом инфракрасном диапазоне (VSWIR: 380–2500 нм) (5 дней в среднем и тепловом инфракрасном диапазоне, TIR), должен обеспечить достаточный временной охват для точного распознавания культур. Это исследование четко определило важные, а также избыточные диапазоны волн посредством: (1) анализа главных компонент (таблица 5) и (2) очень строгих контурных графиков λ1 (400–2500 нм) и λ2 (400–2500 нм) (рис. 3–6), включающих 12 403 уникальных значения R-квадрата, полученных с помощью модели HVI, для каждой переменной каждой культуры. Эти результаты вносят значительный вклад в интеллектуальный анализ данных и преодоление феномена Хьюза. Это очень ценно для будущих поколений спутников, таких как миссия HyspIRI, которая могла бы собирать данные из сотен гиперспектральных узких диапазонов, таких как Hyperion, из которых пользователям придется извлекать соответствующие оптимальные диапазоны волн, соответствующие их приложения (например, основанного на методах, используемых в данной статье), или, в качестве альтернативы, они могут нести специализированные оптимальные датчики с селективными диапазонами волн (например, как указано для Hyperion в Таблице 6), ориентированные на сбор данных для целевых приложений, таких как сельское хозяйство (Таблица 6) или растительность. Это позволит сократить объем данных и оптимизировать время и ресурсы на предварительную обработку, анализ и интерпретацию изображений.

Благодарности
Авторы выражают благодарность Отделу наук о Земле Управления научных миссий НАСА за исследовательский грант, предоставленный в ответ на заявку НАСА ROSESHyspIRI (NNH10ZDA001N-HYSPIRI).
Ссылки


Alchanatis, V., & Cohen, Y. (2011). Spectral and spatial methods for hyperspectral image analysis for estimation of biophysical and biochemical properties of agricultural crops. In P.S. Thenkabal, G.J. Lyon, & A. Huete (Eds.), Hyperspectral remote sensing of vegetation (pp. 239-308). Boca Raton, London, New York: CRC Press-Taylor and Francis Group.

Thenkabal, P.S., Lyon, G.J., & Huete, A. (2008). Hyperspectral remote sensing of vegetation canopy reflectance and biophysical sources of variability in canopy reflectance. Remote Sensing of Environment, 64, 234-253.

Beckmann, T., & McKinney, R. (2006). Hyperion level 1G (L1GST) product output files data format control book (DCFB). USGS Center for Earth Resource Observation and Science (EROS) (Volume: 1, Issue: April).

Berk, A., Anderson, G.P., Bernstein, L.S., Acharya, P.K., Dothe, H., Matthew, M.W., et al. (1999). MODTRAN4 radiative transfer modeling for atmospheric correction. SPIE proceedings III (pp. 3756).

Boyd, D.S., & Ripple, W.J. (1997). Potential vegetation indices for determining global forest cover. International Journal of Remote Sensing, 18, 395-1401.

Boyd, D.S., Wicks, T.E., & Curran, P. (1999). Use of middle infrared radiation to estimate the leaf area index of a boreal forest. Tree Physiology, 20, 755-760.

Blackburn, G.A., & Ferwerda, J.G. (2008). Retrieval of chlorophyll concentration from leaf reflectance using wavelet analysis. Remote Sensing of Environment, 112, 1614-1632.

Bretscher, O. (1995). Linear algebra with applications (3rd ed.). Upper Saddle River NJ: Prentice Hall.

Cai, X., Thenkabal, P.S., Biradar, C.M., Platonov, A., Gumma, M., Deeravath, V., et al. (2009). Water productivity mapping using remote sensing data of various resolutions to support "more crop per drop". Journal of Applied Remote Sensing, 3, 033557. http://dx.doi.org/10.1117/1.3256743.

Chan, J., Cheung-Wai, & Pailinkx, D. (2008). Evaluation of random forest and adaboost tree-based ensemble classification and spectral band selection for ecotope map-ping using airborne hyperspectral imagery. Remote Sensing of Environment, 112, 2999-3011.

Chen, J., Wang, R., & Wang, C. (2008). A multi-resolution spectral angle-based hyperspectral classification method. International Journal of Remote Sensing, 29, 3593-3616.

Clever, J.G.W., van der Werf, A.M., Gumma, M., S., & Schipper, V. (2008). Estimating grassland biomass using SVM band shaving of hyperspectral data. Photogrammetric Engineering and Remote Sensing, 73(10), 1141-1148.
Colombo, R., Busetto, L., Meroni, M., Rossini, M., & Panigada, C. (2011). Optical remote sensing of vegetation water content. In P.S. Thenkabal, G.J. Lyon, & A. Huete (Eds.), Hyperspectral remote sensing of vegetation (pp. 227). Boca Raton, London, New York: CRC Press-Taylor and Francis Group.

Congalton, R., & Green, K. (2009). Assessing the accuracy of remotely sensed data: Principles and practices (2nd ed.). Boca Raton, FL: CRC/Taylor & Francis.

Galvão, L.S., Roberts, D.A., Formaggio, A.R., Numata, I., & Breuni, F.M. (2009). View angle effects on the discrimination of soybean varieties and on the relationships between vegetation indices and yield using off-nadir Hyperion data. Remote Sensing of Environment, 113, 846-856.

Geerken, R., Batikha, N., Celis, D., & De Pauw, E. (2005). Differentiation of rangeland vegetation and assessment of its status: Field investigations and MODIS and SPOT VEGETATION data analyses. International Journal of Remote Sensing, 26, 4499-4526. http://dx.doi.org/10.1080/01431160500213425.

Gitelson, A. (2011). Non-destructive estimation of foliar pigment (chlorophylls, carotenoids, and anthocyanins) contents: Evaluating a semi-analytical three-band model. In P.S. Thenkabal, G.J. Lyon, & A. Huete (Eds.), Hyperspectral remote sensing of vegetation (pp. 141-166). Boca Raton, London, New York: CRC Press-Taylor and Francis Group.

Gitelson, A.A., Gritz, Y., & Merzlyak, M.N. (2003). Relationships between leaf chlorophyll content and spectral reflectance and algorithms for non-destructive chlorophyll assessment in higher plant leaves. Journal of Plant Physiology, 160, 271-282. http://www.sciencedirect.com/science/article/pii/S017616704034.

Glahn, H.R. (1968). Canonical correlation and its relationship to discriminant analysis and multiple regression. Journal of the Atmospheric Sciences, 25, 23-31.

Goveren, M., Dye, P.J., Weiersbye, I.M., Witkowski, E.T.F., & Ahmed, F. (2009). Review of commonly used remote sensing and ground-based technologies to measure plant water stress. WaterSA, 35, 741-752.
Hill, M. J. (2004). Grazing agriculture: managed pasture, grassland, and rangeland. In S. L. Ustin (Ed.), Manual of remote sensing. Remote sensing for natural resource management and environmental monitoring. Vol. 4. (pp. 449–530). Hoboken, NJ: John Wiley & Sons.

Hocking, R. R. (1976). The analysis and selection of variables in linear regression. Biometrics, 3, 1–49.

Houborg, R., & Boegh, E. (2008). Mapping leaf chlorophyll and leaf area index using inverse and forward canopy reflectance modeling and SPOT reflectance data. Remote Sensing of Environment, 112, 186–202.

Jolliffe, I. T., & Howarth, P. J. (2008). Mapping an inland wetland complex using hyperspectral imagery. International Journal of Remote Sensing, 29, 3609–3631.

Kalacska, M., & Sanchez-Azofeifa, G. A. (2008). Hyperspectral remote sensing of tropical and subtropical forests. Boca Raton, London, New York: CRC Press, Taylor and Francis Group, 352.

Lee, K. S., Cohen, W. B., Kennedy, R. E., Mairer, T. K., & Gower, S. T. (2004). Hyperspectral versus multispectral data for estimating leaf area index in four different biomes. Remote Sensing of Environment, 91, 508–520.

Moran, M. S., Inoue, Y. E., & Barnes, M. (1997). Opportunities and limitations for image-based remote sensing in precision crop management. Remote Sensing of Environment, 19–346 (URL: http://www.sciencedirect.com/science/article/pii/S0034425797000342).

National Aeronautics and Space Administration (2013). Hyperspectral mission study. California Institute of Technology. Available online at: http://hyperspi.jpl.nasa.gov/missionstudy.

Ollinger, S. V. (2011). Sources of variability in canopy reflectance and the convergent properties of plants. The New Phytologist, 189, 375–394.

Pearson, K. (1901). On lines and planes of closest fit to systems of points in space. Philosophical Magazine, 2(11), 559–572.

Pilla, K. C. S. (1955). Some new test criteria in multivariate analysis. Annals of Mathematical Statistics, 117–121 (26 pp.).

Rouse, J. W., Haas, R. H., Schell, J. A., & Deering, D. W. (1973). Monitoring vegetation systems in the Great Plains with ERTS. Third ERTS Symposium, NASA SP-351, I, 309–317.

SAS Institute Inc. (2013). SAS/STAT user's guide and software release, version 9.2. Cary, NC: SAS Institute Inc.
Schaepman, M. E., Ustin, S. L., Plaza, A. J., Painter, T. H., Verrelst, J., & Liang, S. (2009). Earth system science related imaging spectroscopy—An assessment. Remote Sensing of Environment, 113, 123–137.

Thenkabail, P. S., Biradar, C. M., Noojipady, P., & Enclona, E. A. (2003). Biophysical and yield information for precision farming from near-real time and historical Landsat TM images. International Journal of Remote Sensing, 24, 2879–2904.

Thenkabail, P. S., Enclona, E. A., Ashton, M. S., Legg, C., & Jean De Dieu, M. (2004). Hyperion, IKONOS, ALI, and ETM+ sensors in the study of African rainforests. Remote Sensing of Environment, 90, 23–43.

Thenkabail, P. S., Enclona, E. A., Ashton, M. S., & Van Der Meer, V. (2004). Accuracy assessments of hyperspectral waveband performance for vegetation analysis applications. Remote Sensing of Environment, 91, 354–376.

Thenkabail, P. S., Knox, J. W., Ozdogan, M., Gupta, M. K., Congalton, R., Wu, Z., You, S., Milesi, C., Finckr, A., Marshall, M., Mariotto, I., Giri, C., & Nagler, P. (2012). Assessing future risks to agricultural productivity, water resources and food security: how can remote sensing help? Photogrammetric Engineering & Remote Sensing (PE&RS) special issue.

Thenkabail, P. S., Lyon, G. J., & Huete, A. (2011). Advances in hyperspectral remote sensing of vegetation and agricultural crops. In P. S. Thenkabail, G. J. Lyon, & A. Huete (Eds.), Hyperspectral remote sensing of vegetation (pp. 3–29). Boca Raton, London, New York: CRC Press—Taylor and Francis Group.

Thenkabail, P. S., Smith, R. B., & De-Pauw, E. (2000). Hyperspectral vegetation indices and their relationships with agricultural crop characteristics. Remote Sensing of Environment, 71, 158–182.

Thenkabail, P. S., Smith, R. B., & De-Pauw, E. (2002). Evaluation of narrowband and broadband vegetation indices for determining optimal hyperspectral wavebands for agricultural crop characterization. Photogrammetric Engineering and Remote Sensing, 68, 607–621.

Varsney, P. K., & Araora, M. K. (2004). Advanced image processing techniques for remotely sensed hyperspectral data. Berlin, Germany: Springer.

Wilk, S. S. (1935). On the independence of k sets of normally distributed statistical variables. Econometrica, 3, 309–326.

10 октября / 2025