В целом, линейная регрессия обычно используется для оценки широкого спектра свойств сельскохозяйственных культур или почвы. Это легко установить, и большинство регрессий на основе индексов обеспечили удовлетворительную точность. Однако с этим подходом связано несколько потенциальных проблем, таких как большое количество доступных индексов, и неизвестно, какой из них работает лучше, регрессия может быть очень чувствительной к размеру и качеству данных, а также проблема насыщения индексов [36,165]. Таким образом, крайне важно рассмотреть эти потенциальные проблемы и принять соответствующие решения при установлении линейных регрессий с гиперспектральными данными. Например, рекомендуется выбирать соответствующие индексы растительности с целевыми культурами или почвами. Исследователи оценили широкий спектр гиперспектральных индексов растительности для различных целей. Haboudane и др. [166] исследовали 11 гиперспектральных вегетационных индексов для оценки содержания хлорофилла в растениях. Main и др. [167] исследовали 73 вегетационных индекса для оценки содержания хлорофилла в сельскохозяйственных культурах и древесных породах саванны. Peng и Гительсон [168] протестировали 10 мультиспектральных индексов и 4 гиперспектральных для количественной оценки первичной продуктивности сельскохозяйственных культур. Croft и др. [169] проанализировали 47 гиперспектральных индексов для оценки содержания хлорофилла в листьях различных пород деревьев. Zhou и др. [170] оценили восемь гиперспектральных индексов для оценки содержания азота в пшенице на уровне полога. Tong и He [165] оценили 21 мультиспектральный и 123 гиперспектральных вегетационных индекса для расчета содержания хлорофилла в траве как в листьях, так и в пологе. Yue и др. [171] исследовали 54 гиперспектральных вегетационных индекса для оценки биомассы озимой пшеницы. Индексы в этих исследованиях выполнены по-разному, предлагается оценить наиболее эффективные из них в этих исследованиях и выбрать тот, который обеспечивает наивысшую точность.
Для решения проблем линейной регрессии расширенная регрессия, такая как MLR и PLSR, также широко использовалась в предыдущих исследованиях для оценки свойств сельскохозяйственных культур и почвы [172,173]. В сравнении с линейной регрессией, расширенные регрессионные модели в основном используют несколько переменных-предикторов в модели для достижения более высокой точности. PLSR является одной из наиболее широко используемых моделей для исследования свойств культур с использованием гиперспектральных изображений, такие как Ryu и др. [35], Jarmer [99], Siegmann и др. [73], и Yue и др. [124] использовали PLSR и гиперспектральные изображения для оценки различных биофизических и биохимических переменных культур (LAI, биомасса, содержание хлорофилла, свежесть, и содержание азота). Thomas и др. [100] исследовали PLSR для извлечения потенциала биогаза из гиперспектральных изображений и оценили влияние времени снимка на точность извлечения. Что касается особенностей почвы, Gomez и др. [49], Van Wesemael и др. [107], Hbirkou и др. [102] и Castaldi и др. [110] построили модель PLSR для оценки содержания SOC с использованием гиперспектральных изображений. Zhang и др. [50] использовали PLSR для оценки широкого спектра свойств почвы (влажность почвы, органическое вещество почвы, глина, общий углерод, фосфор и содержание азота) из гиперспектральных изображений и выявленных факторов, которые могут повлиять на точность модели (низкое отношение сигнал/шум, спектральное перекрытие различных характеристик почвы). Casa и др. [59] использовали модель PLSR и различные гиперспектральные изображения для исследования текстурных особенностей почвы и оценивали различные факторы (например, спектральный диапазон и разрешение, влажность почвы, ошибка геолокации), влияющие на производительность модели.
Модель PLSR реализована на Python и R [174,175] и широко используется во многих исследовательских областях, включая леса [176], луга [177] и воды [178]. Эта модель хорошо зарекомендовала себя в различных исследованиях, благодаря своим сильным сторонам в работе с большим количеством взаимосвязанных переменных-предикторов (т. е. путем преобразования их в несколько некоррелированных скрытых переменных), решения проблемы шума данных и решения проблемы чрезмерной подгонки [171,179]. Также было подтверждено, что различные методы эффективны для повышения точности модели PLSR, такие как включение различных типов переменных-предикторов в модели (например, спектральные полосы, индексы, текстурные переменные), использующих прогнозируемую остаточную ошибку суммы квадратов (PRESS) статистики для определения оптимального количества скрытых переменных и оценки характеристик для выбора более важных переменных-предикторов в модели [36]. Поэтому крайне важно тщательно изучить эти методы для достижения оптимальной точности модели.
3.3. Моделирование Переноса Излучения
Моделирование переноса излучения - это подход, основанный на физических принципах, который использует физические законы для моделирования взаимодействия электромагнитного излучения с растительностью (например, отражение, передача и поглощение) [180]. RTMS моделирует спектры растительности (например, коэффициент отражения и пропускания листьев) использование биофизических и биохимических свойств растительности (например, содержание хлорофилла и воды) в прямом режиме и для инверсии этих переменных из спектральных измерений в обратном режим [181]. PROSAIL - одна из наиболее широко используемых моделей RTM. Эта модель представляет собой интеграцию модели PROSPECT на уровне листьев и модели SAIL на уровне полога и способна имитировать отражательную способность полога с использованием свойств листьев (содержание хлорофилла и воды), структурных параметров полога (LAI и угла наклона листьев) и отражательной способности почвы [18].
PROSAIL также использовалась в сельском хозяйстве для исследования свойств сельскохозяйственных культур и почвы. Например, Casa и Jones [182] инвертировали PROSAIL и модель полога с трассировкой лучей с помощью данных гиперспектрального отражения, измеренных спектрорадиометром, и данных гиперспектрального изображения, полученных спектрометром, соответственно, для оценки LAI полога и оценки факторов, влияющих на точность оценки (неоднородная поверхность, вызванная структурой ряда культур). Richter и др. [98] использовали PROSAIL для оценки LAI, fCOVER, хлорофилла полога и содержания воды по гиперспектральным изображениям и сравнили ее производительность с другими методами (искусственной нейронной сетью). Richter и др. [183] применили PROSAIL для исследования аналогичных переменных растительности и проанализировали точность и эффективность этого метода. Wu и др. [184] исследовали чувствительность вегетационных индексов к содержанию хлорофилла в растительности, используя смоделированные результаты из модели PROSPECT, и предложили нескольких хорошо работающих индексов. Locherer и др. [74] попытались оценить LAI растительности, используя модель PROSAIL и гиперспектральные изображения из нескольких источников, и протестировали несколько методов (различные функции затрат и типы методов усреднения), используемых для процесса инверсии. Yu и др. [37] оценили диапазон переменных фенотипирования растительности (LAI и хлорофилл листьев) с использованием гиперспектральных изображений и PROSAIL и изучили чувствительность различных спектральных диапазонов к параметрам модели PROSAIL.
По сравнению с регрессионными моделями, рассмотренными в предыдущих разделах, RTM в меньшей степени использовались в литературе для исследования особенностей сельского хозяйства, главным образом из-за высокой сложности модели и вычислительной интенсивности. Например, необходимо учитывать широкий спектр параметров в RTM (хлорофилл, каротиноиды, содержание воды, индекс площади листьев, углы наклона листьев, углы солнца и коэффициент отражения почвы, наряду с другими параметрами в модели PROSAIL), и пользователям необходимо использовать различные методы (например, оценочную функцию, таблицу поиска) для облегчения прямых и инверсионных операций модели. Кроме того, для достижения прогнозов целевых переменных растительности требуется гораздо больше вычислительного времени, чем для регрессионных моделей. Однако также хорошо известно, что регрессионные модели, как правило, зависят от места и времени и не могут быть легко перенесены в другие географические регионы или в другое время [166]. В отличие от этого, RTM является более переносимым подходом, поскольку она основана на физических законах и не требует обучающих данных для восстановления модели. Кроме того, RTM способна оценивать ряд свойств растительности в одной модели, в то время как регрессионные модели обычно могут оценивать только одну переменную [36,185].
3.4. Машинное обучение и глубокое обучение
Алгоритмы машинного обучения, включая машинную регрессию опорных векторов (SVM) и RF, являются мощными инструментами для анализа гиперспектральной информации, поскольку они могут эффективно обрабатывать большое количество переменных (например, спектральное отражение и индексы растительности) [186]. Машинное обучение широко используется в области дистанционного зондирования для оценки свойств наземных объектов или классификации различных почвенных покровов [36,114,187]. Исследователи также использовали различные алгоритмы машинного обучения и гиперспектральные изображения для применения в сельском хозяйстве. SVM был широко используемым алгоритмом в предыдущих исследованиях для целей прогнозирования или классификации. Например, Honkavaara и др. [123] оценили биомассу сельскохозяйственных культур с использованием SVM и гиперспектральных изображений, полученных с помощью беспилотных летательных аппаратов. Bostan и др. [51] использовали SVM для классификации различных типов культур и достижения высокой точности классификации. Ran и др. [93] использовали классификаторы KNN и SVM для исследования методов обработки почвы на сельскохозяйственных полях и сравнивали их характеристики. RF - еще один широко используемый алгоритм для исследования сельскохозяйственных особенностей на основе гиперспектральных изображений. Например, Gao и др. [188] успешно классифицировали сорняки и кукурузу, используя RF и лабораторные гиперспектральные изображения. Используя наземные данные гиперспектрального отражения, полученные спектрорадиометром ASD, Siegmann и Jarmer [189] оценили производительность RF, SVM и PLSR для оценки LAI урожая и подтвердили хорошую производительность RF. Аналогичным образом, используя гиперспектральное отражение, Adam и др. [190] попытались обнаружить заболевание кукурузы с помощью RF модели. В целом, модели машинного обучения, как правило, обладают надежными характеристиками для исследования особенностей сельского хозяйства с использованием гиперспектральных изображений.
Глубокое обучение является подмножеством машинного обучения и расширяет машинное обучение, добавляя больше "глубины" (т.е. иерархического представления набора данных) в модель [191,192]. В последние годы это популярный подход для распознавания закономерностей на изображениях дистанционного зондирования и, следовательно, для исследования различных особенностей местности. Глубокое обучение широко используется в области дистанционного зондирования для классификации изображений, таких как классификация растительного покрова [193-195] и идентификация наземных объектов (например, здания) [196]. Глубокое обучение также применялось в точном земледелии для решения сложных проблем. Существующие исследования, например, исследование оценки урожайности с использованием СNN и мультиспектральных изображений вместе с климатическими данными [197], обнаружение болезней растений с помощью CNN и полученные на смартфон изображения [198], классификация сельскохозяйственных культур с использованием 3D CNN и разновременных мультиспектральных изображений [199], а также классификация сельскохозяйственного покрова земель с использованием глубокой рекуррентной нейронной сети и разновременных изображения SAR [200]. Kamilaris и Prenafeta-Boldu [191] рассмотрели применение глубокого обучения в области сельского хозяйства и производства продуктов питания, хотя не во всех исследованиях использовались изображения дистанционного зондирования. Singh и др. [201] рассмотрели ряд методов глубокого обучения и их применение, в частности в фенотипировании растений. До сих пор глубокое обучение не было хорошо изучено для обработки и анализа изображений дистанционного зондирования, особенно гиперспектральных изображений, для применения в сельском хозяйстве. Учитывая возможности глубокого обучения для изучения особенностей изображений и богатой информации в гиперспектральных изображениях, интеграция этих двух методов имеет широкий спектр применения в сельском хозяйстве (например, классификация сельскохозяйственных культур, мониторинг сорняков, обнаружение болезней сельскохозяйственных культур и оценка стресса растений). Необходимы дальнейшие исследования в этих областях.
Машинное обучение или глубокое обучение способно обрабатывать данные из нескольких источников и разных типов [202]. Например, помимо разнотипных изображений дистанционного зондирования (оптических, тепловых, лидарных и радиолокационных), другие источники данных, такие как погода, орошение и историческая информация об урожайности, также могут быть включены в процесс моделирования для, возможно, лучшей оценки целевых сельскохозяйственных характеристик [203]. Хотя модели машинного обучения и глубокого обучения являются мощными, также важно иметь в виду, что эти модели требуют большого количества и высококачественных обучающих образцов для достижения надежной производительности [202]. Недостаточные обучающие наборы данных или данные с проблемами (неполнота данных, шум и искажения) могут привести к нежелательным характеристикам модели.
Таким образом, различные аналитические методы (линейная регрессия, расширенная регрессия, машинное обучение и глубокое обучение, а также RTM) имеют разные уровни сложности, производительности и переносимости. Более подробные сравнения этих методов приведены в таблице 7. В целом, линейная регрессия является самым простым методом в использовании, и ее производительность в целом приемлема, хотя на этот метод может сильно влиять выбор переменных-предикторов и качество выборочных данных. Расширенная регрессия (например, PLSR) в основном работает лучше, чем линейная регрессия, поскольку она включает несколько переменных в модели и менее чувствительна к шуму данных. RTM (например, PROSAIL) способна создавать несколько продуктов данных (например, хлорофилл, вода и LAI) с достаточно высокой точностью. Одним из существенных преимуществ этого метода является его высокая переносимость. Однако этот метод обладает наибольшей сложностью, так как требует широкого диапазона параметров и обширного программирования. С точки зрения машинного обучения, многие алгоритмы, такие как RF и SVM, хорошо зарекомендовали себя и в основном хорошо работали в предыдущих исследованиях. Для достижения оптимальной производительности этого метода необходимы некоторые настройки программирования и модели. Глубокое обучение - относительно новый метод, который в последние годы становится все более популярным. Соответствующий дизайн модели и программирование имеют решающее значение для этого подхода. Это также требует значительного объема обучающих данных и вычислительных ресурсов для достижения хорошей производительности модели.
Таблица 7. Сравнение различных аналитических методов