Оставьте свой номер и мы с вами свяжемся!
Или Вы можете позвонить нам сами:
+7 902 934 71 72

Новейший метод эффективного извлечения оптимальных спектральных характеристик биомассы пшеницы из данных гиперспектрального изображения

Краткое содержание

Гиперспектральное изображение предоставляет большой объем информации, часть которой может быть избыточной. Поэтому уменьшение размерности информации с помощью методов выбора признаков становится важным. Здесь мы предложили новый метод, названный методом наименьших квадратов синергетического интервала (SIPLS) с алгоритмом последовательных проекций (SPA) (SIPLS-SPA), объединяющий SIPLS и SPA, для эффективного извлечения оптимальных спектральных характеристик биомассы пшеницы из данных гиперспектрального изображения. В этом исследовании гиперспектральные изображения и биомасса листьев были получены в результате двухлетних полевых экспериментов с пшеницей с различными дозами азота, плотностью посадки и сортами. Результаты показали, что восемь длин волн (706, 724, 734, 806, 808, 810, 812 и 816 нм) были выбраны в качестве чувствительных входных переменных для создания модели частичной регрессии наименьших квадратов (PLSR) для биомассы листьев пшеницы. Модель биомассы SIPLS-SPA работала лучше с более высоким Rc2 (0,79) при калибровке, более низким RMSEv (0,059 кг/м2) и RRMSEv (38,55%) при проверке. По сравнению с другими современными методами выбора признаков метод SIPLS-SPA обеспечивает значительно меньше несвязанных коллинеарных спектральных переменных и продемонстрировал многообещающее применение с точки зрения меньшей общей сложности, меньшей вычислительной сложности и более короткого времени выполнения. Кроме того, эта работа демонстрирует потенциал метода SIPLS-SPA для извлечения других признаков растений из гиперспектральных данных в будущих сельскохозяйственных приложениях.

Введение

Сельскохозяйственная растительность является важным компонентом глобальной наземной экосистемы, занимая более 15% площади земной суши (Loveland et al., 2000) и внося большой процент в общую наземную первичную продуктивность. Кроме того, биомасса листьев растений известна как ключевой параметр для определения состояния роста растений (Clevers, 1999), а также может служить хорошим индикатором изменения климата, безопасности пищевых продуктов и состояния удобрений (Zhao et al., 2017). В связи с текущими опасениями и прогнозируемым воздействием глобального изменения климата на функционирование экосистем тем более необходимо осуществлять мониторинг биомассы растительности. Тем не менее традиционные наземные подходы, основанные на отборе проб, отнимают много времени, трудоемки и затрудняют эффективную оценку пространственных и временных вариаций биомассы на больших участках земли. Учитывая эти ограничения, использование дистанционного зондирования обладает очевидным преимуществом, с помощью которых можно получить большой объем информации о биомассе сельскохозяйственных культур неразрушающим, быстрым и точным способом (Kumar et al., 2015).

Гиперспектральное дистанционное зондирование, получающее непрерывную спектральную информацию в узких диапазонах длин волн, могло бы предоставить гораздо более богатую информацию о характеристиках сельскохозяйственных культур (Jacquemoud et al., 2009). Полезно идентифицировать спектрально уникальные материалы и обнаруживать разнообразие биохимических параметров. Однако использование полных длин волн в качестве входных переменных приносит много шума и избыточной информации, в то же время неизбежно увеличивая нагрузку на обработку данных и увеличивая стоимость инструментов, а также сложность приложений. Кроме того, из-за негативного влияния, вызванного высокой коллинеарностью и избыточностью информации в гиперспектральных данных, точность и надежность классификации или прогностических моделей могут быть подвержены риску снижения из-за шума и фона. Понятно, что было предложено выбрать небольшой набор чувствительных признаков, передающих основную информацию о данных, для извлечения биохимических и биофизических параметров растений.

Предыдущие исследования в основном были сосредоточены на определенных длинах волн с острыми пиками или на классических опубликованных вегетационных индексах (VI) с сильными статистическими различиями между образцами для мониторинга признаков растений (Hansen and Schjoerring, 2003). Однако для конкретных длин волн или вегетационных индексов обычно используется коэффициент отражения ограниченных диапазонов, игнорируя гиперспектральную информацию, содержащуюся в других диапазонах, что может привести к низкой точности, плохой применимости и неопределенности характеристик. Таким образом, улучшение процесса выделения признаков в основном зависит от точности и эффективности выбора признаков. Заметный прогресс был достигнут с использованием алгоритмов выбора признаков, перечисленных в таблице 1 (Montesinos-López et al., 2017; Montesinos-López et al., 2018).

Плюсы и минусы нескольких алгоритмов выбора признаков.
Несмотря на прогресс, достигнутый в определенных контекстах, перечисленные алгоритмы явно далеки от совершенства. Действительно, для выбора оптимальных признаков был разработан и эффективно применен алгоритм наименьших квадратов синергетического интервала (SIPLS) или алгоритм последовательных проекций (SPA) (Araújo et al., 2001). SIPLS — это тест процедуры комбинации всех возможных интервалов, основанный на всех возможных PLSR на всех подмножествах интервалов. Кроме того, он не только обеспечивает обзор спектральных данных, но также отображает графические данные о выбранных интересных спектральных областях. SIPLS может обеспечить непрерывность выбранных длин волн, что делает производительность стабильной. Однако в исследованиях с использованием SIPLS положение и длина интервала были зафиксированы в каждом исследовании, что позволяет предположить, что в этих результатах сохранялась бесполезная информация и коллинеарность (Guo et al., 2011). В то время как SPA построен на алгоритмах поиска конечных элементов выпуклой геометрии, включая ограничение на пространственную смежность пикселей-кандидатов конечных элементов. Следовательно, этот подход может снизить восприимчивость к выбросам пикселей и создать реалистичные конечные элементы (Zhang et al., 2008). Между тем, SPA стремится выбирать переменные с минимальной коллинеарностью среди всех данных, что обеспечивает более воспроизводимые результаты, чем те, которые обеспечиваются другими алгоритмами. Но для исследований с использованием SPA выбранные переменные могут иметь низкое отношение сигнал-шум (S/N) с меньшей коллинеарностью (Ouyang et al., 2015).

Чтобы преодолеть эти недостатки и способствовать выбору функций гиперспектральных данных, мы предложили новый гибридный метод, названный SIPLS-SPA. В частности, выбранные оптимальные спектральные характеристики были определены как интересующая переменная, которые используются для создания более точной и стабильной модели мониторинга биомассы листьев пшеницы. Мы также сравнили производительность предложенного метода с эффективностью SIPLS, SPA и полной длины волны по отдельности. Точность, надежность и практичность рассматривались как показатели эффективности для оценки выбранных признаков и построенной гибридной модели. Результаты этого исследования обеспечат эффективный и эмпирический ориентир для определения признаков растений в аналогичных будущих исследованиях сельскохозяйственных культур в сельском хозяйстве.

2. Материалы и методы

2.1. Опыты с пшеницей

Это исследование включало два полевых эксперимента, проведенных в Ругао (32°15′ северной широты, 120°38′ восточной долготы) в провинции Цзянсу, восточный Китай. Обработка, применяемая в каждом эксперименте, состояла из различных доз азотных (N) удобрений, сортов и густоты посадки (т.е. расстояния между рядами) озимой пшеницы. Каждый эксперимент состоял из рандомизированного полного блочного дизайна с тремя репликациями и 36 делянками. Каждый участок был одинакового размера 5 м × 6 м. Для всех обработок перед посевом на все участки вносили достаточное количество монокальций фосфата (Ca(H2PO4)2) и хлорида калия (KC1). Семена Опыта 1 (Опыт 1) и Опыта 2 (Опыт 2) были высеяны 5 ноября 2013 г. и 2 ноября 2014 г. отдельно. Управление посевами во время экспериментов соответствовало местным стандартам выращивания пшеницы. Калибровочные данные Эксперимента 2 использовались для калибровки модели для оценки биомассы листа, а набор проверочных данных Эксперимента 1 использовался для оценки чувствительности и точности гибридной модели. Дополнительные сведения об экспериментальных планах приведены в таблице 2.

Таблица 2
Подробная информация о двух полевых экспериментах и сборе данных.

2.2. Получение гиперспектральных изображений

Все гиперспектральные данные были получены с помощью системы гиперспектральной съемки (GaiaField-V10E, Sichuan Dualix Spectral Image Technology Co. Ltd, Китай), которая состоит из визуализирующего спектрометра Imspector V10E (Spectra Imaging Ltd., Оулу, Финляндия) и контрольного модуля. Спектрометр состоит из ПЗС-камеры и спектрографа видимого и ближнего инфракрасного (БИК), который охватывает спектральный диапазон от 380 до 1030 нм. Модуль управления содержал компьютер с программным обеспечением для сбора данных и электрическую платформу перемещения. Гиперспектральные данные были собраны на высоте 1,0 м над пологом пшеницы при ясном небе между 10:00 и 14:00 (по пекинскому времени) на значительных стадиях роста растений (рис. 1).

2.3. Предварительная обработка данных гиперспектрального изображения

Процесс предварительной обработки изображения проходил следующим образом (рис. 2). Необработанное изображение было установлено как Ro, которое содержит изображение стандартной интенсивности света, белое эталонное изображение (Rw) и темное изображение (Rd). Во-первых, изменения интенсивности света, вызванные погодой, были скорректированы с использованием снимка при стандартной интенсивности света. Белое изображение было получено путем сканирования стандартной белой пластины (ее коэффициент отражения близок к 100%). Калиброванное изображение (R) было рассчитано по уравнению. (1).

Затем для уменьшения шума отражения мы использовали минимальное вращение доли шума (MNF) (подробнее https://www.l3harrisgeospatial.com/Support/Self-Help-Tools/Help-Articles/Help-Articles-Detail/ArtMID/10220/ArticleID/19433/2763) . Наконец, метод SVM (Support vector machines (SVMs) are a set of supervised learning methods used for classification, regression and outliers detection) (Melgani and Bruzzone, 2004), широко используемый для классификации изображений, был применен для выделения области интереса (ROI) пшеницы. Средняя отражательная способность ROI определялась как спектры растительности.
2.4. Определение биомассы листьев пшеницы

После измерения отражательной способности растительного покрова было собрано 30 образцов растений пшеницы, которые были немедленно доставлены в лабораторию для определения биомассы листьев (кг/м2) на каждом участке. Для всех образцов все зеленые листья отделяли от стеблей, затем сушили в печи при 105 °С в течение 30 мин и при 80 °С в течение 48 ч до постоянной массы. При этом также подсчитывалось количество побегов на квадратный метр (м2) на всех участках. Биомасса листьев пшеницы (кг/м2) рассчитывалась как биомасса листьев на растение, умноженная на измеренное число побегов на 1 м2.

1. Полные длины волн (400–1000 нм) были разделены на P равных интервалов (25–50). Например: если длины волн (400–1000) разделить на 6 интервалов, каждый интервал соответствует: 400–500 нм, 501–600 нм, 601–700 нм, 701–800 нм, 801–900 нм и 901– 1000 нм.

2. Модели PLSR были построены с использованием интервалов Q (Q = 2, 3, 4) с соответствующей биомассой листьев.

3. Повторные шаги (1) и (2), значения P и Q были определены с использованием минимальной RMSECV (среднеквадратическая ошибка перекрестной проверки) моделей PLSR.

4. Спектральная матрица чувствительного признака была получена в соответствии с определенными P и Q, которые были установлены как X (N * J, где N — количество образцов, а J — количество спектральных переменных).

5. Столбец был выбран случайным образом как Xj; остальные были определены как S.

6. Соответственно вычислялась проекция Xj на S. Максимальная проекция S представляла минимальную корреляцию, и соответствующий столбец был определен как Xi.

7. Установите Xi вместо Xj и повторите шаги (5) и (6) до тех пор, пока количество выбранных переменных не достигнет заданного значения M (M — диапазон итераций, а M≤J). Значение M было задано несколькими вычислениями данных. В этом исследовании М равнялось 20.

8. Модель множественной линейной регрессии (MLR) была подобрана с выбранными переменными и соответствующей биомассой. Наконец, оптимальные переменные были выбраны в соответствии с минимальным RMSEv (среднеквадратичная ошибка проверки) MLR.

2.5. Оценка SIPLS-SPA и выбранных переменных

Как производительность метода выбора переменных SIPLS-SPA, так и выбранные чувствительные признаки оценивались на основе производительности моделей биомассы с чувствительными спектрами, выбранными в качестве входных переменных. Эффективность модели оценивалась по ее точности, надежности и практичности (табл. 3).

Для сравнения точности и надежности использовали коэффициент детерминации (Rc2, Rv2; см. уравнения (2), (3)), среднеквадратичная ошибка (RMSEc, RMSEv; см. уравнение (4)), относительное среднее значение квадратичной ошибки (RRSEc, RRMSEv; см. уравнение (5)) в наборах данных калибровки и проверки отдельно. Практичность модели включала время работы (с), количество параметров, уровень сложности и вычислительную сложность.

где Yi — измеренное значение выборки i, Mi — предсказанное значение выборки, X — среднее падение Xi, Y — среднее падение Yi, а n — количество использованных выборок. Все алгоритмы запускались в среде Matlab R2014a.

3. Результаты

3.1. Изменения отражательной способности растительного покрова и взаимосвязь с биомассой листьев пшеницы при различных дозах азотных удобрений

Например, данные Shengxuan 6 при различных нормах азота в Exp.2 были использованы для анализа изменения отражательной способности полога (рис. 3A). Эти результаты показали, что нормы внесения азотных удобрений значительно повлияли на отражательную способность растительного покрова. В частности, он уменьшался в видимой области с увеличением количества внесения азота из-за увеличения поглощения пигментов; однако в ближнем ИК-диапазоне он увеличился из-за воздействия влаги и структуры полога.

Дальнейший анализ взаимосвязи между биомассой листьев пшеницы и отражательной способностью растительного покрова представлен на рис. 3В. Отрицательные корреляции наблюдались в видимой области (480–720 нм) для коэффициента отражения растительного покрова, тогда как положительные корреляции наблюдались в ближней ИК области (720–900 нм), которая представляла собой довольно плоскую кривую с более высоким коэффициентом корреляции (максимальный коэффициент корреляции = 0,6).

3.2. Определение параметров метода SIPLS-SPA

Чувствительные признаки биомассы листьев пшеницы были извлечены с использованием метода SIPLS-SPA. В соответствии с процедурами, описанными в разделе 2.4, и повторным тестированием полный спектр разбивался на количество до 50 интервалов, затем модели PLSR строились на интервалах Q (Q = 2, 3, 4) для каждого случая. Выполнив шаги (1)–(4) в разделе 2.4, RMSECV каждой модели PLSR был успешно получен. Эти результаты показали, что наилучшая модель PLSR с наименьшим значением RMSECV была получена при условии P = 37 и Q = 4 (рис. 4). Это означает, что, когда вся спектральная область была разделена поровну на 37 интервалов, модель PLSR, построенная с четырьмя интервалами (22, 24, 30 и 37), работала лучше всего.

3.3. Чувствительная особенность биомассы листьев пшеницы, выбранная SIPLS-SPA

Соответствующие спектральные области четырех интервалов, выбранных с помощью SIPLS, составляли 694–706 нм, 722–734 нм, 806–816 нм и 890–900 нм, всего с 44 переменными длины волны. Затем путем повторного тестирования значение М было определено равным 20. Наконец, путем повторного выполнения шагов (5)–(8) оптимальные гиперспектральные переменные были определены как 706, 724, 734, 806, 808, 810, 812, и 816 нм (рис. 5). Эти полосы были названы «оптимальной гиперспектральной характеристикой» биомассы листьев пшеницы.

3.4. Калибровка и проверка моделей биомассы, построенных на оптимальной гиперспектральной функции

Калибровочная модель биомассы листьев пшеницы на пяти стадиях роста была создана с входными переменными, выбранными SIPLS-SPA (рис. 6А). Затем модель была проверена независимым набором данных Exp. 1. На рис. 6B показаны графики рассеяния измеренной биомассы листьев пшеницы по сравнению с предсказанной в эксперименте 2 на шести значительных стадиях роста.

3.5. Сравнение с другими методами выбора признаков

Эффективность недавно разработанного SIPLS-SPA оценивали в сравнении с традиционно разделенными методами SIPLS и SPA. Кроме того, модели PLSR, основанные на различном количестве чувствительных признаков, извлеченных с помощью этих алгоритмов, также оценивались с точки зрения их точности, надежности и практичности (количество переменных, время обучения, уровень сложности и вычислительная сложность).

3.5.1. Различные входные переменные, выбранные каждым методом

Чувствительные переменные извлекаются SPA и SIPLS из одного и того же

наборы данных, использованные для SIPLS-SPA, показаны в таблице 4. Результаты показали, что чувствительные признаки, выбранные SIPLS для биомассы листьев пшеницы, составляли 694–706, 722–734, 806–816 и 890–900 нм, в то время как полученные с помощью SPA были 726, 744, 758, 816 и 830 нм. Короче говоря, было обнаружено, что чувствительные функции, выбранные SIPLS, больше, чем SPA и SIPLS-SPA.

3.5.2. Точность и надежность моделей, построенных с различными выбранными переменными

Чувствительный признак, выбранный с помощью SPA, SIPLS и SPA-SIPLS, использовался в качестве входных переменных для построения моделей PLSR для биомассы листьев пшеницы. Их соответствующие точность и надежность были обобщены в таблице 5. Эти результаты показали, что Rc2 для модели SIPLS и полноволновой модели был максимальным (0,84), за которым следовал показатель для SPA и SIPLS-SPA. Однако максимальное значение Rv2 было получено по модели SIPLS-SPA (Rv2 = 0,67), а минимальное — по модели SIPLS. Кроме того, модель, построенная с использованием чувствительного признака, выбранного SIPLS-SPA, дала самые низкие значения RMSEv (0,059 кг/м2) и RRMSEv (38,55%).

3.5.3. Осуществимость моделей, построенных с использованием различных выбранных переменных.

Для оценки осуществимости моделей PLSR с различными чувствительными характеристиками использовались три показателя (время, уровень сложности и вычислительная сложность) (табл. 6). Эти результаты показали, что время работы модели SPA было самым коротким, за ней следовала SIPLS-SPA, тогда как она была самой длинной для модели с полной длиной волны. Уровень сложности и вычислительная сложность матриц для SPA и SIPLS-SPA были одинаковыми и низкими, но полноволновая модель была самой сложной среди всех моделей оценивания.

4. Обсуждение

4.1. Оценка оптимальной гиперспектральной характеристики


Чувствительные характеристики, извлеченные SIPLS-SPA, составляли 706, 724, 734, 806, 808, 810, 812 и 816 нм, что согласуется с тем, что было обнаружено в более ранних исследованиях (Yoder and Waring, 1994). 706, 724 и 734 нм относятся к красной области и являются основными полосами поглощения фотосинтеза зеленолистными растениями. Было обнаружено, что существует сильная корреляция между коэффициентом отражения в красной области (550–750 нм) и биомассой растительности (Todd et al., 1998). 806, 808, 810, 812 и 816 нм относятся к NIR-области, для которой поглощение энергии света постепенно уменьшается по мере того, как начинает увеличиваться отражение. Сообщалось, что коэффициент отражения в NIR более чувствителен к биомассе растений (Hansen and Schjoerring, 2003). По сравнению с исследованиями, упомянутыми выше, чувствительная функция, выбранная SIPLS-SPA, расположена как на красной границе, так и в области NIR. Наиболее правдоподобным объяснением этого результата является то, что коэффициент отражения в NIR более чувствителен к биомассе листьев пшеницы. Чувствительная особенность, полученная с помощью SIPLS-SPA в этом исследовании, может быть полезна для разработки портативных приборов или полевых датчиков для мониторинга состояния роста сельскохозяйственных культур в точном земледелии.

4.2. Оценка метода SIPLS-SPA

Теоретически и SIPLS, и SPA работают с дополнительными преимуществами, но каждый из них имеет определенные недостатки. Хотя SIPLS может помочь выбрать эффективные и стабильные спектральные интервалы, или, например, красный край был спектральным интервалом для получения достойной модели, SIPLS может сохранять бесполезную и коллинеарную информацию в небольших подинтервалах (Kang et al., 2016). SPA — это новый алгоритм выбора переменных, который решает проблемы коллинеарности и использует простую операцию проекции в векторном пространстве для выбора подмножеств переменных с минимальной коллинеарностью (Araújo et al., 2001). Но переменные с низким значением S/N могут быть выбраны SPA, что также может повлиять на производительность модели. К счастью, недостатки этих двух методов можно компенсировать друг другом. Таким образом, SIPLA-SPA, объединяющая SIPLS и SPA, позволяет не только выбрать меньшее количество несвязанных и коллинеарных переменных, но и значительно упростить калибровочную модель, повысить ее точность и стабильность. По этой причине гибридная модель SIPLS-SPA может получать стабильные, надежные и воспроизводимые чувствительные переменные, которые минимально избыточны для гибридной модели оценки (Ouyang et al., 2015).

Чтобы проверить, охватывает ли выбранная чувствительная функция большую часть информации о полном спектре, не пропуская при этом некоторую важную информацию для мониторинга биомассы листьев пшеницы, в этом исследовании сравнивалась установленная модель PLSR с использованием выбранной функции с моделью с использованием полных длин волн (таблица 5). Точность модели PLSR, основанной на чувствительном признаке, выбранном SIPLS-SPA, была аналогична точности для полных длин волн. Однако стабильность и практичность моделей PLSR, включающих чувствительный признак, выбранный SIPLS-SPA, были лучшими, что позволяет предположить, что модель, построенная SIPLS-SPA, работала более стабильно. В значительной степени эти результаты убедительно показали, что чувствительные переменные, извлеченные с помощью SIPLS-SPA, могут представлять основную информацию о полных длинах волн для этого исследования.

В предыдущих исследованиях, в отличие от моделей, основанных на всех полосах, подмножество предикторов не всегда давало лучшие результаты с точки зрения точности предсказания. В некоторых исследованиях было возможно, что они работают одинаково, например, в настоящем исследовании и при сравнении с ВИ (Hansen and Schjoerring, 2003; Montesinos-López et al., 2017). Иногда использование выбранных признаков или ансамбля множественного отбора может дать лучшие результаты (Yao et al., 2015). Тем не менее, во всех относительных исследованиях было последовательно, что модели, основанные на выбранном признаке, были более экономичными и более эффективными в вычислительном отношении, поскольку использование предиктора подмножества может уменьшить размерность каналов, а также снизить вычислительные затраты. Таким образом, приемы отбора признаков могут способствовать развитию точного земледелия.

4.3. Факторы, учитываемые при выборе оптимальной функции модели

При выборе оптимального признака или переменных с помощью алгоритма разработки модели обычно учитываются несколько аспектов: точность, надежность и практичность (время обучения, количество параметров, линейность, уровень сложности и вычислительная сложность). В большинстве случаев основное внимание уделяется тому, как добиться высокой точности. Точность калибровочной модели SIPLS-SPA была немного хуже, чем у моделей SIPLS и полных длин волн, но незначительно (таблица 6). Однако надежность модели SIPLS-SPA была наилучшей. Тем не менее, получение наиболее точного прогноза может и не понадобиться. Иногда достаточно устойчивой аппроксимации, в зависимости от целей модели (т. е. того, для чего вы хотите ее использовать). Между тем, использование более приближенных методов, естественно, позволяет избежать переобучения. Для гиперспектральных данных также важно время обучения, которое сильно различается между существующими алгоритмами. Как показано в Таблице 6, время обучения SIPLS-SPA было короче, чем у SIPLS и полных длин волн. Как правило, время обучения часто тесно связано с точностью. Когда время ограничено, это может повлиять на выбор алгоритма, особенно когда набор данных довольно большой. Еще одно соображение заключается в том, что многие алгоритмы машинного обучения предполагают, что модель является линейной, потому что линейная модель проста и может быть быстро стереотипизирована. Алгоритмы линейной регрессии предполагают, что все тренды данных следуют прямой линии, что в некоторых случаях хорошо работает. Однако для данных нелинейного тренда это допущение может привести к большей ошибке и снизить точность модели. Кроме того, на производительность алгоритмов будет влиять количество параметров, таких как устойчивость к ошибкам, количество итераций и время обучения. Обычно алгоритм с большим количеством параметров требует много проб и ошибок, чтобы найти хорошие комбинации. В то время как большее количество параметров сделает алгоритм более гибким, что поможет получить лучшее поведение. Хотя SIPLS-SPA выбрал более чувствительную функцию, чем SPA, меньшую, чем SIPLS, и полные длины волн, но уровень сложности и вычислительная сложность были низкими. Таким образом, SIPLS-SPA может выбрать чувствительный признак, представляющий полные длины волн, благодаря чему установленная модель PLSR в целом работает лучше, чем другие, для мониторинга биомассы листьев пшеницы. Суммируя, при выборе алгоритма мы должны всесторонне рассмотреть все аспекты модели.

5. Заключение

В этом исследовании был предложен недавно разработанный вычислительный метод SIPLS-SPA, объединяющий два метода SIPLS и SPA, для извлечения чувствительных признаков из гиперспектральных изображений для определения биомассы листьев пшеницы. Восемь длин волн (706, 724, 734, 806, 808, 810, 812 и 816 нм), выбранных с помощью ансамблевого метода SIPLS-SPA, считались оптимальными гиперспектральными признаками, которые служат входными переменными для установления PLSR. модель для оценки биомассы листьев озимой пшеницы. Выбранный признак и построенная модель биомассы работали лучше, чем другие современные методы выбора признаков, с меньшим количеством несвязанных, коллинеарных, простых выбранных переменных, а также с меньшей сложностью, меньшей вычислительной сложностью и более коротким временем выполнения. В целом, наши результаты показывают, что SIPLS-SPA является мощным методом выбора гиперспектральных признаков для оценки признаков растений в сельском хозяйстве.

21 февраля / 2022