Метод классификации для идентификации рапса и сорняков с использованием гиперспектральной визуализации

+7 906 644 66 80 _____info@gisproxima.ru

Метод классификации для идентификации рапса и сорняков с использованием гиперспектральной визуализации

Рапс является важным источником пищевого масла, занимая первое место среди пяти основных масличных культур. Китай — главный производитель рапса в мире, а площади посева и урожайность рапса занимают первое место в мире. Однако сорняки наносят большой вред рапсу в процессе его роста. Традиционная химическая прополка загрязняет агроэкологическую среду, а эффективность использования гербицидов относительно низка. Поэтому ключ к правильной идентификации сорняков заключается в обеспечении точного распыления гербицидов.

Технология гиперспектральной визуализации — это новая технология, объединяющая обработку изображений и спектральный анализ. Данные изображения позволяют достоверно отобразить поверхностные повреждения и внешние характеристики сельскохозяйственных культур, в то время как спектральные данные отражают их внутреннюю структуру и состав. Поэтому в последние годы технология гиперспектральной визуализации всё чаще применяется для классификации и идентификации сорняков, а также для неразрушающего контроля качества сельскохозяйственной продукции.

В данной работе используется несколько методов предварительной обработки и методов выделения характерных длин волн для обработки гиперспектральных изображений полога рапса и сорняков, а также строятся модели классификации на основе полного спектра и характерных длин волн соответственно. Путём анализа и сравнения результатов различных моделей классификации можно получить влияние разных сроков съёмки спектров и разных сортов рапса на классификацию и идентификацию сорняков.

1. Экспериментальная часть

1.1 Образцы

Образцы рапса и четыре вида сорняков, использованные в эксперименте: Echinochloa crus-galli (ежовник обыкновенный), Hemeng (Amaranthus —щирица), Ramulus velutipes (канатник Теофраста, Abutilon theophrasti) и Bidens pilosa (череда облиственная). Все это распространённые виды сорняков, оказывающие большое влияние на полях рапса и имеющие схожий с рапсом цикл роста. На рисунке 1 показаны изображения образцов, использованных в эксперименте.

1.2 Получение спектральных изображений

Использовалась гиперспектральная камера в диапазоне 400–1000 нм. Для соответствующих исследований можно использовать продукт FS13 компании Hangzhou Caipu Technology Co., Ltd. Спектральный диапазон составляет 400–1000 нм, разрешение по длинам волн лучше 2,5 нм, количество спектральных каналов — до 1200. Скорость сбора может достигать 128 кадров/с в полном спектре, а после выбора диапазонов максимальная скорость — 3300 Гц (поддерживается выбор диапазонов в нескольких областях).

Сбор гиперспектральной информации рапса и сорняков был разделён на три временных точки, обозначенных как 1, 2 и 3. Кроме того, в процессе каждого сбора данных, поскольку рапс и сорняки находятся в фазе роста, необходимо регулировать внутренние параметры, такие как время экспозиции камеры и высота съёмки, для получения гиперспектрального изображения с наименьшими искажениями. В таблице 1 приведены внутренние параметры гиперспектрального формирователя изображения в ходе трёх экспериментов.

1.3 Выделение признаков из данных

Для изучаемых гиперспектральных изображений рапса и сорняков выделялась область интереса (ROI) для каждого растения, в качестве ROI принималась вся область образца после удаления фона. Вычислялся и статистически обрабатывался средний спектр для каждой полосы в ROI для последующего преобразования спектра при обработке данных. Один из принципов выделения ROI — максимально удалить области, не относящиеся к пологу растений, чтобы добиться высокой степени сегментации изображения полога и фона. Метод сегментации полога следующий:

(1) Анализируется и сравнивается спектральная информация, соответствующая пикселям в области ROI и вне ROI, находится диапазон длин волн, позволяющий различать эти точки, в итоге выбирается изображение на длине волны 800 нм в качестве маски, и устанавливается порог для бинаризации с целью построения маски;

(2) На маскированном изображении фоновая область становится равной 0, а область информации об образце — 1, затем исходное гиперспектральное изображение маскируется, достигая тем самым удаления фоновой области. На рисунке 2 показан процесс получения ROI на основе псевдоцветного RGB-изображения по трём диапазонам гиперспектральных длин волн 662, 554 и 450 нм.

1.4 Методы обработки данных

1.4.1 Методы предварительной обработки

Для предварительной обработки гиперспектральных данных образцов использовались нормализация с переменным преобразованием (normal variable transformation), удаление тренда (detrending), мультипликативная коррекция рассеяния (multiplicative scatter correction), сглаживание скользящим средним (moving average smoothing), сглаживание полиномом (polynomial convolution smoothing), коррекция базовой линии (baseline correction) и нормализация (normalization).

1.4.2 Методы выделения характерных длин волн

Для выделения характерных длин волн использовались метод нагрузок главных компонент (principal component load), метод коэффициентов нагрузок (load coefficient method), метод регрессионных коэффициентов (regression coefficient method) и метод последовательных проекций (successive projections algorithm, SPA). Метод нагрузок главных компонент выбирает характерные длины волн главным образом потому, что значения нагрузок при различных главных компонентах указывают на различную важность длин волн. Поэтому пиковые и впадинные значения на графике нагрузок главных компонент выбираются в качестве характерных длин волн. Метод коэффициентов нагрузок (x-LW) выбирает характерные длины волн в соответствии с кривой x-LW, где длины волн с большим абсолютным значением и пиком являются характерными. Пики, впадины и точки перегиба на кривой RC являются характерными длинами волн, выбранными методом регрессионных коэффициентов [12]. SPA анализирует множественные последовательные проекции векторов, содержащихся в наборе данных, для уменьшения избыточности данных и повышения эффективности и скорости вычислений.

2. Результаты и обсуждение

2.1 Усреднённые спектральные кривые рапса и сорняков

Были собраны данные ближнего инфракрасного спектра для 512 каналов в диапазоне длин волн 380–1034 нм. Поскольку шум очевидно влияет на начальную и конечную части спектра, шумные диапазоны в начале и конце были удалены, и для анализа использовался спектр из 380 каналов в диапазоне 453–934 нм. Усреднённые кривые спектров отражения рапса и сорняков представлены на рисунке 3. Как видно из рисунка, рапс и четыре вида сорняков имеют схожие тенденции, кривые сорняков более разбросаны, Bidens pilosa и рапс перекрываются, но имеется явное различие в отражательной способности на пике 550 нм.

Образцы были разделены на обучающую и прогнозную выборки в соотношении 3:1. В обучающую выборку вошли 72 образца рапса и 48 образцов сорняков, в прогнозную — 24 образца рапса и 16 образцов сорняков. Следует отметить, что в обучающую выборку входило по 12 образцов каждого из четырёх видов сорняков, а в прогнозную — по 4 образца каждого.

2.2 Качественный анализ методом главных компонент (PCA)

Метод главных компонент, применённый к спектральным данным рапса и сорняков, показал, что совокупный вклад PC1 и PC2 в трёх экспериментах составил 99%, и PC1 с PC2 могли объяснить большую часть переменных [4]. Распределение главных компонент для трёх экспериментов показано на рисунке 4. Как видно из рисунка, рапс и сорняки сгруппированы на графике счетов, что дополнительно показывает, что рапс и сорняки могут быть эффективно идентифицированы. Далее мы продолжим использовать спектральные данные для анализа и обработки.

2.3 Результаты классификации и идентификации на основе полного спектра

Спектры были предварительно обработаны методом удаления тренда (detrending), и на основе трёх алгоритмов было выполнено моделирование по полному спектру. Точность распознавания приведена в таблице 3. Как показано в таблице 3, эффективность классификации алгоритма PLS во втором испытании не достигла 90,00%, тогда как алгоритмы SVM и ELM показали лучшие результаты, особенно алгоритм ELM, который дал наилучшую точность классификации, достигнув 100,00% во всех трёх испытаниях.

2.4 Результаты классификации и идентификации по характерным длинам волн

На основе предварительной обработки удалением тренда (detrending) в качестве входных переменных использовались значения отражения, соответствующие характерным длинам волн, выделенным четырьмя вышеуказанными методами. Поскольку дискриминационная эффективность модели ELM на основе полного спектра оказалась лучше в разных сериях экспериментов, модель дискриминационного анализа ELM была построена на основе характерных длин волн. Результаты классификации приведены в таблице 4.

Как видно из таблицы 4, все четыре метода выделения дали относительно хорошие результаты классификации. Эффективность классификации распознающей модели, построенной по характерным длинам волн, выделенным методами PCA loadings, x-loading weights и SPA, оказалась очень высокой. Эффективность классификации как для обучающей, так и для прогнозной выборки достигла 100,00%.

24 марта / 2026