Эффективность SID как меры спектрального подобия для получения спектров сельскохозяйственных культур из гиперспектральных изображений

Hasmukh J. Chauhan1 • B. Krishna Mohan2
Аннотация
Настоящее исследование было проведено с целью проверки эффективности метода спектральной дивергенции (SID) для построения спектров по изображениям для классов сельскохозяйственных культур на основе спектрального сходства с полевыми спектрами. В многоспектральном и гиперспектральном дистанционном зондировании классификация пикселей достигается путем статистического сравнения (по спектральному сходству) известных полевых или библиотечных спектров со спектрами неизвестных изображений. Хотя эти алгоритмы широко используются, мало внимания уделяется использованию различных мер спектрального сходства для построения спектров сельскохозяйственных культур по самим изображениям. Следовательно, в данном исследовании предложена методология построения спектров сельскохозяйственных культур на основе SID. Характеристики поглощения уникальны и различимы; следовательно, валидация разработанных спектров проводится с использованием характеристик поглощения путем сравнения их с полевыми спектрами и нахождения среднего коэффициента корреляции r = 0,982 и вычисленного эквивалента SIDr = 0,989. Эффективность разработанных спектров для классификации изображений была рассчитана с помощью вероятности спектральной дискриминации (PSD) и привела к более высокой вероятности для спектров, разработанных на основе SID. Классификация изображений проводилась с использованием спектров поля и спектров, присвоенных SID. Общая точность классификации изображения, классифицированного по спектрам поля, составила 78,30%, а для изображения, классифицированного по спектрам, присвоенным с помощью подхода на основе SID, – 91,82%. Z-тест показывает, что классификация изображений, проведенная с использованием спектров, разработанных SID, лучше, чем классификация, проведенная с использованием спектров поля, и существенно отличается.
Валидация по характеристикам поглощения, эффективность по спектральной плотности мощности (PSD) и более высокая точность классификации показывают возможность нового подхода к разработке спектров, основанного на мере спектрального сходства SID.

Ключевые слова: Спектральное сходство, Вероятность спектрального различения (PSD), Визуально неразделимые классы

Введение

 Показатели спектрального сходства успешно применяются для дифференциации растительности и окружающей почвы (Chang, 2000; Du et al., 2004), для дифференциации спектральных характеристик минералов (Van der Meer, 2005) и для разделения типов сельскохозяйственных культур (Kong Xiangbing et al., 2010). В настоящем исследовании мера спектрального подобия эффективно используется для определения сходства между спектрами полей и спектрами конечных элементов, полученными на основе изображения, для разработки спектров сельскохозяйственных культур. Ван дер Меер (2005) использовал вероятность спектрального различения (PSD) для оценки производительности преобразователя спектрального угла (SAM), преобразователя спектральной корреляции (SCM), евклидова расстояния (ED) и расхождения спектральной информации (SID). PSD отображает способность выбранного набора спектров отображать целевой спектр.

В этом исследовании, основанном на PSD, было обнаружено, что SID более эффективно отображает несоответствие между двумя пиксельными векторами. Следовательно, для точного определения расхождения между двумя пиксельными векторами в качестве средства оценки спектрального сходства используется SID (Chang, 2000). Оценщик SID рассчитывает сходство между распределениями вероятностей.

Таким образом, SID вычисляет разницу между самоинформацией пикселей в двух спектрах, что позволяет оценить степень их различия.

Наборы данных и их обработка

Данные Hyperion для пути/ряда 145/45 были получены, как показано на рис. 1. Дата сбора данных — 7 января 2008 года, время — 09:22 по индийскому стандартному времени (IST). Сцена Hyperion содержит область с координатами 20.8°N и 76.58°E. Основными культурами на момент съемки были нут, сорго и пшеница.

Второстепенные культуры — сезонные овощи и фрукты. Возраст выбранных для исследования культур составляет от 80 до 95 дней. Полевые данные были собраны 13 и 14 января 2008 года. Полевое исследование проводилось для сбора наземных гиперспектральных данных с использованием спектрорадиометра GER 1500, который имеет 512 каналов в диапазоне от 325 до 1075 нм. Спектры культур и GPS-координаты были взяты в 318 точках. Расстояние между пологом культуры и датчиком поддерживалось около 1 метра, и было обеспечено, что датчик находится перед культурой и перпендикулярно растению. 13 и 14 января 2008 года были безоблачными днями, и измерения проводились около полудня по местному времени. При этом необходимо следить за тем, чтобы на зону наблюдения не падала тень.

Для исследования были использованы данные первого уровня Hyperion, которые были скорректированы радиометрически. Hyperion содержит данные о 242 диапазонах, и в этом исследовании использовались 198 диапазонов от 356 до 2577 нм (Перлман и др., 2003).

Для корректного использования гиперспектральных данных была применена атмосферная коррекция. Эффективный код коррекции FLAASH (Fast Line-of-sight Atmospheric  Анализ спектральных гиперкубов, Kruse, 2008) был применен с использованием коммерческого программного пакета ENVI для коррекции атмосферы. Скорректированные атмосферные данные были сохранены в 168 полосах, поскольку полосы поглощения были удалены.

Для извлечения конечных элементов был применен алгоритм индекса чистоты пикселей (PPI). В качестве этапа предварительной обработки для извлечения конечных элементов с помощью PPI необходимо применить преобразование минимальной доли шума (MNF). Для выполнения категоризации растительности с использованием гиперспектральных данных, если MNF применяется ко всему набору данных, различия между пикселями, покрытыми растительностью, и пикселями, не покрытыми растительностью, будут определять собственный анализ ; следовательно, модифицированное преобразование MNF, исключающее пиксели, не содержащие растительности, применяется для выбора оптимальных полос, необходимых для дальнейшей обработки (Jiang et al., 2004), после того как  при удалении данных, не относящихся к растительности, MNF, скорее всего, способен различать различные типы растительности (tsai et al., 2007). Следовательно, MNF был применен после маскировки области, не относящейся к растительности, путем выбора Red edge NDVI (Красный край NDVI = pNIR- prededge/ pNIR+ prededge)- Маска на основе p (Робертс и др., 1993), применяемая в точном земледелии. Из собранных полевых спектров области исследования было установлено, что значение NDVI красного края, равное 0,45, подходит для того, чтобы скрыть всю не растительную часть исследуемой области. Исследуемая территория покрыта сельскохозяйственными угодьями, и, следовательно, пиксель, показывающий растительность, является сельскохозяйственным только для обработки. Алгоритм PPI используется для поиска конечных элементов в гиперспектральном изображении. Алгоритм PPI определяет, во сколько раз пиксель становится экстремальным при повороте данных, и это значение является показателем чистоты пикселя, т.е. чистыми спектрами, имеющими наивысший
 Подсчет PPI (Чанг и Плаза, 2006). Алгоритм PPI был запущен на изображениях, преобразованных в MNF, с использованием 1 00 000 итераций, чтобы отделить чистые пиксели от смешанных пикселей. В качестве конечных элементов был выбран триста двадцать один пиксель, идентифицированный с числом точек на дюйм более 10 000.
Рис. 1. Область исследования и данные hyperion
Методология
 Предлагаемая методология разработки спектров на основе измерения спектрального подобия SID обсуждается в трех частях: назначение, проверка и оценка разработанных спектров. Блок-схема, показанная на рисунке 2 описывает методологию, которой придерживались при разработке спектров на основе SID.

Процедура присвоения спектров конечных элементов классу культуры
 Значения SID были вычислены между спектрами конечных элементов и
спектрами полей различных культур. Конечные элементы были присвоены
классу культуры, для которого значение SID было минимальным, и был подготовлен
первичный список присвоений. Чтобы усовершенствовать проверяемую процедуру присвоения, можно однозначно дифференцировать присвоение и порог использования, например, двух спектров, если значение SID между первым присвоением и последующим присвоением для одного и того же сорта меньше значения SID между двумя различными спектрами культур и подготовил пересмотренный список заданий. Значения спектрального сходства SID среди полевых спектров различных культур были рассчитаны для определения порогового значения (т.е. средних значений SID между двумя различными классами культур, вычисленных по собранным полевым спектрам исследуемой территории) в качестве критерия остановки для отнесения конечных элементов к классу культур. Повторял процедуру присвоения до тех пор, пока дальнейший пересмотр не стал невозможен, и был подготовлен окончательный список присвоений. Описанная выше процедура присвоения конечных элементов различным культурам была выполнена для трех существующих основных культур, чтобы упростить решение. Из 321 продуктов, отобранные 33 конечных продукта были отнесены к нуту, 15 - к кукурузе и 19 - к растительному маслу, а остальные были отнесены к другим сортам. Разработанные спектры, основанные на измерении SID для сельскохозяйственных культур, приведены на рис. 3с вместе со спектрами полей  3(а).

Проверка разработанных спектров

Для выявления некоторых существенных свойств объекта интереса анализ спектральных поглощающих особенностей предоставляет надежные доказательства (Weng, 2011). Количественное описание поглощающих особенностей подтверждает объект интереса. Поглощающие особенности анализируются с использованием спектров с удаленным континуумом (Clark и Roush, 1984). Нормализованные спектры отражения используются в удалении континуума, что позволяет оценить индивидуальные поглощающие особенности от общей базовой линии. Континуум представляет собой U-образные оболочки, которые подгоняются над верхом спектра с использованием прямолинейных сегментов, соединяющих локальные максимумы спектра. Континуум удаляется путем деления его на реальный спектр для каждого пикселя в изображении, где локальный максимум отражательной способности континуума равен 1.0, а менее 1.0, где происходят поглощающие особенности, как показано на рис. 4.

Мера спектрального сходства SID и коэффициент корреляции между полевыми и разработанными спектрами на основе SID были вычислены для спектра с удаленным континуумом, и результаты представлены в таблице 1.

Оценка эффективности разработанных спектров
Спектральная мера дискриминации используется в качестве критерия оценки для оценки эффективности разработанных эталонных спектров. PSD (Chang, 2003) используется в качестве спектральной меры дискриминации для подтверждения эффективности разработанных спектров для классификации набора спектральных классов. PSD относится к выбранному спектральному отклику в наборе спектров, используемом для подготовки классификатора (Van der Meer, 2005). Дискриминационные вероятности всех спектральных откликов в наборе спектров или базе данных вычисляются с помощью PSD.

Пусть {sk} K
k = 1
1 — K спектральных сигнатур в наборе D, который можно рассматривать как базу данных, а t — любой конкретный целевой спектральный отклик, который необходимо идентифицировать с помощью D. Вероятности спектрального различия всех sk в D относительно t следующие.
где ∑j=1Lm(t,j)∑j=1Lm(t,j) — это нормировочная константа, определяемая по tt и ΔΔ. Результирующий вектор вероятностей Pt,Δ=(Pt,Δ(1),Pt,Δ(2),…,Pt,Δ(K))TPt,Δ​=(Pt​,Δ(1),Pt​,Δ(2),…,Pt​,Δ(K))T называется PSD (вероятностью спектрального различения) ΔΔ относительно tt или спектральной дискриминационной вероятностью вектора ΔΔ относительно tt. Например, на основе значений SID, вычисленных между спектрами нута-сорго, сорго-пшеницы и нута-пшеницы, PSD вычисляется в таблицах 2 и 3 для полевых спектров и спектров, разработанных на основе изображения с использованием меры спектрального сходства SID.
Рис. 2. Блок-схема методики, принятой для распределения спектров конечных элементов по культурам
где
∑j=1Lm(t,sj)=Сумма всех значений сходства в матрице эндчленовj=1∑Lm(t,sj​)=Сумма всех значений сходства в матрице эндчленов=0.0195+0.0772+0.0771= 0.1738=0.0195+0.0772+0.0771=0.1738m(t,sk)m(t,sk​) — это сумма всех значений сходства для целевого спектра tt относительно других спектров в библиотеке спектров sksk​. Например, для класса нута статистический результат Pchickpea,Δ=chickpea+sorghum+wheat(k=3)=(0.0+0.0195+0.0772)/0.1738=0.5564Pchickpea,Δ​=chickpea+sorghum+wheat(k=3)=(0.0+0.0195+0.0772)/0.1738=0.5564. Более высокое значение PSD для спектров, применяемых из изображения на основе меры спектрального сходства SID, показывающей дискриминацию между классами, может привести к улучшению классификации.

Классификация культур и оценка точности
 Классификация культур была конечной целью анализа изображения; таким образом, маска на основе NDVI с красным краем предназначена для классификации только растительности. Классификация изображений выполняется с использованием спектров полей и спектров, присвоенных с помощью измерения спектрального сходства SID для культур нута, сорго и пшеницы. Классификация изображений выполняется с использованием алгоритма SID. После классификации изображения привязываются к географической привязке только для оценки точности. Сравнение спектров поля и спектров, полученных по изображению на основе SID алгоритм был реализован до привязки к географическому положению; следовательно, классифицированные изображения до привязки к географическому положению показаны на рис. 5.

 Классифицированные изображения были протестированы для оценки точности; это выполняется путем определения соответствия/несовпадения классифицированных пикселей с тестируемыми пикселями, собранными в ходе полевых исследований.

Матрица ошибок подготовлена для классификации изображений, выполненной с использованием спектров поля зрения, и спектров, разработанных на основе спектрального сходства SID, согласно таблицам 4 и 5 соответственно. Оценка точности классификации проводится с помощью метода Каппа-анализа и Z-теста. Наблюдение с двумя наблюдателями соответствие одних и тех же данных проверяется с помощью Каппа-анализа; для дистанционного зондирования он используется для вычисления соответствия между подходами классификации.
Каппа-анализ использует полную матрицу ошибок, в то время как для определения общей точности используются только диагональные элементы. Следовательно, он был рекомендован Фунгом и Ледрю (1988) в качестве подходящего показателя точности классификации. Коэффициент Каппа варьируется от -1 до 1; значение, близкое к 1, указывает на максимальное согласие, в то время как значение-1 может быть интерпретировано как полное несогласие.

 Ладис и Кох (1977) предложили классификацию  соответствие, основанное на значении Kappa. Значения Kappa для двух разных классификаций могут быть использованы для проверки того, существенно ли различаются классификации. Тестовая статистика Z получена с использованием формулы (5), выведенной Скидмором (1999) и Флейссом и др. (1969).
где K1 и K2 - коэффициент Каппа изображения, классифицированного по спектрам поля и спектрам, присвоенным методом, основанным на SID, в то время как Var1 и Var2 – отклонения соответствующих статистических данных по Каппа. Допущение для Z-теста: нулевая гипотеза H0: K1 = K2 и альтернативная гипотеза H1: K1 = K2; гипотеза H0 отклоняется, если значение Z больше, чем 1,96; результаты классификации (матрицы ошибок) существенно отличаются при 95%-ном уровне достоверности, тогда как, если значение Z меньше 1,96, принимается значение H0, т.е. результаты классификации незначительно отличаются при 95%-ном уровне достоверности %  уровень доверия. Z-тест был проведен для данных дистанционного зондирования Двиведи и др. (2003) и Гонсалвесом и др. (2007).
 Значение Z для классификации, выполненной с использованием спектров поля и спектров, полученных на основе изображений, на основе спектрального сходства SID, соответствует таблице 6.
Рис. 4. Часть эталонного спектра (а) нута, (б) сорго и (в) пшеницы, разработанного для полевых спектров и спектров на основе SID
Обсуждения

 В этом исследовании проверяется эффективность измерения спектрального сходства SID для построения спектров сельскохозяйственных культур на основе гиперспектрального изображения. В предыдущих разделах была предложена методология и проведено распределение спектров конечных элементов по различным классам сельскохозяйственных культур. Было получено очень высокое значение коэффициента корреляции между спектрами поля и изображения для признака поглощения с центром около 680 нм, что доказывает сходство спектров. Также было обнаружено очень близкое соответствие между коэффициентом корреляции и SID значение, эквивалентное коэффициенту корреляции, что гарантирует присвоение класса конечным элементам является целесообразным. Следовательно, подход, используемый для разработки спектров культур на основе измерения спектрального сходства SID, обеспечивает эффективную альтернативу разработке спектров культур на основе самого изображения.

 Для проверки эффективности разработанных спектров был рассчитан PSD  для полевых спектров. Если PSD для класса высокий, то этот класс может быть лучше отделен от других классов (Ван дер Меер, 2005). Из сравнительного анализа можно сделать вывод, что PSD для выбора чая и сорго недостаточно для полевых спектров; следовательно, они могут создавать спектральную путаницу что приводит к неклассификации, в конечном счете приводящей к снижению точности классификации (Okin et al., 2000). Для спектров, присвоенных с помощью измерений сходства SID, все три класса имеют более высокие значения, что приводит к лучшему различению между классами, что в конечном итоге приводит к более высокой точности классификации.
Таблица 1 Характеристики поглощения и их корреляция между спектрами поля и спектрами, присвоенными на основе SID
Таблица 2. Расчет PSD для полевых спектров
Таблица 3 Расчет PSD для спектров, присвоенных на основе SID
Общая точность классификации изображения, классифицированного по полевым спектрам, составляет 78,62%, а для изображения, классифицированного по спектрам, назначенным с помощью подхода на основе SID, – 91,82%. Повышение точности классификации может быть связано с вычисленными результатами PSD. Для полевых спектров PSD пшеницы выше, что приводит к более высокой точности определения пшеницы пользователем и производителем, в то время как PSD сорго и нута ниже, что приводит к более низкой точности определения нута и сорго пользователем и производителем. Для спектров, назначенных с помощью SID, наблюдается увеличение PSD всех культур, а также не наблюдается большой разницы между значениями PSD;

следовательно, повышается точность определения всех культур пользователем и производителем. Рационально более высокая точность классификации показывает возможный новый подход к разработке спектров на основе спектрального сходства. Также оцененные спектры обеспечивают достоверность классификации изображений. В Таблице 4 представлены результаты Каппа-анализа для отдельных матриц ошибок, а также результаты Каппа-анализа для попарного сравнения матриц ошибок. Значения KHAT, которые находятся в диапазоне от -1 до 1, являются мерой согласованности точности. В Таблице 4 также представлена Z-статистика, используемая для определения, значительно ли классификация лучше случайного результата. Если значение Z-статистики теста больше 1,96 на уровне достоверности 95%, результат значим, и можно сделать вывод, что классификация лучше случайной. Значение Z при парном сравнении изображения, классифицированного с помощью подхода на основе SID, с изображением, классифицированным по спектрам поля, вычисляет более высокое ([1,96) значение Z-статистики, что показывает, что результат классификации, полученный с помощью спектров, разработанных с использованием подхода на основе SID, значительно отличается и лучше, чем при классификации, выполненной с использованием спектров поля.

Значение Каппа для изображения, классифицированного с помощью спектров поля, составляет 0,67, что показывает умеренное согласие, в то время как значение Каппа для изображения, классифицированного с помощью спектров, разработанных с помощью подхода на основе SID, составляет 0,87, что показывает отличное (почти идеальное) согласие благодаря увеличенному значению Каппа. Таким образом, классификация изображений с использованием спектров, разработанных на основе подхода SID, демонстрирует значительное улучшение классификации изображений, подтвержденное каппа-статистикой.
Рис. 5a Данные Hyperion, b – маска для области без растительности, c – изображение, классифицированное с использованием спектров поля, d – изображение, классифицированное с использованием спектров на основе SID
Таблица 4. Матрица ошибок для изображения, классифицированного с использованием
спектров поля
Выводы

Результаты классификации и оценки точности показывают, что подход, основанный на SID, оказался эффективной альтернативой для разработки спектров для классификации сельскохозяйственных культур. Спектральная плотность распределения (СПМ), вычисленная для спектральной библиотеки, разработанной на основе SID, мера спектрального сходства обеспечивает более высокую дискриминацию между классами. Кроме того, рациональная более высокая общая точность показывает меньшее смещение классов, что указывает на то, что используемые спектры более эффективны для различения между классами. Каппа-статистика доказывает, что все классификации лучше случайных.

Дополнительные значения каппа матриц ошибок показывают, что результат классификации изображений с использованием спектров, разработанных с использованием подхода на основе SID, значительно лучше, чем результат классификации изображений с использованием полевых спектров. В исследуемой области присутствуют три основных класса сельскохозяйственных культур; следовательно, подход применяется к трём классам; однако разработанный подход применим к любому количеству классов, а также к другим классам землепользования и растительного покрова, поскольку он не привязан к конкретному классу. Он может быть широко применен для визуальной классификации отдельных категорий и Класс IIт классификации земельного покрова.
Таблица 5. Матрица ошибок для изображения, классифицированного с использованием спектров, назначенного по SID
Таблица 6. Значения индивидуальной матрицы ошибок и их парное сравнение
Ссылки
Chang, C. I. (2000). An information theoretic-based approach to spectral variability, similarity and discriminability for hyperspectral image analysis. IEEE Transaction on Information Theory, 46(5), 1927-1932.

Chang, C. I. (2003). Hyperspectral imaging: Techniques for spectral detection and classification. New York: Kluwer Academic/Plenum Publishers.

Chang, C. I. & Plaza, A. (2006). A fast iterative algorithm for implementation of pixel purity index. IEEE Transaction on Geoscience and Remote Sensing, 3(1), 63-67.

Clark, R. N., & Roush, T. L. (1984). Reflectance spectroscopy: Quantitative analysis techniques for remote sensing applications. Journal of Geophysical Research, 89, 6329-6340.

Cover, Thomas M., & Thomas, Joy A. (2006). Elements of information theory (2nd ed.). Amsterdam: Wiley Publications.

Du, H., Chang, C. I., Ren, H., D'amico, F. M., & Jensen, J. O. (2004). New hyperspectral discrimination measure for spectral characterization. Optical Engineering, 43(8), 1777-1786.

Divvedi, R. S., Kandrika, Sreenivas, & Ramana, K. V. (2003). Comparison of classifiers of remote-sensing data for land-use/land-cover mapping. Current Science, 86, 328-335.
Fleiss, J. L., Cohen, J., & Everitt, B. S. (1969). Large-sample standard errors of kappa and weighted kappa. *Psychology Bulletin*, 72, 323-327.

Fung, T., & Ledrew, E. (1988). The determination of optimal threshold levels for change detection using various accuracy indices. *Photogrammetric Engineering & Remote Sensing*, 54, 1449-1454.

Goncalves, R. P., Assis, L. C., & Vieira, C. A. O. (2007). Comparison of sampling methods to classify of remotely sensed images. In *IV International Symposium in Precision in Agriculture*, 23-25 October, Vicosa.

Jiang, X., Tang, L., Wang, C., & Wang, C. (2004). Spectral characteristics and feature selection of hyperspectral remote sensing data. *International Journal of Remote Sensing*, 25(1), 51-59.

Kong, X., Shu, N., Huang, W., & Fu, J. (2010). The research effectiveness of spectral similarity measures for hyperspectral image. In *Presented in 3rd International Congress on Image and Signal Processing (CISP2010)*.

Kruse, F. A. (2008). Comparison of ATERM, ACORN, and FLASSH atmospheric corrections using low altitude AVIRIS data of Boulder, Co, USA. *September 21, 2008. http://www.hgimaging.com/FA_Pubs.htm*.

Kullback, S. (1977). *Information theory and statistics*. MA: Dover Gloucester.

Okin, G. S., Roberts, D. A., Murray, B., & Okin, W. J. (2000). Practical limits on hyperspectral vegetation discrimination in arid and semiarid regions. *Remote Sensing of Environment*, 77(2), 212-225.

Pearlman, J. S., Barry, P. S., Segal, C. C., Shepanski, J., Beiso, D., & Carman, S. L. (2003). Hyperion, a spaceborne imaging spectrometer. *IEEE Transactions on Geoscience and Remote Sensing*, 41(6), 1160-1173.

Roberts, D. A., Adams, J. B., & Smith, M. O. (1993). Discriminating green vegetation, non-photosynthetic vegetation and soil in AVIRIS data. *Remote Sensing of Environment*, 44(3), 255-270.

T sai, F. L., Lin, E.-K., & Yoshino, K. (2007). Spectrally segmented principal component analysis of hyperspectral imagery for invasive plant species mapping. *International Journal of Remote Sensing*, 28(5-6), 1023-1039.

Van der Meer, F. (2005). The effectiveness of spectral similarity measures for the analysis of hyperspectral imagery. *International Journal of Remote Sensing*, 26(1), 1-15.
Journal of Applied Earth Observation and Geoinformation.
https://doi.org/10.1016/j.jag.2005.06.001.
Weng, Q. (2011). Advances in environmental remote sensing: sensors, algorithms and applications, chapter 5 (pp. 118–120).and chapter 20 (pp.513–523). Boca Raton: CRC Press, Taylor & Francis.
1 августа/ 2025