Известно, что гиперспектральная съемка является одним из важнейших направлений развития средств космического, авиационного и наземного наблюдения. Так, результаты аэрокосмической гиперспектральной съемки используются для решении задач контроля загрязнений окружающей среды, в картографии, в исследованиях природных ресурсов, климатологии, океанографии, для мониторинга земной поверхности, для наблюдения за пожарами и др. [1,2,3,4]. Средства наземной гиперспектральной съемки используются для выявления малозаметных объектов на фоне объектов природного, включая растительность, происхождения. Существенное увеличение возможности получения полезной информации о целевых объектах при использовании гиперспектральных изображений (ГСИ) основывается на спектральных различиях целевых объектов и фонов. Однако реализация этого направления представляет собой серьезную проблему, обусловленную требованием обработки огромных объемов иконической (видовой) информации (десятки и сотни гигабайт) практически в масштабе реального времени.
Основными направлениями решения этой проблемы являются развитие и внедрение компьютерных технологий обработки изображений, способных извлекать полезную информацию из ГСИ, а также оптимизация числа спектральных каналов аппаратуры гиперспектральной съемки.
Анализ источников, в которых отражен опыт создания технологий обработки аэрокосмических изображений у нас в стране и за рубежом, показывает, что развитие по первому направлению осуществляется путем создания быстрых алгоритмов обработки ГСИ, одновременно обеспечивающих распараллеливание вычислений [5, 6, 7, 8]. По второму направлению - к уменьшению числа спектральных каналов (признаков) для решения конкретных тематических задач без потери качества их решения [9]. Основанием для проведения исследований на последнем направлении являются результаты анализа информационного содержания различных снимков, которые показывают, что при гиперспектральной съемке наиболее ценная для интерпретации информация сосредоточена, как правило, в небольшом числе каналов. В [9] для формального решения этой задачи предложен специальный функционал, имеющий смысл информативности набора выбранных спектральных каналов. Функционал построен на основе дивергенции КульбакаЛейбнера (взаимной информационной мере статистических распределений) и учитывающем разрешающую способность и отношение сигнал/шум гиперспектрального изображения. С его помощью были получены оценки информативности спектральных каналов ГСИ, на основе которых можно определить их состав [9]. В конечном итоге оценка качества получаемых таким образом изображений осуществляется визуально операторами, что позволяет уже окончательно принять решение о выборе конечного набора спектральных каналов.
Исходя из определяющей роли визуального выделения искомых объектов на изображениях выбранных спектральных каналов ГСИ предлагается подход к определению набора спектральных каналов на основе использования результатов автоматической кластеризации спектральных слоев ГСИ. Под спектральным слоем ГСИ будем понимать матрицу цифровых значений спектральной яркости в элементах разрешения на определенной длине волны излучения (строки i = 1, 2, …, n; столбцы j =1, 2, …, m) для каждого из дискретных k = 1, 2, …, r измерительных спектральных каналов гиперкуба. При этом оператору для визуального анализа предъявляются изображения, полученные после усреднения попавших в соответствующий кластер спектральных слоев ГСИ, по результатам анализа которых оператор делает заключение о возможности выделения на них целевых объектов. Отметим, что этот подход во многом аналогичен так называемому разведочному анализу, который проводится с целью качественной оценки используемых классификационных процедур при решении задач анализа многомерных данных [11].
Основаниями для выбора такого подхода явились:
- предположение, что при высоком линейном разрешении на объекте наблюдения, когда в пределах размера элемента разрешения изображения (везде далее для его обозначения будем использовать термин «пиксел») имеется однородная по спектральному составу поверхность, пикселы, относящиеся к целевым объектам, наблюдаемым в некотором диапазоне спектра (кластере), могут быть объединены в связные фрагменты, форма контуров которых является признаком их распознавания;
- временные затраты на кластеризацию спектральных слоев (матриц спектральных признаков) ниже, чем при кластеризации гиперспектров по их форме;
- яркостная картина объектов и фонов на местности локальна по пространству, что позволяет проводить кластеризацию спектральных слоев по частям независимо друг от друга и, следовательно, возможно распараллеливание вычислений с целью обеспечения их выполнения в масштабе реального масштабе времени независимо от размерности ГСИ (за счет увеличения числа вычислительных кластеров многопроцессорных систем обработки).
Как было сказано выше, использование ГСИ расширяет возможности по получению информации об объектах за счет различий в структуре спектральных признаков объектов и фонов. Поэтому алгоритм кластеризации должен в первую очередь выявлять такие различия, в том числе малозначимые. Для обеспечения такой возможности были разработаны алгоритм и реализующая его программа автоматической кластеризации, использующая специальную меру близости, предложенную в [13]: