Оценка целесообразности применения нейронных сетей в ГИС
- Авторы: Тесленок С.А.1, Федосеева У.С.1
-
Учреждения:
- Югорский государственный университет
- Выпуск: Том 12, № 10 (2024)
- Раздел: Статьи
- Статья получена: 28.11.2024
- Статья одобрена: 28.11.2024
- URL: https://ogarev-online.ru/2311-2468/article/view/271729
- ID: 271729
Цитировать
Полный текст
Аннотация
В данной статье описывается имеющийся опыт и потенциальные возможности применение искусственных нейронных сетей (ИНС) в геоинформационных системах (ГИС). В целом, статья демонстрирует потенциал ИНС при анализе пространственно привязанных геоинформационных данных и возможности их применения в различных смежных с ГИС и геоинформационными технологиями областях.
Полный текст
В последние десятилетия наблюдается растущий интерес к использованию ИНС (ANN, ANNs) в различных областях, включая обработку и анализ пространственно привязанных геоинформационных данных. Технологии глубокого обучения и ИНС обладают потенциалом для автоматизации процессов анализа пространственных данных, классификации изображений, прогнозирования и обнаружения паттернов в геоинформационных приложениях.
Оценка целесообразности применения ИНС в ГИС представляет значимый интерес для научного сообщества и практических областей, таких как экология, природопользование, обработка данных дистанционного зондирования, сельскохозяйственное производство, геология, градостроительство, общественная безопасность и др. [5; 7; 8; 10–13]. Понимание перспектив и оценка эффективности использования ИНС в ГИС могут привести к разработке инновационных методологий анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений.
ИНС – это математические модели, а также их программные или аппаратные реализации, вдохновленные биологическими нейронными сетями – сетями нервных клеток живого организма [5].
ИНС представляют собой систему, состоящую из взаимодействующих между собой простых процессоров – нейронов. Каждый нейрон в такой сети занимается обработкой и передачей сигналов другим нейронам, и, благодаря такому взаимодействию, сеть способна выполнять сложные задачи. С точки зрения машинного обучения, нейронная сеть действительно может быть рассмотрена как частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и других. Это связано с тем, что нейронные сети обучаются извлекать важные признаки из входных данных, что полезно для решения задач, связанных с классификацией, регрессией и кластеризацией. С математической точки зрения обучение нейронных сетей представляет собой многопараметрическую задачу нелинейной оптимизации. Это означает, что при обучении нейронной сети мы настраиваем множество параметров (весов и смещений) таким образом, чтобы минимизировать функцию потерь, отражающую ошибку предсказания сети. Для этого применяются различные методы оптимизации, такие как градиентный спуск, стохастический градиентный спуск, методы второго порядка и другие. С точки зрения кибернетики, нейронные сети находят применение в задачах адаптивного управления и являются важными алгоритмами для робототехники. Их способность к обучению и адаптации делает их ценным инструментом для создания систем, способных самостоятельно принимать решения в изменяющейся среде. С точки зрения развития вычислительной техники и программирования, нейронные сети действительно представляют интерес как способ решения проблемы эффективного параллелизма. Их параллельная структура и возможность выполнения сложных вычислений в десятки и сотни тысяч нейронов делают их объектом для разработки и оптимизации вычислительных алгоритмов. Таким образом, моделирование биологических нейронных сетей в виде искусственных систем стало стратегически важным для разработки технологий, включая машинное обучение, робототехнику, автономные системы и многое другое.
Нейронная сеть и математическая модель имеют схожий этап сбора и предобработки данных, однако отличаются в специфике создания моделей. В обоих случаях ключевым моментом является сбор и подготовка данных. Это включает в себя работу с источниками данных, их предварительную обработку для использования в моделировании. Однако, при создании ИНС важным этапом является определение структуры сети, включая выбор типов слоев, их последовательность, настройку функций активации и оптимизаторов. Значительное внимание также уделяется работе с изображениями в ИНС, что делает процесс более комплексным в контексте работы с пространственными данными. В отличие от этого, создание математической модели склоняется к работе с абстрактными концепциями, где внимание направлено на разработку уравнений и функций, соответствующих теоретическим моделям, исходя из природы исследуемых данных.
К примеру, в статье [13] описывается процесс обучения сверточной нейронной сети (Convolutional Neural Networks, далее – CNN) на примере обработки данных землетрясений в ГИС (рис. 1). Авторы статьи использовали оригинальный набор данных Венчуанского землетрясения в Китае и провели предварительную обработку данных, включая нормализацию и преобразование входных данных в формат, пригодный для обучения CNN.
Рис. 1. Процесс обучения до и после предварительной обработки данных: (а) кривая обучения, (б) кривая функции потери перекрестной энтропии [13].
Для обучения CNN использовались алгоритмы L2-регуляризации, стохастического градиентного спуска и оптимизации ADAM (алгоритм ADAM – Adaptive Moment Estimation). В процессе обучения CNN данные, используемые для обучения, итерировались в одном цикле, называемом эпохой. Авторами анализируемой статьи [13] проведено обучение CNN на 10 эпохах на графическом процессоре 1080ti, что заняло 15 минут. В процессе обучения была достигнута средняя точность расчетов более 95%. После обучения CNN была протестирована на 8 800 образцах из тестового набора данных. Результаты показали, что образцы могут быть распознаны менее чем за 20 секунд, а точность расчетов составила 94,7%.
В контексте ГИС ИНС могут быть использованы в различных геоинформационных проектах [9] для классификации и сегментации изображений: например, для распознавания и классификации объектов на спутниковых снимках [12]. Исследование, описываемое в статье [1], рассматривает использование сверточных нейронных сетей для сегментации объектов на изображениях. В данной технологии CNN применяются для выделения конкретных объектов на изображениях, например, выделение животных на фотографиях. Авторы исследования стремились создать нейросетевую модель, которая автоматически и точно определяет, и выделяет животных на изображениях. В контексте ГИС, возможности использования подобной технологии для сегментации объектов на изображениях огромны. Например, в области автоматизированного геоинформационного картографирования [9; 10] CNN может использоваться для автоматического выделения дорог, рек, озер и других географических объектов на спутниковых снимках или аэрофотоснимках [12]. Это позволяет обрабатывать огромные объемы геопространственных данных и автоматически вести создание или обновление карт [12].
ГИС ArcGIS предлагает возможность использовать предварительно обученные модели глубокого обучения или обучать собственные модели с помощью различных инструментов и платформ, в частности для анализа изображений [16]. В рамках ГИС ArcGIS также есть возможность интеграции со сторонними фреймворками глубокого обучения. В рабочих процессах глубокого обучения в ГИС ArcGIS используются следующие шаги:
- Создание обучающих выборок с помощью инструментов редактирования в ГИС ArcGIS.
- Обучение модели глубокого обучения с использованием ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise или ArcGIS API for Python.
- Использование обученной модели для извлечения конкретных особенностей на изображениях с помощью инструментов ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise, ArcGIS Online или ArcGIS API for Python.
Помимо этого, ИНС широко используются для моделирования и прогнозирования тенденций или изменений, таких как погода и климатические изменения.
К примеру, в статье [3], был представлен разработанный плагин для ГИС QGIS, который обрабатывает информацию, получаемую с сети метеорологических станций, расположенных в Новосибирской области, и использует многослойную ИНС для прогнозирования количества осадков на этой территории. Для этого проводилась предобработка данных и использовались различные алгоритмы и методы обучения ИНС.
Основной проблемой, с которой сталкиваются при разработке таких систем, является ограниченность данных, особенно при прогнозировании осадков. В базе данных ГИС могут присутствовать только записи о дате и месте осадков, но не о других факторах, таких как температура, влажность или атмосферное давление. Однако благодаря предобработке данных и обучению ИНС на основе доступных данных удалось достичь факта прогнозирования количества осадков. Важным фактором для успешного применения ИНС является наличие достаточного объема данных для обучения и соответствие этих данных требованиям исследуемой задачи.
В другой статье [14] представлено прогнозирование и моделирование эрозии на побережье Коста-да-Капарика в Лиссабоне (Португалия) с помощью комбинации ГИС и ИНС. Для этого используется методика, основанная на анализе данных о погоде, приливах, волнении и других факторах, которые влияют на эрозию побережья. Эти данные обрабатываются и анализируются с помощью ГИС, а затем используются для обучения ИНС. Обученные нейронные сети затем используются для прогнозирования изменений в эрозии на побережье в будущем (см. рис. 2).
Результаты исследования показали, что комбинация ГИС и ИНС является мощным инструментом для анализа и прогнозирования динамики эрозии на побережье Коста-да- Капарика в Лиссабоне (Португалия). Использование модели GIS-ANN позволило получить высокую точность прогнозирования изменений в эрозии на побережье в будущем. Было выявлено, что наибольшее влияние на эрозию оказывают антропогенные факторы, такие как неправильное использование земли, строительство и транспортное движение на побережье. Результаты исследования могут быть использованы для разработки политик, направленных на сохранение окружающей среды и управление побережьем.
Прогнозы могут быть использованы для планирования городского развития, оценки воздействия на окружающую среду и других целей. Так, модель преобразования земель (Land Transformation Model, LTM) [15] использует ГИС и ИНС для прогнозирования изменений землепользования. Для прогнозирования урбанизации в водосборе Grand Traverse Bay в Мичигане, LTM использует данные о землепользовании, климатические данные, данные о дорожной инфраструктуре, населении и другие факторы. Прогнозирование происходит путем анализа исторических данных и использования модели для прогнозирования будущих изменений землепользования.
Рис. 2. Результат прогнозируемых значений для выходных данных в виде карты районов, подверженных эрозионным изменениям в 2021 г. [14].
В статье [4] описывается использование ИНС для прогнозирования загрязнения воздуха в городской среде. Ее авторы рассматривают данные о загрязнении атмосферного воздуха и метеорологические данные, которые используются для обучения нейронных сетей. В статье описывается методика расчета концентраций загрязняющих веществ в атмосфере с помощью программы УПРЗА «Эколог», которая позволяет рассчитать приземные концентрации загрязняющих веществ в атмосфере в соответствии с [2].
Для обучения ИНС использовались данные мониторинга атмосферного воздуха г. Таганрога. Вектор входных данных содержал более 1 000 примеров. Результаты исследования показали, что ИНС могут быть эффективно использованы для прогнозирования загрязнения воздуха в городской среде. Применение ИНС позволило построить прогностическую модель (рис. 3) распределения загрязнителей в атмосферном воздухе при учете различных метеорологических условий и вклада промышленных предприятий в загрязнение воздушного бассейна города [4].
Рис. 3. Прогностическая модель распределения загрязнителей в атмосферном воздухе [4].
Несмотря на все плюсы ИНС, важно осознавать и находить решения для проблем, с которыми мы сталкиваемся при ИНС в ГИС.
- Недостаточная объяснимость результатов. ИНС, особенно глубокие, могут быть сложными, сложно интерпретируемыми моделями, что затрудняет объяснение причинно- следственных связей в полученных результатах. Это особенно важно в ГИС, где требуется понимание процессов и принятие обоснованных управленческих решений на основе получаемых данных.
- Недообучение или переобучение моделей. ИНС могут столкнуться с проблемой недообучения, если данные недостаточно разнообразны или недостаточны, что может привести к неправильным выводам. С другой стороны, переобучение может привести к неправильной генерализации модели на новые данные. Это может быть особенно критично в ГИС, где точность предсказаний имеет большое значение.
- Высокая вычислительная сложность. Некоторые типы ИНС, особенно глубокие конволюционные нейронные сети, требуют значительных вычислительных мощностей для обучения и применения. В ГИС, особенно в реальном времени, это может вызвать проблемы с производительностью.
- Безопасность и конфиденциальность. ИНС подвержены риску атак, таких как внедрение шума в данные (адверсариальные атаки) или извлечение конфиденциальной информации из моделей (например, инференсия на основе моделей). Эти риски могут усугубиться в ГИС, где данные могут быть особенно чувствительными (например, геолокационные данные).
Все эти риски важно учитывать при разработке и применении ИНС в ГИС. Хорошо разработанные технические и организационные меры могут помочь снизить эти риски и обеспечить более безопасное и надежное использование ИНС в данной области.
К примеру, ИНС могут использоваться для защиты ГИС и пространственных данных [6]. В частности, ИНС может использоваться для обнаружения распределенных атак типа DDoS, целью которых является отказ в обслуживании и препятствование доступу легитимных пользователей к атакуемому приложению. Нейронная сеть может работать в двух режимах обучения: без учителя (самообучаемая) и с учителем, что дает пользователю возможность задавать начальные веса либо загружать файл с готовой базой знаний. Результаты работы показывают, что ИНС является одним из механизмов обнаружения потенциально опасных угроз в ГИС для поддержки принятия управленческих решений. При использовании ИНС и других существующих методов защиты данных в совокупности в будущем возможно многократное повышение степени обнаружения потенциально опасных угроз в ГИС для поддержки формулирования и принятия управленческих решений [7; 8; 10; 11], что, в свою очередь, позволит построить эффективную и надежную систему обеспечения информационной безопасности данных.
Несмотря на потенциальные риски, эффективное использование ИНС в ГИС имеет огромный потенциал для улучшения процессов анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений и процессов. Критически важно учитывать и снижать эти риски, но применение ИНС в ГИС обещает значительные выгоды для современных геопространственных приложений.
Об авторах
Сергей Адамович Тесленок
Югорский государственный университет
Email: teslenok-sa@mail.ru
Кандидат географических наук, доцент высшей экологической школы
Россия, 628012, г. Ханты-Мансийск, ул. Чехова, д. 16Ульяна Сергеевна Федосеева
Югорский государственный университет
Автор, ответственный за переписку.
Email: fus260103@edu.ugrasu.ru
Магистрант 1-го года обучения направления подготовки 05.04.06 Экология и природопользование высшей экологической школы
Россия, 628012, г. Ханты-Мансийск, ул. Чехова, д. 16Список литературы
- Клехо Д. Ю., Карелина Е. Б., Батырев Ю. П. Использование технологии сверточных нейронных сетей в сегментации объектов изображения // Вестник МГУЛ – Лесной вестник. – 2021. – Т. 25. – № 1. – С. 140–145.
- Методика расчета концентраций в атмосферном воздухе вредных веществ, содержащихся в выбросах промышленных предприятий. ОНД-86. – Л.: Гидрометеоиздат, 1986. – 93 с.
- Морозов Д. А. Применение нейронных сетей для прогнозирования в геоинформационных системах // Вопросы науки и образования. – 2018. – № 11 (23). – С. 6–8.
- Плуготаренко Н. К., Варнавский А. Н. Применение нейронных сетей для построения модели прогнозирования состояния городской воздушной среды // Инженерный вестник Дона. – 2012. – № 4. – Ч. 2. – С. 10.
- Ростовцев В. С. Искусственные нейронные сети. – СПб: Лань, 2023. – 216 с.
- Татарникова Т. М., Степанов С. Ю., Петров Я. А., Сидоренко А. Ю. Разработка метода защиты геоинформационных систем и пространственных данных на основе нейронной сети // Программные продукты и системы. – 2020. – № 2 [Электронный ресурс]. – Режим доступа: https://cyberleninka.ru/article/n/razrabotka-metoda-zaschity- geoinformatsionnyh-sistem-i-prostranstvennyh-dannyh-na-osnove-neyronnoy-seti (дата обращения: 06.12.2023).
- Тесленок К. С. Возможности геоинформационных систем в управлении инновациями, ресурсами и природопользованием // Вестник Казахского университета экономики, финансов и международной торговли. – 2014. – № 3. – С. 135–138.
- Тесленок С. А. Управление агроландшафтными системами на основе специализированных региональных ГИС, как один из механизмов повышения эффективности их функционирования // Стратегия и тактика развития производственно-хозяйственных систем: материалы IX Междунар. науч.-практич. конф., посвящ. 120-летию со дня рожд. П. О. Сухого, Гомель, 26-27 нояб. 2015 г. Гомель: ГГТУ им. П. О. Сухого, 2015. – С. 297–302.
- Тесленок К. С. Создание геоинформационного проекта и его использование в целях развития хозяйственных систем // Геоинформационное картографирование в регионах России: материалы VII Всерос. науч.-практич. конф. (Воронеж, 10-12 дек. 2015 г.). – Воронеж: Научная книга, 2015. – С. 134–138.
- Тесленок К. С., Тесленок С. А. Геоинформационно-картографическое обеспечение управленческих решений сельскохозяйственного природопользования // Молодой ученый. – 2015. – № 6.5 (86.5). – С. 59–62.
- Тесленок К. С., Тесленок С. А. Использование геоинформационных технологий для принятия оперативных управленческих решений в целях рационализации сельскохозяйственного природопользования // Агропромышленный комплекс: состояние, проблемы, перспективы: сборник статей X Междунар. науч.-практич. конф. Пенза: РИО ПГСХА, 2014. – С. 103–106.
- Федосеева У. С., Тесленок С. А., Скурихин А. А. Сравнительный анализ точности классификации объектов на основе космических снимков из разных источников // Известия Дагестанского государственного педагогического университета. Естественные и точные науки. – 2024. – Т. 18. №2. – С. 93–102.
- Liu J., Dong F., Li Z. Application of Convolutional Neural Network to GIS and Physics // Computational Intelligence and Neuroscience. – 2022. – Vol. 2. – P. 1–6.
- Peponi A., Morgado P., Trindade J. Combining Artificial Neural Networks and GIS Fundamentals for Coastal Erosion Prediction Modeling // Sustainability. – 2019. – Vol. 11. – P. 975.
- Pijanowski B., Brown D., Shellito B., Manik G. Using neural networks and GIS to forecast land use changes: A Land Transformation Model // Computers, Environment and Urban Systems. – 2002. – Vol. 26. – P. 553–575.
- Using Deep Learning for Feature Extraction and Classification // Imagery Workflows [Электронный ресурс]. – Режим доступа: https://doc.arcgis.com/en/imagery/workflows/ lresources/using-deep-learning-for-feature-extraction.htm (дата обращения: 06.09.2024).
Дополнительные файлы
