Оценка целесообразности применения нейронных сетей в ГИС

Обложка

Цитировать

Полный текст

Аннотация

В данной статье описывается имеющийся опыт и потенциальные возможности применение искусственных нейронных сетей (ИНС) в геоинформационных системах (ГИС). В целом, статья демонстрирует потенциал ИНС при анализе пространственно привязанных геоинформационных данных и возможности их применения в различных смежных с ГИС и геоинформационными технологиями областях.

Полный текст

В последние десятилетия наблюдается растущий интерес к использованию ИНС (ANN, ANNs) в различных областях, включая обработку и анализ пространственно привязанных геоинформационных данных. Технологии глубокого обучения и ИНС обладают потенциалом для автоматизации процессов анализа пространственных данных, классификации изображений, прогнозирования и обнаружения паттернов в геоинформационных приложениях.

Оценка целесообразности применения ИНС в ГИС представляет значимый интерес для научного сообщества и практических областей, таких как экология, природопользование, обработка данных дистанционного зондирования, сельскохозяйственное производство, геология, градостроительство, общественная безопасность и др. [5; 7; 8; 10–13]. Понимание перспектив и оценка эффективности использования ИНС в ГИС могут привести к разработке инновационных методологий анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений.

ИНС – это математические модели, а также их программные или аппаратные реализации, вдохновленные биологическими нейронными сетями – сетями нервных клеток живого организма [5].

ИНС представляют собой систему, состоящую из взаимодействующих между собой простых процессоров – нейронов. Каждый нейрон в такой сети занимается обработкой и передачей сигналов другим нейронам, и, благодаря такому взаимодействию, сеть способна выполнять сложные задачи. С точки зрения машинного обучения, нейронная сеть действительно может быть рассмотрена как частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и других. Это связано с тем, что нейронные сети обучаются извлекать важные признаки из входных данных, что полезно для решения задач, связанных с классификацией, регрессией и кластеризацией. С математической точки зрения обучение нейронных сетей представляет собой многопараметрическую задачу нелинейной оптимизации. Это означает, что при обучении нейронной сети мы настраиваем множество параметров (весов и смещений) таким образом, чтобы минимизировать функцию потерь, отражающую ошибку предсказания сети. Для этого применяются различные методы оптимизации, такие как градиентный спуск, стохастический градиентный спуск, методы второго порядка и другие. С точки зрения кибернетики, нейронные сети находят применение в задачах адаптивного управления и являются важными алгоритмами для робототехники. Их способность к обучению и адаптации делает их ценным инструментом для создания систем, способных самостоятельно принимать решения в изменяющейся среде. С точки зрения развития вычислительной техники и программирования, нейронные сети действительно представляют интерес как способ решения проблемы эффективного параллелизма. Их параллельная структура и возможность выполнения сложных вычислений в десятки и сотни тысяч нейронов делают их объектом для разработки и оптимизации вычислительных алгоритмов. Таким образом, моделирование биологических нейронных сетей в виде искусственных систем стало стратегически важным для разработки технологий, включая машинное обучение, робототехнику, автономные системы и многое другое.

Нейронная сеть и математическая модель имеют схожий этап сбора и предобработки данных, однако отличаются в специфике создания моделей. В обоих случаях ключевым моментом является сбор и подготовка данных. Это включает в себя работу с источниками данных, их предварительную обработку для использования в моделировании. Однако, при создании ИНС важным этапом является определение структуры сети, включая выбор типов слоев, их последовательность, настройку функций активации и оптимизаторов. Значительное внимание также уделяется работе с изображениями в ИНС, что делает процесс более комплексным в контексте работы с пространственными данными. В отличие от этого, создание математической модели склоняется к работе с абстрактными концепциями, где внимание направлено на разработку уравнений и функций, соответствующих теоретическим моделям, исходя из природы исследуемых данных.

К примеру, в статье [13] описывается процесс обучения сверточной нейронной сети (Convolutional Neural Networks, далее – CNN) на примере обработки данных землетрясений в ГИС (рис. 1). Авторы статьи использовали оригинальный набор данных Венчуанского землетрясения в Китае и провели предварительную обработку данных, включая нормализацию и преобразование входных данных в формат, пригодный для обучения CNN.

 

Рис. 1. Процесс обучения до и после предварительной обработки данных: (а) кривая обучения, (б) кривая функции потери перекрестной энтропии [13].

 

Для обучения CNN использовались алгоритмы L2-регуляризации, стохастического градиентного спуска и оптимизации ADAM (алгоритм ADAM – Adaptive Moment Estimation). В процессе обучения CNN данные, используемые для обучения, итерировались в одном цикле, называемом эпохой. Авторами анализируемой статьи [13] проведено обучение CNN на 10 эпохах на графическом процессоре 1080ti, что заняло 15 минут. В процессе обучения была достигнута средняя точность расчетов более 95%. После обучения CNN была протестирована на 8 800 образцах из тестового набора данных. Результаты показали, что образцы могут быть распознаны менее чем за 20 секунд, а точность расчетов составила 94,7%.

В контексте ГИС ИНС могут быть использованы в различных геоинформационных проектах [9] для классификации и сегментации изображений: например, для распознавания и классификации объектов на спутниковых снимках [12]. Исследование, описываемое в статье [1], рассматривает использование сверточных нейронных сетей для сегментации объектов на изображениях. В данной технологии CNN применяются для выделения конкретных объектов на изображениях, например, выделение животных на фотографиях. Авторы исследования стремились создать нейросетевую модель, которая автоматически и точно определяет, и выделяет животных на изображениях. В контексте ГИС, возможности использования подобной технологии для сегментации объектов на изображениях огромны. Например, в области автоматизированного геоинформационного картографирования [9; 10] CNN может использоваться для автоматического выделения дорог, рек, озер и других географических объектов на спутниковых снимках или аэрофотоснимках [12]. Это позволяет обрабатывать огромные объемы геопространственных данных и автоматически вести создание или обновление карт [12].

ГИС ArcGIS предлагает возможность использовать предварительно обученные модели глубокого обучения или обучать собственные модели с помощью различных инструментов и платформ, в частности для анализа изображений [16]. В рамках ГИС ArcGIS также есть возможность интеграции со сторонними фреймворками глубокого обучения. В рабочих процессах глубокого обучения в ГИС ArcGIS используются следующие шаги:

  1. Создание обучающих выборок с помощью инструментов редактирования в ГИС ArcGIS.
  2. Обучение модели глубокого обучения с использованием ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise или ArcGIS API for Python.
  3. Использование обученной модели для извлечения конкретных особенностей на изображениях с помощью инструментов ArcGIS Pro, ArcGIS Image Server для ArcGIS Enterprise, ArcGIS Online или ArcGIS API for Python.

Помимо этого, ИНС широко используются для моделирования и прогнозирования тенденций или изменений, таких как погода и климатические изменения.

К примеру, в статье [3], был представлен разработанный плагин для ГИС QGIS, который обрабатывает информацию, получаемую с сети метеорологических станций, расположенных в Новосибирской области, и использует многослойную ИНС для прогнозирования количества осадков на этой территории. Для этого проводилась предобработка данных и использовались различные алгоритмы и методы обучения ИНС.

Основной проблемой, с которой сталкиваются при разработке таких систем, является ограниченность данных, особенно при прогнозировании осадков. В базе данных ГИС могут присутствовать только записи о дате и месте осадков, но не о других факторах, таких как температура, влажность или атмосферное давление. Однако благодаря предобработке данных и обучению ИНС на основе доступных данных удалось достичь факта прогнозирования количества осадков. Важным фактором для успешного применения ИНС является наличие достаточного объема данных для обучения и соответствие этих данных требованиям исследуемой задачи.

В другой статье [14] представлено прогнозирование и моделирование эрозии на побережье Коста-да-Капарика в Лиссабоне (Португалия) с помощью комбинации ГИС и ИНС. Для этого используется методика, основанная на анализе данных о погоде, приливах, волнении и других факторах, которые влияют на эрозию побережья. Эти данные обрабатываются и анализируются с помощью ГИС, а затем используются для обучения ИНС. Обученные нейронные сети затем используются для прогнозирования изменений в эрозии на побережье в будущем (см. рис. 2).

Результаты исследования показали, что комбинация ГИС и ИНС является мощным инструментом для анализа и прогнозирования динамики эрозии на побережье Коста-да- Капарика в Лиссабоне (Португалия). Использование модели GIS-ANN позволило получить высокую точность прогнозирования изменений в эрозии на побережье в будущем. Было выявлено, что наибольшее влияние на эрозию оказывают антропогенные факторы, такие как неправильное использование земли, строительство и транспортное движение на побережье. Результаты исследования могут быть использованы для разработки политик, направленных на сохранение окружающей среды и управление побережьем.

Прогнозы могут быть использованы для планирования городского развития, оценки воздействия на окружающую среду и других целей. Так, модель преобразования земель (Land Transformation Model, LTM) [15] использует ГИС и ИНС для прогнозирования изменений землепользования. Для прогнозирования урбанизации в водосборе Grand Traverse Bay в Мичигане, LTM использует данные о землепользовании, климатические данные, данные о дорожной инфраструктуре, населении и другие факторы. Прогнозирование происходит путем анализа исторических данных и использования модели для прогнозирования будущих изменений землепользования.

 

Рис. 2. Результат прогнозируемых значений для выходных данных в виде карты районов, подверженных эрозионным изменениям в 2021 г. [14].

 

В статье [4] описывается использование ИНС для прогнозирования загрязнения воздуха в городской среде. Ее авторы рассматривают данные о загрязнении атмосферного воздуха и метеорологические данные, которые используются для обучения нейронных сетей. В статье описывается методика расчета концентраций загрязняющих веществ в атмосфере с помощью программы УПРЗА «Эколог», которая позволяет рассчитать приземные концентрации загрязняющих веществ в атмосфере в соответствии с [2].

Для обучения ИНС использовались данные мониторинга атмосферного воздуха г. Таганрога. Вектор входных данных содержал более 1 000 примеров. Результаты исследования показали, что ИНС могут быть эффективно использованы для прогнозирования загрязнения воздуха в городской среде. Применение ИНС позволило построить прогностическую модель (рис. 3) распределения загрязнителей в атмосферном воздухе при учете различных метеорологических условий и вклада промышленных предприятий в загрязнение воздушного бассейна города [4].

 

Рис. 3. Прогностическая модель распределения загрязнителей в атмосферном воздухе [4].

 

Несмотря на все плюсы ИНС, важно осознавать и находить решения для проблем, с которыми мы сталкиваемся при ИНС в ГИС.

  1. Недостаточная объяснимость результатов. ИНС, особенно глубокие, могут быть сложными, сложно интерпретируемыми моделями, что затрудняет объяснение причинно- следственных связей в полученных результатах. Это особенно важно в ГИС, где требуется понимание процессов и принятие обоснованных управленческих решений на основе получаемых данных.
  2. Недообучение или переобучение моделей. ИНС могут столкнуться с проблемой недообучения, если данные недостаточно разнообразны или недостаточны, что может привести к неправильным выводам. С другой стороны, переобучение может привести к неправильной генерализации модели на новые данные. Это может быть особенно критично в ГИС, где точность предсказаний имеет большое значение.
  3. Высокая вычислительная сложность. Некоторые типы ИНС, особенно глубокие конволюционные нейронные сети, требуют значительных вычислительных мощностей для обучения и применения. В ГИС, особенно в реальном времени, это может вызвать проблемы с производительностью.
  4. Безопасность и конфиденциальность. ИНС подвержены риску атак, таких как внедрение шума в данные (адверсариальные атаки) или извлечение конфиденциальной информации из моделей (например, инференсия на основе моделей). Эти риски могут усугубиться в ГИС, где данные могут быть особенно чувствительными (например, геолокационные данные).

Все эти риски важно учитывать при разработке и применении ИНС в ГИС. Хорошо разработанные технические и организационные меры могут помочь снизить эти риски и обеспечить более безопасное и надежное использование ИНС в данной области.

К примеру, ИНС могут использоваться для защиты ГИС и пространственных данных [6]. В частности, ИНС может использоваться для обнаружения распределенных атак типа DDoS, целью которых является отказ в обслуживании и препятствование доступу легитимных пользователей к атакуемому приложению. Нейронная сеть может работать в двух режимах обучения: без учителя (самообучаемая) и с учителем, что дает пользователю возможность задавать начальные веса либо загружать файл с готовой базой знаний. Результаты работы показывают, что ИНС является одним из механизмов обнаружения потенциально опасных угроз в ГИС для поддержки принятия управленческих решений. При использовании ИНС и других существующих методов защиты данных в совокупности в будущем возможно многократное повышение степени обнаружения потенциально опасных угроз в ГИС для поддержки формулирования и принятия управленческих решений [7; 8; 10; 11], что, в свою очередь, позволит построить эффективную и надежную систему обеспечения информационной безопасности данных.

Несмотря на потенциальные риски, эффективное использование ИНС в ГИС имеет огромный потенциал для улучшения процессов анализа пространственных данных, оптимизации процессов картографирования, прогнозирования и анализа рисков природных и антропогенных явлений и процессов. Критически важно учитывать и снижать эти риски, но применение ИНС в ГИС обещает значительные выгоды для современных геопространственных приложений.

×

Об авторах

Сергей Адамович Тесленок

Югорский государственный университет

Email: teslenok-sa@mail.ru

Кандидат географических наук, доцент высшей экологической школы 

Россия, 628012, г. Ханты-Мансийск, ул. Чехова, д. 16

Ульяна Сергеевна Федосеева

Югорский государственный университет

Автор, ответственный за переписку.
Email: fus260103@edu.ugrasu.ru

Магистрант 1-го года обучения направления подготовки 05.04.06 Экология и природопользование высшей экологической школы

Россия, 628012, г. Ханты-Мансийск, ул. Чехова, д. 16

Список литературы

  1. Клехо Д. Ю., Карелина Е. Б., Батырев Ю. П. Использование технологии сверточных нейронных сетей в сегментации объектов изображения // Вестник МГУЛ – Лесной вестник. – 2021. – Т. 25. – № 1. – С. 140–145.
  2. Методика расчета концентраций в атмосферном воздухе вредных веществ, содержащихся в выбросах промышленных предприятий. ОНД-86. – Л.: Гидрометеоиздат, 1986. – 93 с.
  3. Морозов Д. А. Применение нейронных сетей для прогнозирования в геоинформационных системах // Вопросы науки и образования. – 2018. – № 11 (23). – С. 6–8.
  4. Плуготаренко Н. К., Варнавский А. Н. Применение нейронных сетей для построения модели прогнозирования состояния городской воздушной среды // Инженерный вестник Дона. – 2012. – № 4. – Ч. 2. – С. 10.
  5. Ростовцев В. С. Искусственные нейронные сети. – СПб: Лань, 2023. – 216 с.
  6. Татарникова Т. М., Степанов С. Ю., Петров Я. А., Сидоренко А. Ю. Разработка метода защиты геоинформационных систем и пространственных данных на основе нейронной сети // Программные продукты и системы. – 2020. – № 2 [Электронный ресурс]. – Режим доступа: https://cyberleninka.ru/article/n/razrabotka-metoda-zaschity- geoinformatsionnyh-sistem-i-prostranstvennyh-dannyh-na-osnove-neyronnoy-seti (дата обращения: 06.12.2023).
  7. Тесленок К. С. Возможности геоинформационных систем в управлении инновациями, ресурсами и природопользованием // Вестник Казахского университета экономики, финансов и международной торговли. – 2014. – № 3. – С. 135–138.
  8. Тесленок С. А. Управление агроландшафтными системами на основе специализированных региональных ГИС, как один из механизмов повышения эффективности их функционирования // Стратегия и тактика развития производственно-хозяйственных систем: материалы IX Междунар. науч.-практич. конф., посвящ. 120-летию со дня рожд. П. О. Сухого, Гомель, 26-27 нояб. 2015 г. Гомель: ГГТУ им. П. О. Сухого, 2015. – С. 297–302.
  9. Тесленок К. С. Создание геоинформационного проекта и его использование в целях развития хозяйственных систем // Геоинформационное картографирование в регионах России: материалы VII Всерос. науч.-практич. конф. (Воронеж, 10-12 дек. 2015 г.). – Воронеж: Научная книга, 2015. – С. 134–138.
  10. Тесленок К. С., Тесленок С. А. Геоинформационно-картографическое обеспечение управленческих решений сельскохозяйственного природопользования // Молодой ученый. – 2015. – № 6.5 (86.5). – С. 59–62.
  11. Тесленок К. С., Тесленок С. А. Использование геоинформационных технологий для принятия оперативных управленческих решений в целях рационализации сельскохозяйственного природопользования // Агропромышленный комплекс: состояние, проблемы, перспективы: сборник статей X Междунар. науч.-практич. конф. Пенза: РИО ПГСХА, 2014. – С. 103–106.
  12. Федосеева У. С., Тесленок С. А., Скурихин А. А. Сравнительный анализ точности классификации объектов на основе космических снимков из разных источников // Известия Дагестанского государственного педагогического университета. Естественные и точные науки. – 2024. – Т. 18. №2. – С. 93–102.
  13. Liu J., Dong F., Li Z. Application of Convolutional Neural Network to GIS and Physics // Computational Intelligence and Neuroscience. – 2022. – Vol. 2. – P. 1–6.
  14. Peponi A., Morgado P., Trindade J. Combining Artificial Neural Networks and GIS Fundamentals for Coastal Erosion Prediction Modeling // Sustainability. – 2019. – Vol. 11. – P. 975.
  15. Pijanowski B., Brown D., Shellito B., Manik G. Using neural networks and GIS to forecast land use changes: A Land Transformation Model // Computers, Environment and Urban Systems. – 2002. – Vol. 26. – P. 553–575.
  16. Using Deep Learning for Feature Extraction and Classification // Imagery Workflows [Электронный ресурс]. – Режим доступа: https://doc.arcgis.com/en/imagery/workflows/ lresources/using-deep-learning-for-feature-extraction.htm (дата обращения: 06.09.2024).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Процесс обучения до и после предварительной обработки данных: (а) кривая обучения, (б) кривая функции потери перекрестной энтропии [13].

Скачать (74KB)
3. Рис. 2. Результат прогнозируемых значений для выходных данных в виде карты районов, подверженных эрозионным изменениям в 2021 г. [14].

Скачать (57KB)
4. Рис. 3. Прогностическая модель распределения загрязнителей в атмосферном воздухе [4].

Скачать (181KB)

Мы используем файлы cookies, сервис веб-аналитики Яндекс.Метрика для улучшения работы сайта и удобства его использования. Продолжая пользоваться сайтом, вы подтверждаете, что были об этом проинформированы и согласны с нашими правилами обработки персональных данных.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».