№ 4 (2024)
Системы, включающие искусственный интеллект
Этические аспекты использования технологий искусственного интеллекта: состояние дел и перспективы регулирования
Аннотация
В статье рассматриваются этические аспекты внедрения технологий искусственного интеллекта в различные сферы человеческой деятельности. Приводятся примеры нарушений этики и общепринятых общественных норм в отдельных странах. Вводится формальное определение такого распространенного нарушения этических норм, как дискриминация. Исследуются методы снижения проявлений дискриминации при использовании технологий искусственного интеллекта в задачах анализа и синтеза текстов. Делаются выводы о перспективах развития и применения технологий искусственного интеллекта при условии минимизации негативных последствий, связанных с нарушением этических норм. Представлены предложения о возможном регулировании технологий искусственного интеллекта в контексте соблюдения этических норм.



Формализация естественно-языкового описания структурного синтеза технической системы при концептуальном проектировании
Аннотация
В статье рассмотрены способы формализации описания многоуровневого структурного синтеза сложной технической системы на ограниченном естественном языке на разных этапах концептуального проектирования. Предложены логико-лингвистические модели и средства, позволяющие генерировать текст описания структуры технической системы и процесс проектирования на русском языке. Построена информационная модель терминологического словаря для описания технического решения. Разработан лингвистический процессор, реализующий текстообразование. Приведены примеры естественно-языкового описания этапов структурного синтеза технического устройства.



Вычислительный интеллект
Нечеткие метрики на основе генераторов архимедовых треугольных норм из класса рациональных функций
Аннотация
В статье представлены результаты, касающиеся развития подхода к построению параметрических нечетких метрик на основе аддитивных генераторов строгих треугольных норм из класса рациональных функций. Нечеткие метрики были апробированы на задаче нечеткой кластеризации, характеризующейся определением степени принадлежности каждого объекта каждому кластеру, что позволяет более гибко группировать объекты заданного множества. Проведенный вычислительный эксперимент убедительно демонстрирует превосходство новых нечетких метрик по сравнению с евклидовой метрикой с учетом известных и широко используемых критериев качества кластеризации. Нечеткий подход позволяет «работать» с приближенными значениями расстояния, что важно при наличии неопределенности, поэтому его можно рассматривать как элемент интеллектуальных технологий, который целесообразно использовать при разработке информационных систем различного назначения.



Распознавание особых участков генома методами машинного обучения
Аннотация
В статье изучаются вопросы распознавания особых структурных сегментов геномов, называемых промотерами. Для решения задачи распознавания промотера впервые применены методы машинного обучения, основанные на логическом анализе и классификации данных. Эти методы базируются на поиске информативных фрагментов в признаковых описаниях прецедентов и ориентированы на обработку целочисленной информации низкой значности. Искомые фрагменты хорошо интерпретируемы и позволяют отличать промотеры от других областей генома, однако их поиск требует больших временных затрат. Приведены результаты экспериментов на несбалансированной выборке большого объема, при этом рассмотрен как традиционный способ формирования признаков, использующий k-меры, так и методика прямого применения классификатора к исходным данным. Показано, что во втором случае качество логической классификации существенно выше и составляет 94,3% по ROC-AUC с использованием ансамблевого подхода. Наилучший результат, а именно, точность по ROC-AUC равную 95,1%, показал классификатор Catboost при прямом применении к исходной выборке. При традиционном способе формирования признаков точность Catboost равна 94,8%.



Анализ текстовой и графической информации
Семиотическая модель для представления когнитивных структур языка агглютинативного типа
Аннотация
Статья посвящена описанию семиотической модели для представления когнитивных структур на основе семиотических универсалий языка агглютинативного типа в рамках создания объяснительного искусственного интеллекта. Рассматривается децентрализованная семиотическая модель агглютинативных естественных языков как средство организации когнитивных процессов и взаимодействия между интеллектуальными агентами. Представлена программно-алгоритмическая структура прототипа системы сопровождения семиотической модели на примере татарского языка.



Разработка графовой нейросети обработки текстовых данных
Аннотация
В статье рассматривается графовое моделирование текстовых данных с использованием нейронных сетей. Целью работы является разработка графовой нейронной сети для классификации и кластеризации текстов по смысловому содержанию. Представлены тексты в виде графов, где вершины - концепты, а ребра - связи между ними. Использованы публичные текстовые корпуса на русском и английском языках. Предложен новый подход к анализу текстовых данных на основе их представления в виде ориентированных взвешенных графов и обработки графовыми нейронными сетями. Обработка графов осуществлялась нейросетью с тремя слоями графовых сверток. Полученные результаты показывают точность более 90% при классификации тематических групп и кластеризации текстов, превосходя методы RNN, CNN и doc2vec.



Методы анализа риторических структур в текстах на русском языке
Аннотация
В работе анализируется опыт построения автоматических дискурсивных анализаторов для русского языка в рамках теории риторических структур (ТРС). Проводится анализ применимости различных предобученных кодирующих языковых моделей к риторическому анализу на основе двух русскоязычных корпусов. Предложен метод обучения нейросетевых моделей для автоматического анализа риторических структур на смешении любых данных экспертной ТРС-разметки, позволяющий не зависеть от различий между принятыми в них наборами риторических отношений. Метод оценен на материале двух больших мультижанровых корпусов риторической разметки для русского языка.



Содержательные критерии отнесения утверждений из текстов к категориям «события» и «факторы»
Аннотация
Цель настоящей работы – совершенствование и автоматизация языковых моделей извлечения из текстовых документов утверждений, связанных с событиями и факторами, с использованием разработанной системы лингвистических маркеров. В статье приведены результаты апробации текст-майнинговых моделей извлечения событий и факторов на примере аналитического исследования в сфере человеческого потенциала, социальных и гуманитарных наук. Тестирования и оценка качества моделей реализованы на основе сопоставления результатов, получаемых в автоматическом режиме, в ручном режиме (при экспертно-аналитической валидации) и полуавтоматическом режиме (с использованием системы лингвистических маркеров). В результате внедренных подходов повысилось качество извлечения утверждений, содержащих события и факторы.



Анализ сигналов, аудио и видео информации
Метод структурного синтеза и параметрической идентификации системы машинного зрения
Аннотация
В статье представлены материалы исследований по разработке математических моделей систем машинного зрения с применением теории модифицированных дескриптивных алгебр изображений. Сформулированы основные определения математических объектов и операций над ними, которые используются в структурном синтезе моделей. Приведена общая постановка параметрической идентификации модели системы машинного зрения. Описаны математические модели систем машинного зрения для трех задач по измерению площади объектов различной природы. Даются рекомендации по статистической оценке значений вариационных параметров модели при обработке множества изображений.



Модель для объяснимой оценки злокачественности легочных узелков на КТ-изображениях
Аннотация
Для решения проблемы непрозрачности современных систем оценки злокачественности образований легких предложена основанная на понятиях объяснимая модель с использованием обобщенных аддитивных моделей. Модель обнаруживает набор клинически значимых признаков в дополнение к окончательному показателю злокачественности новообразований и изучает связь и вклад между атрибутами узелков в легких и окончательным решением. Она предоставляет понятные человеку объяснения с точки зрения различных признаков, таких как плотность, внутренняя текстура, их значений и вклада в окончательный прогноз. Численные эксперименты показали, что результаты диагностики, полученные с использованием модели, соответствуют аналогичным закономерностям, наблюдаемым в клинической практике между атрибутами узелков в легких и показателем злокачественности новообразований. Приведены примеры прогнозов, сгенерированных с помощью разработанной модели.


