Анализ взаимосвязей между наборами чисел путем построения решающих деревьев

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Рассматривается проблема, как проанализировать статистические взаимосвязи между наборами натуральных чисел. Предполагается, что наборы разбиты на именованные диапазоны, например числовые значения психологических показателей, полученные в ходе тестирования фокус-группы. Анализ предлагается выполнять при помощи решающих деревьев. Цель работы – предложить математический инструмент, позволяющий применить решающие деревья для проверки гипотезы касательно наличия или отсутствия взаимосвязей между двумя и более наборами чисел. Наборы упорядочены по возрастанию и разбиты после этого на диапазоны. Предложен новый подход анализа статистических зависимостей между наборами числовых значений экспериментальных показателей. Изложены преимущества нового подхода по сравнению с тем, что был представлен ранее в рамках разработки математического и алгоритмического обеспечения для анализа количественных результатов тестирований.

Об авторах

В. Ю. Леонов

ФИЦ ИУ РАН

Автор, ответственный за переписку.
Email: m.nor@ro.ru
Москва, Россия

М. М. Норокеску

ФИЦ ИУ РАН

Email: m.nor@ro.ru
Москва, Россия

Список литературы

  1. Проаспэт А.Г., Фёдорова А.Е. Разработка алгоритмического обеспечения анализа срединных значений показателей агрессивности // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 167–172.
  2. Проаспэт А.Г., Кравчени М.С., Пахомов Д.А. Оптимизация методик статистического анализа данных при исследовании показателей агрессивности // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 187–191.
  3. Проаспэт А.Г., Фёдорова А.Е. Разработка алгоритмического обеспечения анализа корреляций между показателями при проведении психологических исследований // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 172–178.
  4. Проаспэт А.Г., Фёдорова А.Е. Разработка математического обеспечения анализа корреляций между показателями при проведении психологических исследований // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2020. С. 178–186.
  5. Сидняев Н. И. Теория планирования эксперимента и анализ статистических данных: учебник и практикум для вузов. 2-е изд., перераб. и доп. М.: Юрайт, 2023. 495 с.
  6. Статистическая обработка результатов исследования [электронный ресурс] // Ярославский гос. педагогический ун-т им. К.Д. Ушинского. URL: http://cito-web.yspu.org/link1/metod/met125/node23.html (дата обращения: 17.04.2020).
  7. Точный критерий Фишера [электронный ресурс] // Медицинская статистика. Библиотека постов MEDSTATISTIC об анализе медицинских данных. URL: https://medstatistic.ru/methods/methods5.html (дата обращения: 28.03.2023).
  8. Показатели, характеризующие качество корреляционного уравнения [электронный ресурс] // Кубанский гос. ун-т. Режим доступа: https://studfile.net/preview/5964733/page:20/ (дата обращения: 30.03.2023).
  9. Проверка качества многофакторных регрессионных моделей. Коэффициент детерминации R2. Скорректированный R2. Проверка гипотез с помощью t-статистик и F-статистик [электронный ресурс] // Теория по эконометрике. URL: https://einsteins.ru/subjects/ekonometrika/teoriya-ekonometrika/mnogofaktornyx-regressionnyx (дата обращения: 17.04.2020).
  10. Дисперсионный анализ [электронный ресурс] // bono esse. Служить добру. записная книжка врача. URL: http://bono-esse.ru/blizzard/Medstat/Statan/stat_da.html (дата обращения: 17.04.2020).
  11. Обнаружение аномалий в данных сетевого мониторинга методами статистики [электронный ресурс] // Сообщество IT-специалистов. URL: https://habr.com/ru/post/344762/ (дата обращения: 16.04.2020).
  12. Черткова Е.А. Статистика. Автоматизация обработки информации: учеб. пособие для среднего профессионального образования. 2-е изд., испр. и доп. М.: Юрайт, 2023. 195 с.
  13. Паронджанов В. Д. Алгоритмические языки и программирование: ДРАКОН: учеб. пособие для вузов. М.: Юрайт, 2021. 436 с.
  14. Проаспэт А.Г. Методика анализа корреляций результатов исследования агрессивности // Сб. матер. X ежегодной научн. конф. аспирантов МГОТУ. М.: Научный консультант, 2020. С. 100–110.
  15. Норокеску М.М. Комбинирование и оптимизация методик анализа упорядоченного набора чисел // Изв. Тульск. гос. ун-та. Технические науки. ISSN 2071-6168. Тула: ТулГУ, 2023. С. 177–180.
  16. Донской В.И. Извлечение оптимизационных моделей из данных: подход на основе решающих деревьев и лесов // ТВИМ. 2017. Т. 4. № 37. URL: https://cyberleninka.ru/article/n/izvlechenie-optimizatsionnyh-modeley-iz-dannyh-podhod-na-osnove-reshayuschih-dereviev-i-lesov (дата обращения: 12.01.2025).
  17. Колмогорова С. С., Голубятникова Н. О. О применении регуляризации структуры больших данных для распределенной системы сбора и прогнозирования параметров объектов наблюдений // Вестн. ВГТУ. 2022. № 5. URL: https://cyberleninka.ru/article/n/o-primenenii-regulyarizatsii-struktury-bolshih-dannyh-dlya-raspredelennoy-sistemy-sbora-i-prognozirovaniya-parametrov-obektov (дата обращения: 12.01.2025).
  18. Хашпер Б.Л., Кантор О.Г. Применение методов случайного поиска и методов машинного обучения к задаче оптимизации в многомерном пространстве // Информационные и математические технологии в науке и управлении. 2023. Т. 3. № 31. URL: https://cyberleninka.ru/article/n/primenenie-metodov-sluchaynogo-poiska-i-metodov-mashinnogo-obucheniya-k-zadache-optimizatsii-v-mnogomernom-prostranstve (дата обращения: 12.01.2025).
  19. Среднее арифметическое, размах, мода и медиана [электронный ресурс] // Calcs.su. URL: https://calcs.su/html/math/grade7/srednee-arifmeticheskoe.html (дата обращения: 16.04.2020).
  20. Вариация, размах, межквартильный размах, среднее линейное отклонение [электронный ресурс] // Статистический анализ в MS Excel. URL: https://statanaliz.info/statistica/opisanie-dannyx/variatsiya-razmakh-srednee-linejnoe-otklonenie/ (дата обращения: 16.04.2020).
  21. Носков С.И., Кириллова Т.К., Ведерников В.С. Применение метода антиробастного оценивания для вычисления оценок параметров однородной формы вложенной кусочно-линейной регрессии // Изв. Тульск. гос. ун-та. Технические науки. 2024. № 7. URL: https://cyberleninka.ru/article/n/primenenie-metoda-antirobastnogo-otsenivaniya-dlya-vychisleniya-otsenok-parametrov-odnorodnoy-formy-vlozhennoy-kusochno-lineynoy (дата обращения: 12.01.2025).
  22. Синицин Ф. Обучение древесных моделей для классификации и регрессии. Эффективное построение решающих деревьев. 2.3. Решающие деревья [электронный ресурс] // Учебник по машинному обучению. URL: https://education.yandex.ru/handbook/ml/article/reshayushchiye-derevya (дата обращения: 01.12.2024).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».