Оценивание традиционных числовых характеристик многомодальных законов распределения одномерной случайной величины в условиях статистических данных большого объёма

Обложка
  • Авторы: Лапко А.В.1,2, Лапко В.А.3,4
  • Учреждения:
    1. Институт вычислительного моделирования Сибирского отделения РАН
    2. Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнёва
    3. Институт вычислительного моделирования Сибирского отделения Российской академии наук
    4. Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева
  • Выпуск: Том 74, № 2 (2025)
  • Страницы: 47-54
  • Раздел: ОБЩИЕ ВОПРОСЫ МЕТРОЛОГИИ И ИЗМЕРИТЕЛЬНОЙ ТЕХНИКИ
  • URL: https://ogarev-online.ru/0368-1025/article/view/351169
  • ID: 351169

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Рассмотрено оценивание традиционных числовых характеристик многомодальных симметричного и несимметричного законов распределения одномерных случайных величин при больших объёмах статистических данных. Выполнен сравнительный анализ эффективности методов оценивания указанных характеристик по исходным статистическим данным и по результатам декомпозиции этих данных с использованием четырёх формул дискретизации интервала значений случайной величины – Старджесса, Брукса-Каррузера, Хайнхольда-Гаеде и формулы оптимальной дискретизации, предложенной авторами настоящей статьи. Применение таких формул дискретизации позволяет обойти проблему больших выборок. Для этого сформированы массивы данных, позволяющие оценивать числовые характеристики законов распределения случайных величин с учётом их дискретных значений. По преобразованным массивам данных вычислены оценки математического ожидания, среднего квадратического отклонения, коэффициентов асимметрии и эксцесса. Сравнены оценки числовых характеристик рассмотренных законов распределения для непрерывной и дискретной случайных величин при различных объёмах исходных статистических данных. Установлена эффективность методов оценивания числовых характеристик многомодальных законов распределения по исходной статистической информации и результатам преобразования данной информации с использованием указанных формул дискретизации. Достоверность сравнения показателей эффективности исследуемых методов подтверждена с применением критерия Колмогорова-Смирнова. Показано, что формула Хайнхольда-Гаеде и предложенная авторами формула оптимальной дискретизации более эффективны по сравнению с формулами Старджесса и Брукса-Каррузера. Полученные результаты можно использовать при обработке данных дистанционного зондирования природных объектов, которые характеризуются большим объёмом статистической информации и многомодальными законами распределения спектральных признаков.

Об авторах

А. В. Лапко

Институт вычислительного моделирования Сибирского отделения РАН; Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнёва

Email: lapko@icm.krasn.ru
ORCID iD: 0000-0002-0664-3870
SPIN-код: 3913-2670

В. А. Лапко

Институт вычислительного моделирования Сибирского отделения Российской академии наук; Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева

Email: valapko@yandex.ru
ORCID iD: 0000-0001-6938-9323
SPIN-код: 2115-4928

Список литературы

  1. Лапко А. В., Лапко В. А. Оценивание традиционных числовых характеристик логнормальных законов распределения одномерной случайной величины в условиях большого объёма статистических данных. Измерительная техника, 73(2), 23–29 (2024). https://doi.org/10.32446/0368-1025it.2024-2-23-29; https://elibrary.ru/jxkngi
  2. Шипко В. В., Борзов С. М. Исследование эффективности классификации гиперспектральных данных при ограничениях на разрядность квантования, количество спектральных каналов и пространственное разрешение. Автометрия, 58(3), 79–87 (2022). https://doi.org/10.15372/AUT20220309; https://elibrary.ru/amztfv
  3. Борзов С. М., Нежевенко Е. С. Нейросетевые технологии в задачах обнаружения и классификации объектов. Автометрия, 59(3), 52–71 (2023). https://doi.org/10.15372/AUT20230307; https://elibrary.ru/uwyaqy
  4. Лебедев И. С. Адаптивное применение моделей машинного обучения на отдельных сегментах выборки в задачах регрессии и классификации. Информационно-управляющие системы, (3), 20–30 (2022). https://doi.org/10.31799/1684-8853-2022-3-20-30; https://elibrary.ru/zoevfc
  5. Кивчун О. Р. Алгоритм проверки данных на негауссовость с использованием алгоритмов векторного рангового анализа. Информационные технологии, 30(4), 198–205 (2024). https://doi.org/10.17587/it.30.198-205; https://elibrary.ru/yjwckt
  6. Шаруева А. В., Лапко А. В., Лапко В. А. Непараметрические методы проверки гипотез о распределениях случайных величин при анализе данных дистанционного зондирования. СО РАН, Новосибирск (2024). https://doi.org/10.53954/9785604990094; https://elibrary.ru/dfbrbi
  7. Лапко А. В., Лапко В. А. Сравнение эффективности методов дискретизации интервала изменения значений случайной величины при синтезе непараметрической оценки плотности вероятности. Измерительная техника, (3), 5–8 (2014). https://elibrary.ru/saehkp
  8. Sturges H. A. The choice of a class interval. Journal of the American Statistical Association, 21, 65–66 (1926). https://doi.org/10.1080/01621459.1926.10502161
  9. Storm R. Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle. Fachbuchverlag, Leipzig, (2001). (In German)
  10. Heinhold J., Gaede K.-W. Ingenieur-Statistik. R. Oldenbourg Verlag, München-Wien (1972). (In German) https://doi.org/10.1002/cite.330450621
  11. Лапко А. В., Лапко В. А. Оценивание интеграла от квадрата плотности вероятности одномерной случайной величины. Измерительная техника, (7), 22–28 (2020). https://doi.org/10.32446/0368-1025it.2020-7-22-28; https://elibrary.ru/nteghi
  12. Robertson C. A., Fryer J. G. Some descriptive properties of normal mixtures. Scandinavian Actuarial Journal, 1969(3-4), 137–146 (1969). https://doi.org/10.1080/03461238.1969.10404590
  13. Eisenberger I. Genesis of bimodal distributions. Technometrics, 6(4), 357–363 (1964). https://doi.org/10.1080/00401706.1964.10490199
  14. Ray S., Lindsay B. G. The topography of multivariate normal mixtures. Annals of Statistics, 33(5), 2042–2065 (2005). https://doi.org/10.1214/009053605000000417

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).