Распределение возвышений морской поверхности в форме двухкомпонентной гауссовой смеси
- Авторы: Запевалов А.С.1, Князьков А.С.1
-
Учреждения:
- ФИЦ Морской гидрофизический институт РАН
- Выпуск: № 1 (2024)
- Страницы: 20-30
- Раздел: Статьи
- URL: https://ogarev-online.ru/2413-5577/article/view/255834
- EDN: https://elibrary.ru/EHKUET
- ID: 255834
Цитировать
Аннотация
Верифицирована аппроксимация функции плотности вероятностей возвышений морской поверхности двухкомпонентной гауссовой смесью. Для верификации использованы данные прямых волновых измерений, полученные на стационарной океанографической платформе, установленной в Черном море. Критерием корректности аппроксимации выбрана относительная ошибка ε отклонения модельной функции плотности вероятности от экспериментальной функции, рассчитанной по данным волновых измерений. Средняя по ансамблю ситуаций относительная ошибка ⟨ε⟩ мала, если значения нормированного на среднеквадратическую величину возвышения поверхности лежат в области | ξ | < 3. Среднеквадратическое отклонение относительной ошибки минимально при | ξ | ≈ 0 и равняется 0.12, при | ξ | = 3 возрастает до ~ 0.5. Показано, что ошибка ⟨ε⟩ имеет систематическую составляющую, которая зависит от отклонений третьего и четвертого статистических моментов от значений, соответствующих распределению Гаусса. Построена полуэмпирическая зависимость, позволяющая учесть эту составляющую. Отмечено, что точность аппроксимации можно повысить в 2–3 раза, исключив систематическую составляющую.
Ключевые слова
Полный текст
Введение
Морское поверхностное волнение является слабо нелинейным процессом, а статистические распределения возвышений и уклонов морской поверхности близки к распределению Гаусса [1]. Хотя отклонения от распределения Гаусса малы, они играют важную роль в приложениях, связанных с дистанционным зондированием океана [2, 3], а также при прогнозе появления аномальных волн [4].
Для статистического описания морской поверхности, как правило, используются распределения, построенные на основе усеченных рядов Грама – Шарлье или Эджворта [5, 6]. Распределения являются разложением искомой функции плотности вероятности по ортогональным полиномам Чебышева – Эрмита. Использование усеченных рядов приводит к искажениям искомой функции плотности вероятностей, связанным с появлением у нее отрицательных значений, а также нескольких локальных максимумов [7–9].
Актуальность поиска новых подходов к статистическому описанию морской поверхности определяется тем, что существующие модели не позволяют строить функцию плотности вероятностей возвышений морской поверхности во всем диапазоне их изменений. Одним из возможных решений данной проблемы является аппроксимация распределения квазигауссового процесса двухкомпонентной гауссовой смесью. Распределения этого типа пока не нашли широкого применения в океанологии, что, возможно, связано со сложной процедурой расчета их параметров [10]. Впервые использовать такую модель для описания морской поверхности было независимо предложено в работах [11, 12], в которых строились функции плотности вероятностей для уклонов морской поверхности. Недавно двухкомпонентную гауссову смесь было предложено использовать для описания распределений возвышений морской поверхности [13]. Для искомой гауссовой смеси, как и при построении распределений Грама – Шарлье и Эджворта, неизвестные параметры рассчитываются по известным статистическим моментам.
Целью данной работы является анализ возможности и границ использования двухкомпонентной гауссовой смеси для описания распределения возвышений морской поверхности. Анализ проводится на основе проведенных на Черном море прямых измерений морских волн.
Двухкомпонентная гауссова смесь
Конечные гауссовы смеси широко используются в разных областях для аппроксимации неизвестных функций плотности вероятностей [9, 14]. Двухкомпонентная гауссова смесь случайной величины ξ имеет вид [15]
(1)
где αi – вес i-й компоненты (i = 1, 2), αi ∈ (1, 2); mi – математическое ожидание; σi2 – дисперсия. Весовые коэффициенты удовлетворяют условию
α1 + α2 = 1. (2)
С учетом условия (2) для построения PS(ξ) необходимо найти пять параметров: m1, m2, σ1, σ2 и α1. В работе [13] предложено рассчитывать их по первым пяти статистическим моментам возвышений морской поверхности. Недостаток такого подхода состоит в том, что по данным волновых измерений в морских условиях, как правило, определяются статистические моменты только до четвертого порядка включительно [16–18]. Поэтому для расчета параметров модели (m1, m2, σ1, σ2) будем использовать первые четыре статистических момента, оставляя пятый параметр (α1) свободным [11]. Параметр α1 будем варьировать для удовлетворения условия одномодальности распределения.
Процедура расчета параметров модели (1) описана в работе [10]. Она сводится к решению системы уравнений
, (3)
, (4)
, (5)
, (6)
где μi есть статистический момент порядка i :
,
Будем полагать, что средний уровень поверхности равен нулю (μ1 = 0), и дисперсия анализируемой случайной величины равна 1 (μ2 = 1). Параметры μ3 и μ4 – 3 являются коэффициентами асимметрии и эксцесса соответственно. Система уравнений (3)–(6) симметрична относительно троек параметров (m1, σ12, α1) и (m2, σ22, α2).
Верификация
Для верификации модельной функции плотности вероятностей возвышений морской поверхности (1) использованы данные волновых измерений, полученные на стационарной океанографической платформе Морского гидрофизического института РАН [19]. Измерения проводились в течение декабря 2018 г. Платформа установлена в Черном море в 600 м от берега на глубине около 30 м. Волны измерялись струнным волнографом [20].
Измерения проводились при ветровых условиях, которые менялись в пределах от штиля до скорости ветра 25 м/с. Значительная высота волн (средняя высота 1/3 самых высоких волн) менялась в пределах от 0.23 м до 2.26 м, максимальная высота волн достигала 4.9 м. Длины волн, соответствующих пику волнового спектра, лежали в пределах от 10 до 120 м.
Процедура верификации осуществлялась следующим образом. Непрерывные волновые измерения разбивались на волнограммы продолжительностью 20 мин. Общий объем данных для анализа составил более 2200 волнограмм. Каждая волнограмма центрировалась и нормировалась таким образом, чтобы ее дисперсия равнялась единице, затем для каждой волнограммы вычислялась экспериментальная функция плотности вероятностей PE (ξ). Вычислялись также статистические моменты μ3 = ⟨ξ3⟩ и μ4 = ⟨ξ4⟩, по которым рассчитывались параметры двухкомпонентной гауссовой смеси PS (ξ). Здесь и далее символ ⟨ ⟩ означает осреднение.
Согласно волновым измерениям, ранее проведенным на Черном море, значения статистических моментов μ3 и μ4 в основном лежат в диапазонах [19]
и . (7)
Эти же диапазоны были определены по измерениям в Северном море [18]. Выход за пределы указанных диапазонов, как правило, происходит в ситуациях, когда наблюдаются аномально высокие волны (волны-убийцы) [17]. В настоящей работе мы ограничимся анализом ситуаций, когда μ3 и μ4 удовлетворяют условию (7).
Экспериментальная функция плотности вероятностей рассчитывается на основе анализа гистограммы возвышений морской поверхности. Ширина интервалов Dξ была выбрана равной 0.45. Функция PE (ξ) получена из гистограммы путем нормирования на общее число точек в волнограмме и на ширину интервала.
Процедура верификации модели двухкомпонентной гауссовой смеси заключается в сравнении функций PE (ξ) и PS (ξ). Критерием соответствия модели (1) данным волновых измерений является относительная ошибка
для которой рассчитываются среднее значение ⟨ε(ξ)⟩ и среднеквадратическое отклонение δ(ξ) = ⟨(ε(ξ) – ⟨ε(ξ)⟩)2⟩0.5.
Для расчета гауссовой смеси PS (ξ) была выбрана процедура, описанная в работе [10]. Система уравнений (3)–(6) с учетом условия (2) сводилась к одному полиномиальному уравнению шестой степени от m1
(8)
решения которого для заданных значений μ3 и μ4 находились численно методом Ньютона при варьировании α1. Коэффициенты, входящие в уравнение (8), были проанализированы в работе [10], где показано, что кроме редкого случая μ3 = 0 и μ4 > 3, оно всегда имеет решение и построение функции плотности вероятности возможно. Из полученных нескольких решений для различных возможных α1 выбиралось то, которое соответствует физическому условию одномодальности получаемого распределения и положительности значений σ12 и σ22, которые пересчитывались, как и m2, из значения m1 по методике, рассмотренной в работе [3]. Значения μ3 и μ4, вычисляемые для полученной в результате решения уравнения (8) модельной гауссовой смеси PS (ξ), сравнивались со значениями, рассчитанными по волнограмме и использованными в исходных уравнениях (3)–(6). Точность совпадения рассчитанных по гауссовой смеси и по волнограмме значений μ3 и μ4 достигается не хуже 10–3.
Функции ⟨ε(ξ)⟩ и δ(ξ) показаны на рис. 1. Здесь N(ξ) – число точек, по которому рассчитывались статистические характеристики в заданном интервале Dξ. Функции ⟨ε(ξ)⟩ и δ(ξ) являются средними по ансамблю ситуаций, в которых проводились измерения, при μ3 и μ4, удовлетворяющих условию (7). Исключены из рассмотрения 11 волнограмм с параметрами μ3 = 0 и μ4 > 3 по причине, указанной выше.
Анализ приведенных на рис. 1 отклонений модельной функции PS (ξ) от экспериментальной PE (ξ) указывает на их малость в окрестности точки ξ = 0 и увеличение с ростом | ξ |. Для диапазона | ξ | < 3 параметры, характеризующие это отклонение, удовлетворяют условиям
,
Для дальнейшего анализа все данные разбивались на группы, соответствующие четырем диапазонам третьего статистического момента: группа 1 – –0.2 < μ3 £ 0, группа 2 – 0 < μ3 £ 0.1, группа 3 – 0.1 < μ3 £ 0.2, группа 4 – 0.2 < μ3 £ 0.3. Рассчитанные для каждой группы оценки ⟨ε(ξ, μ3)⟩ и δi (ξ, μ3) представлены на рис. 2. Здесь индекс i, принимающий значения от единицы до четырех, соответствует номеру группы. Параметр Ni (ξ, μ3) показывает число точек, по которым рассчитывались значения ⟨εi (ξ, μ3)⟩ и δi (ξ, μ3). Среднее значение относительной ошибки ⟨εi (ξ, μ3)⟩ существенно зависит от того, для какой группы оно рассчитывалось, в то же время среднеквадратическое отклонение δi (ξ, μ3) для всех групп почти совпадает. Расхождение между PS (ξ) и PE (ξ) зависит от того, насколько статистический момент μ3 отклоняется от нулевого значения, соответствующего распределению Гаусса. Наибольшие расхождения наблюдаются для группы 4.
Рис. 1. Относительная ошибка ε(ξ) (a) и среднеквадратическое отклонение δ(ξ) (b), рассчитанные по ансамблю ситуаций, число точек N(ξ), по которому рассчитывались статистические характеристики в заданном интервале Dξ (c)
Fig. 1. Relative error ε(ξ) (a) and standard deviation δ(ξ) (b) calculated for an ensemble of situations, the number of points N(ξ) from which statistical characteristics were calculated in a given interval Dξ (c)
Рис. 2. Значения ε(ξ) (a), δ(ξ) (b), N(ξ) (c), рассчитанные для четырех диапазонов μ3: –0.2 < μ3 £ 0 (синий цвет), 0 < μ3 £ 0.1 (красный цвет), 0.1 < μ3 £ 0.2 (коричневый цвет), 0.2 < μ3 £ 0.3 (зеленый цвет)
Fig. 2. Variables ε(ξ) (a), δ(ξ) (b), N(ξ) (c) calculated for four ranges μ3: –0.2 < μ3 £ 0 (blue), 0 < μ3 £ 0.1 (red), 0.1 < μ3 £ 0.2 (brown), 0.2 < μ3 £ 0.3 (green)
Аналогичный подход используем, чтобы проанализировать аппроксимацию плотности вероятностей возвышений морской поверхности при разных значениях четвертого статистического момента. Разобьем данные на группы, соответствующие четырем диапазонам μ4: группа 1 – 2.6 < μ4 £ 2.8, группа 2 – 2.8 < μ4 £ 3.0, группа 3 – 3.0 < μ4 £ 3.2, группа 4 – 3.2 < μ4 £ 3.4. Оценки ⟨εi (ξ, μ4)⟩ и δi (ξ, μ4), рассчитанные для указанных групп, представлены на рис. 3.
Рис. 3. Значения ε(ξ) (a), δ(ξ) (b), N(ξ) (c), рассчитанные для четырех диапазонов μ4: 2.6 < μ4 £ 2.8 (синий цвет), 2.8 < μ4 £ 3.0 (красный цвет), 3.0 < μ4 £ 3.2 (коричневый цвет), 3.2 < μ4 £ 3.4 (зеленый цвет)
Fig. 3. Variables ε(ξ) (a), δ(ξ) (b), N(ξ) (c) calculated for four ranges μ4: 2.6 < μ4 £ 2.8 (blue), 2.8 < μ4 £ 3.0 (red), 3.0 < μ4 £ 3.2 (brown), 3.2 < μ4 £ 3.4 (green)
Разбиение на группы по диапазонам изменения статистических моментов μ3 и μ4 приводит к значительному изменению относительной ошибки аппроксимации плотности вероятностей возвышений морской поверхности. В диапазоне | ξ | < 2 значения δi (ξ, μ3) и δi (ξ, μ4) в 2–3 раза ниже, чем рассчитанные по всему ансамблю ситуаций значения δ(ξ). Это позволяет описывать функцию плотности вероятностей полуэмпирической зависимостью
,
где ⟨εE (ξ)⟩ – средняя относительная ошибка, рассчитанная для соответствующих диапазонов μ3 и μ4.
Заключение
Аппроксимация функции плотности вероятностей возвышений морской поверхности двухкомпонентной гауссовой смесью верифицирована при характерных для прибрежной зоны Черного моря значениях третьего и четвертого статистических моментов, которые меняются в пределах –0.2 < μ3 < 0.3 и 2.6 < μ4 < 3.4. Критерием корректности аппроксимации является отклонение модельной функции плотностей вероятности от рассчитанной по данным волновых измерений, которое характеризуется относительной ошибкой .
В диапазоне | ξ | < 3 значения средней относительной ошибки ⟨ε(ξ)⟩ и ее среднеквадратическое отклонение δ(ξ) малы и удовлетворяют условию |⟨ε(ξ)⟩| < 0.05, δ(ξ) < 0.3. Ошибка аппроксимации ⟨ε(ξ)⟩ имеет систематическую составляющую, которая зависит от отклонений третьего и четвертого статистических моментов от значений, соответствующих распределению Гаусса. Построена полуэмпирическая зависимость, позволяющая учесть эту составляющую. Исключив систематическую составляющую, можно уменьшить δ(ξ), соответственно повысив точность аппроксимации в 2–3 раза.
Об авторах
Александр Сергеевич Запевалов
ФИЦ Морской гидрофизический институт РАН
Автор, ответственный за переписку.
Email: sevzepter@mail.ru
ORCID iD: 0000-0001-9942-2796
Scopus Author ID: 7004433476
ResearcherId: V-7880-2017
главный научный сотрудник, отдел дистанционных методов исследований, доктор физико-математических наук
Россия, 299011, г. Севастополь, ул. Капитанская, д. 2Александр Сергеевич Князьков
ФИЦ Морской гидрофизический институт РАН
Email: fizfak83@yandex.ru
ORCID iD: 0000-0003-1119-1757
SPIN-код: 4254-4825
ведущий инженер, Центр коллективного пользования
Россия, 299011, г. Севастополь, ул. Капитанская, д. 2Список литературы
- Longuet-Higgins M. S. The effect of non-linearities on statistical distribution in the theory of sea waves // Journal of Fluid Mechanics. 1963. Vol. 17, iss. 3. P. 459–480. https://doi.org/10.1017/S0022112063001452
- Hayne G. S. Radar altimeter mean return waveforms from near-normal-incidence ocean surface scattering // IEEE Transactions on Antennas and Propagation. 1980. Vol. 28, no. 5. P. 687–692. doi: 10.1109/TAP.1980.1142398
- Kay S., Hedley J. D., Lavender S. Sun glint correction of high and low spatial resolution images of aquatic scenes: A review of methods for visible and near-infrared wavelengths // Remote Sensing. 2009. Vol. 1, iss. 4. P. 697–730. https://doi.org/10.3390/rs1040697
- Annenkov S. Y., Shrira V. I. Evaluation of skewness and kurtosis of wind waves parameterized by JONSWAP spectra // Journal of Physical Oceanography. 2014. Vol. 44, iss. 6. P. 1582–1594. https://doi.org/10.1175/JPO-D-13-0218.1
- Bréon F. M., Henriot N. Spaceborne observations of ocean glint reflectance and modeling of wave slope distributions // Journal of Geophysical Research: Oceans. 2006. Vol. 111, iss. C6. C06005. https://doi.org/10.1029/2005JC003343
- Callahan P. S., Rodriguez E. Retracking of Jason-1 data // Marine Geodesy. 2004. Vol. 27, iss. 3–4. P. 391–407. https://doi.org/10.1080/01490410490902098
- Kwon O. K. Analytic expressions for the positive definite and unimodal regions of Gram-Charlier series // Communications in Statistics – Theory and Methods. 2022. Vol. 51, iss. 15. P. 5064–5084. https://doi.org/10.1080/03610926.2020.1833219
- Lin W., Zhang J. E. The valid regions of Gram–Charlier densities with high-order cumulants // Journal of Computational and Applied Mathematics. 2022. Vol. 407. 113945. https://doi.org/10.1016/j.cam.2021.113945
- Blinnikov S., Moessner R. Expansions for nearly Gaussian distributions // Astronomy and Astrophysics Supplement Series. 1998. Vol. 130, no. 1. P. 193–205. https://doi.org/10.1051/aas:1998221
- Запевалов А. С., Князьков А. С. Статистическое описание морской поверхности двухкомпонентной гауссовой смесью // Морской гидрофизический журнал. 2022. Т. 38, № 4. С. 422–431.
- Запевалов А. С., Ратнер Ю. Б. Аналитическая модель плотности вероятностей уклонов морской поверхности // Морской гидрофизический журнал. 2003. № 1. С. 3–17.
- Tatarskii V. I. Multi-Gaussian representation of the Cox–Munk distribution for slopes of wind-driven waves // Journal of Atmospheric and Oceanic Technology. 2003. Vol. 20, iss. 11. P. 1697–1705. https://doi.org/10.1175/1520-0426(2003)020<1697:MROTCD>2.0.CO;2
- Gao Z., Sun Z., Liang S. Probability density function for wave elevation based on Gaussian mixture models // Ocean Engineering. 2020. Vol. 213. 107815. https://doi.org/10.1016/j.oceaneng.2020.107815
- Carreira-Perpinan M. A. Mode-finding for mixtures of Gaussian distributions // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2000. Vol. 22, no. 11. P. 1318–1323. https://doi.org/10.1109/34.888716
- Aprausheva N. N., Sorokin S. V. Exact equation of the boundary of unimodal and bimodal domains of a two-component Gaussian mixture // Pattern Recognition and Image Analysis. 2013. Vol. 23, iss. 3. P. 341–347. https://doi.org/10.1134/S1054661813030024
- Бабанин А. В., Полников В. Г. О негауссовости ветровых волн // Морской гидрофизический журнал. 1994. № 3. С. 79–82.
- Guedes Soares C., Cherneva Z., Antão E. M. Characteristics of abnormal waves in North Sea storm sea states // Applied Ocean Research. 2003. Vol. 25, iss. 6. P. 337–344. https://doi.org/10.1016/j.apor.2004.02.005
- Jha A. K., Winterstein S. R. Nonlinear random ocean waves: prediction and comparison with data // Proceedings of the 19th International Offshore Mechanics and Arctic Engineering Symposium. ASME, 2000. Paper No. OMAE 00-6125.
- Запевалов А. С., Гармашов А. В. Асимметрия и эксцесc поверхностных волн в прибрежной зоне Черного моря // Морской гидрофизический журнал. 2021. Т. 37, № 4. С. 447–459. EDN SKHDZD. https://doi.org/10.22449/0233-7584-2021-4-447-459
- Толокнов Ю. Н., Коровушкин А. И. Система сбора гидрометеорологической информации // Системы контроля окружающей среды. 2010. Вып. 13. С. 50–53.
Дополнительные файлы
