Построение модели для прогнозирования двух- и трехкомпонентных неорганических систем в водных растворах спектральным анализом

Обложка

Цитировать

Полный текст

Аннотация

Представлен алгоритм и разработанная на его основе программа, реализующая методы математического моделирования для анализа спектральных данных, построения прогностической модели и выбора оптимальных спектральных интервалов при проектировании мультисенсорных систем на основе светодиодов. Алгоритм прошел апробацию на реальных смесях водных растворов неорганических солей.
Для обработки экспериментальных данных применялись методы многомерной калибровки, включая PLS-регрессию и множественную линейную регрессию. Информативные длины волн определялись с использованием значений вектора Шепли, после чего методом перебора была найдена оптимальная комбинация спектральных интервалов.
Разработанная модель позволяет прогнозировать состав двух- и трехкомпонентных систем в водных растворах солей металлов с использованием ограниченного спектрального диапазона вместо полного видимого спектра. Проведенная кроссвалидация продемонстрировала сопоставимое качество новой модели по сравнению с полноспектральными аналогами, подтвердив ее адекватность и практическую применимость.

Об авторах

Кирилл Юрьевич Массалов

Национальный исследовательский ядерный университет «МИФИ»

Автор, ответственный за переписку.
Email: kirill.massalov@yandex.ru
ORCID iD: 0009-0003-6214-7470
https://www.mathnet.ru/person228575

магистрант; каф. физика элементарных частиц; институт ядерной физики и технологий1

Россия, 115409, Москва, Каширское шоссе, 31

Елена Юрьевна Мощенская

Самарский государственный технический университет

Email: lmos@rambler.ru
ORCID iD: 0000-0002-1070-3151
https://www.mathnet.ru/person39351

кандидат химических наук, доцент; доцент; каф. аналитической и физической химии2

Россия, 443100, Самара, ул. Молодогвардейская, 244

Список литературы

  1. Dubrovkin J. Data Compression in Spectroscopy. Cambridge Scholars Publ., 2022. 355 pp.
  2. Родионова О.Е. Хемометрический подход к исследованию больших массивов химических данных // Рос. хим. ж., 2006. Т. 50, №2. С. 128–144. EDN: HTUUSZ.
  3. Smilde A., Bro R., Geladi P. Multi-Way Analysis: Applications in the Chemical Sciences. Chichester: John Wiley & Sons, 2004. xiv+381 pp. DOI: https://doi.org/10.1002/0470012110.
  4. Богомолов А. Ю. Оптические мультисенсорные системы в аналитической спектроскопии // Рос. хим. ж., 2022. Т. 77, №3. С. 227-247. EDN: MFSPES. DOI: https://doi.org/10.31857/S0044450222030033.
  5. Bogomolov A. Multivariate process trajectories: capture, resolution and analysis // Chemom. Intel. Lab. Syst., 2011. vol. 108, no. 1. pp. 49–63. DOI: https://doi.org/10.1016/j.chemolab.2011.02.005.
  6. Galyanin V., Melenteva A., Bogomolov A. Selecting optimal wavelength intervals for an optical sensor: A case study of milk fat and total protein analysis in the region 400–1100 nm// Sens. Actuat. B: Chem., 2015. vol. 218. pp. 97-104. EDN: UFYADR. DOI: https://doi.org/10.1016/j.snb.2015.03.101.
  7. Мощенская Е. Ю., Стифатов Б. М. Моделирование диаграмм "состав-свойство" для системы "алюминий-кремний" // Журн. Сиб. федер. ун-та. Химия, 2023. Т. 16, №1. С. 107–115. EDN: JWRAGD.
  8. Мощенская Е. Ю., Стифатов Б. М. Исследование возможности применения методов теоретического моделирования для определения эвтектического состава бинарных сплавов // Вестн. Тверск. гос. ун-та. Сер. Химия, 2021. №3. С. 105–122. EDN: JDZAEI. DOI: https://doi.org/10.26456/vtchem2021.3.12.
  9. Holland P. W., Welsch R. E. Robust regression using iteratively reweighted least-squares // Commun. Stat–Theor. M., 1977. vol. 6, no. 9. pp. 813–827. DOI: https://doi.org/10.1080/03610927708827533.
  10. Wegelin J. A. A Survey of Partial Least Squares (PLS) Methods, with Emphasis on the Two-Block Case: Technical Report 371. Washington: Univ. of Washington, 2000. 44 pp. https://stat.uw.edu/research/tech-reports/survey-partial-least-squares-plsmethods-emphasis-two-block-case.
  11. Pedregosa F., Varoquaux G., Gramfort A., et. al. Scikit-learn: Machine learning in Python // J. Mach. Learn. Res., 2011. vol. 12. pp. 2825–2830.
  12. Lundberg S. M., Lee S.-I. A unified approach to interpreting model predictions / Proc. Intern. Conf. Neural Inform. Proces. Systems, 2017. pp. 4768–4777, arXiv: 1705.07874 [cs.AI]. DOI: https://doi.org/10.48550/arXiv.1705.07874.
  13. de Myttenaere A., Golden B., Le Grand B., Rossi F. Mean Absolute Percentage Error for regression models // Neurocomputing, 2016. vol. 192. pp. 38-48. DOI: https://doi.org/10.1016/j.neucom.2015.12.114.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Аппроксимация среднеквадратического отклонения значений Шепли и оптимальные интервалы для раствора с ионами никеля (a), кобальта (b) и меди (c)

Скачать (357KB)
3. Рис. 2. Средняя абсолютная ошибка в процентах (MAPE) для модели, построенной на выделенных интервалах (слева), и для модели, построенной на всем спектре (справа), для ионов никеля (a), кобальта (b) и меди (c)

Скачать (401KB)

© Авторский коллектив; Самарский государственный технический университет (составление, дизайн, макет), 2025

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).