AutoML: исследование существующих программных реализаций и определение общей внутренней структуры решений
- Авторы: Попова И.А.1, Гапанюк Ю.Е.1, Ревунков Г.И.1
-
Учреждения:
- Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)»
- Выпуск: Том 73, № 1 (2023)
- Страницы: 43-54
- Раздел: Интеллектуальный анализ данных
- URL: https://ogarev-online.ru/2079-0279/article/view/286864
- DOI: https://doi.org/10.14357/20790279230106
- ID: 286864
Цитировать
Полный текст
Аннотация
В статье рассматриваются различные программные реализации автоматизации процесса машинного обучения для решения задачи регрессии. Рассмотрено внутреннее устройство и возможности ряда существующих и обширно используемых инструментов автоматизированного машинного обучения таких, как LightAutoML (LAMA), TPOT, Auto-Sklearn, H2O AutoML, MLJAR. Возможности данных программных систем были исследованы для решения задачи регрессии на нескольких наборах данных. В результате исследования была выведена общая структура программного решения автоматизированного машинного обучения, которая может быть взята за основу при дальнейшем проектировании и разработке собственного программного продукта, а также проанализирована точность, с которой системы предсказывали значения целевого признака.
Ключевые слова
Об авторах
Инна Андреевна Попова
Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)»
Email: popovai1@student.bmstu.ru
аспирант
Россия, 105005, Москва, 2-я Бауманская, д. 5Юрий Евгеньевич Гапанюк
Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)»
Автор, ответственный за переписку.
Email: gapyu@bmstu.ru
доцент
Россия, 105005, Москва, 2-я Бауманская, д. 5Георгий Иванович Ревунков
Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)»
Email: revunkov@bmstu.ru
доцент
Россия, 105005, Москва, 2-я Бауманская, д. 5Список литературы
- Nagarajah, T., Poravi, G. A Review on Automated Machine Learning (AutoML) Systems. In: 2019 IEEE 5th International Conference for Convergence in Technology (I2CT), pp. 1–6. Pune, India (2019). https://doi.org/10.1109/I2CT45611.2019.9033810
- Bahri, M., Salutari, F., Putina, A. et al. AutoML: state of the art with a focus on anomaly detection, challenges, and research directions. Int J Data Sci Anal (2022). https://doi.org/10.1007/s41060-022-00309-0
- Karmaker, S., Hassan, M.M., Smith, M.J., Xu, L., Zhai, C., Veeramachaneni, K. AutoML to Date and Beyond: Challenges and Opportunities. ACM Computing Surveys (CSUR) 54, 1–36 (2022)
- He X., Zhao K., Chu X. AutoML: A survey of the state-of-the-art. Knowl. Based Syst., 212, 106622. https://doi.org/10.1016/j.knosys.2020.106622
- Escalante, H.J. Automated Machine Learning – a brief review at the end of the early years. arXiv:2008.08516. https://doi.org/10.48550/ arXiv.2008.08516
- Bahri, M., Salutari, F., Putina, A., Sozio, M. AutoML: state of the art with a focus on anomaly detection, challenges, and research directions. International Journal of Data Science and Analytics, Springer Verlag, 2022. https://doi.org/10.1007/ s41060-022-00309-0
- Koroteev, M.V. Review of some modern trends in machine learning technology. E-Management 1(1), 26–35 (2018)
- Feurer, M., Eggensperger, K., Falkner, S., Lindauer, M.T., Hutter, F. Practical Automated Machine Learning for the AutoML Challenge 2018. In: International Workshop on Automatic Machine Learning at ICML, pp. 1189-1232 (2018)
- Car Dekho Data, https://www.kaggle.com/datasets/ shindenikhil/car-dekho-data. Last accessed 12 December 2022
- Combined Cycle Power Plant Dataset, https:// archive.ics.uci.edu/ ml/ datasets/ Combined+Cycle+Power+Plant. Last accessed 12 December 2022
- LightAutoML – Automatic model creation framework, https://github.com/sb-ailab/LightAutoML. Last accessed 12 December 2022
- TPOT – A Python Automated Machine Learning tool, https://github.com/EpistasisLab/tpot. Last accessed 12 December 2022
- Auto-Sklearn – An automated machine learning toolkit, https://github.com/automl/auto-sklearn. Last accessed 12 December 2022
- H2O AutoML – Open-Source Automated Machine Learning, https://h2o.ai/platform/h2o-automl/. Last accessed 12 December 2022
- MLJAR – Automate your Machine Learning pipeline, https://mljar.com/. Last accessed 12 December 2022
- Chen, Yi-Wei, Qingquan Song, and Xia Hu.: Techniques for automated machine learning. ACM SIGKDD Explorations Newsletter, 35-50 (2021).
- Elshawi, Radwa, Mohamed Maher, and Sherif Sakr: Automated machine learning: State-ofthe-art and open challenges. arXiv preprint arXiv:1906.02287 (2019).
- Vakhrushev, Anton, et al. LightAutoML: AutoML Solution for a Large Financial Services Ecosystem. arXiv preprint arXiv:2109.01528 (2021).
Дополнительные файлы
