Technology of using machine learning methods for analyzing text information
- Authors: Kopnin A.A1
-
Affiliations:
- Ural State University of Economics
- Issue: No 1 (2025)
- Pages: 227-236
- Section: Articles
- URL: https://ogarev-online.ru/2500-3747/article/view/369049
- DOI: https://doi.org/10.58224/2500-3747-2025-1-227-236
- ID: 369049
Cite item
Full Text
Abstract
the article examines key aspects of implementing the K-means algorithm for clustering reviews. The theoretical foundations of cluster analysis, the specifics of selecting distance metrics, and approaches to determining the optimal number of clusters are presented. Based on textual data from passenger reviews, preliminary data processing was performed, including text cleaning, normalization, and the construction of a document-term matrix. Clustering was carried out using the K-means algorithm, and the results were visualized and analyzed.
References
- British Airways Passenger Reviews (2016-2023) // Kaggle. URL: https://www.kaggle.com/datasets/praveensaik/british-airways-passenger-reviews-2016-2023 (дата обращения 20.07.2024)
- Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. М.: Питер, 2020. 336 с.
- Бурков А. Машинное обучение без лишних слов. М.: Питер, 2020. 160 с.
- Гачаев А.М., Датаев А.А., Мурадова П.Р. Исследование технологии компьютерной обработки информации в условиях больших данных // Журнал монетарной экономики и менеджмента. 2023. № 1. С. 90 – 94.
- Батаева Б.С., Карпов Н.А. Влияние факторов корпоративного управления на уровень раскрытия ESG-информации российскими публичными компаниями // Управленец. 2023. Т. 14. № 3. С. 30 – 43.
- Копнин А.А. Способы и методы машинного обучения: интеграция, взаимодействие и дополнение методов // Наука и бизнес: пути развития. 2023. № 12 (150). С. 21– 24.
- Ланц Б. Машинное обучение на R: экспертные техники для прогностического анализа. М.: Питер, 2020. 464 с.
- Назаров Д.М., Рыжкина Д.А. Интеллектуальные средства бизнес-аналитики: учебное пособие. М.: КНОРУС, 2022. 242 с.
- Назаров Д.М. Анализ семантики понятий машинного обучения и Data science // Современные тренды управления и цифровая экономика: от регионального развития к глобальному экономическому росту: сборник статей V Международной научно-практической конференции, Екатеринбург, 10 августа 2023 года / Институт цифровой экономики и права. Екатеринбург: Общество с ограниченной ответственностью "Институт Цифровой Экономики и Права", 2023. С. 42 – 46.
- Стефанова Н.Л. Методы математической обработки данных: учебник и практикум для вузов М.: Юрайт, 2024. 317 с.
- Благинин В.А., Соколова Е.В., Адакава М.И. Достижения и тенденции в области нейротехнологий и искусственного интеллекта в Российской Федерации: комплексный наукометрический анализ // Цифровые модели и решения. 2023. Т. 2. № 4. С. 13 – 29.
- Элежбиев Б.Э., Джабраилов И.А., Юсупова Р.В. Использование технологии компьютерных баз данных в целях повышения эффективности управления информацией современного предприятия // Журнал монетарной экономики и менеджмента. 2023. № 1. С. 156 – 159.
Supplementary files

