Technology of using machine learning methods for analyzing text information

Cover Page

Cite item

Full Text

Abstract

the article examines key aspects of implementing the K-means algorithm for clustering reviews. The theoretical foundations of cluster analysis, the specifics of selecting distance metrics, and approaches to determining the optimal number of clusters are presented. Based on textual data from passenger reviews, preliminary data processing was performed, including text cleaning, normalization, and the construction of a document-term matrix. Clustering was carried out using the K-means algorithm, and the results were visualized and analyzed.

About the authors

A. A Kopnin

Ural State University of Economics

References

  1. British Airways Passenger Reviews (2016-2023) // Kaggle. URL: https://www.kaggle.com/datasets/praveensaik/british-airways-passenger-reviews-2016-2023 (дата обращения 20.07.2024)
  2. Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. М.: Питер, 2020. 336 с.
  3. Бурков А. Машинное обучение без лишних слов. М.: Питер, 2020. 160 с.
  4. Гачаев А.М., Датаев А.А., Мурадова П.Р. Исследование технологии компьютерной обработки информации в условиях больших данных // Журнал монетарной экономики и менеджмента. 2023. № 1. С. 90 – 94.
  5. Батаева Б.С., Карпов Н.А. Влияние факторов корпоративного управления на уровень раскрытия ESG-информации российскими публичными компаниями // Управленец. 2023. Т. 14. № 3. С. 30 – 43.
  6. Копнин А.А. Способы и методы машинного обучения: интеграция, взаимодействие и дополнение методов // Наука и бизнес: пути развития. 2023. № 12 (150). С. 21– 24.
  7. Ланц Б. Машинное обучение на R: экспертные техники для прогностического анализа. М.: Питер, 2020. 464 с.
  8. Назаров Д.М., Рыжкина Д.А. Интеллектуальные средства бизнес-аналитики: учебное пособие. М.: КНОРУС, 2022. 242 с.
  9. Назаров Д.М. Анализ семантики понятий машинного обучения и Data science // Современные тренды управления и цифровая экономика: от регионального развития к глобальному экономическому росту: сборник статей V Международной научно-практической конференции, Екатеринбург, 10 августа 2023 года / Институт цифровой экономики и права. Екатеринбург: Общество с ограниченной ответственностью "Институт Цифровой Экономики и Права", 2023. С. 42 – 46.
  10. Стефанова Н.Л. Методы математической обработки данных: учебник и практикум для вузов М.: Юрайт, 2024. 317 с.
  11. Благинин В.А., Соколова Е.В., Адакава М.И. Достижения и тенденции в области нейротехнологий и искусственного интеллекта в Российской Федерации: комплексный наукометрический анализ // Цифровые модели и решения. 2023. Т. 2. № 4. С. 13 – 29.
  12. Элежбиев Б.Э., Джабраилов И.А., Юсупова Р.В. Использование технологии компьютерных баз данных в целях повышения эффективности управления информацией современного предприятия // Журнал монетарной экономики и менеджмента. 2023. № 1. С. 156 – 159.

Supplementary files

Supplementary Files
Action
1. JATS XML


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).