Приложение поиска, анализа и прогнозирования данных в социальных сетях

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

В статье описывается веб-сервис, предназначенный для поиска, выгрузки и анализа данных из социальных сетей и мессенджеров, а также демонстрируется его применение для исследования сообществ социальной сети «Вконтакте». Веб-сервис позволяет выявлять типичные профили пользователей сообществ, оценивать эмоциональную окраску постов и комментариев, а также прогнозировать вектор развития сообществ. Описанный в работе веб-сервис обладает обширными функциональными возможностями и оригинальной нейросетевой моделью классификации текстов произвольной длины по эмоциональной окраске. Представлены примеры работы инструмента для анализа развития сообществ автомобильных брендов. Анализ охватывает миллионные аудитории подписчиков, десятки тысяч постов и сотни тысяч комментариев, что подтверждает релевантность выборок и достоверность результатов.

Об авторах

Сергей Александрович Сластников

Национальный исследовательский университет Высшая школа экономики

Автор, ответственный за переписку.
Email: sslastnikov@hse.ru

доцент, кандидат технических наук

Россия, Москва

Лилия Фаилевна Фаилевна

Национальный исследовательский университет Высшая школа экономики

Email: lfzhukova@hse.ru

доцент, кандидат физико-математических наук

Россия, Москва

Илья Владимирович Семичаснов

Национальный исследовательский университет Высшая школа экономики

Email: isemichasnov@hse.ru

директор

Россия, Москва

Список литературы

  1. Smetanin S. Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki [Электронный ресурс] // Mathematics. – 2022. – Vol. 10(16). No. 2497. – URL: https://doi.org/10.3390/math10162947 (дата обращения 19.10.2022).
  2. Ковалева Ю.В., Журавлев А.Л. Общественное настроение и субъективность сетевого сообщества в период пандемии COVID-19: на примере социальной сети твиттер// Институт психологии российской академии наук. Социальная и экономическая психология. – 2020. – N 2 (18). – С. 151 188.
  3. Докука С. В., Валеева Д. Р. Статистические модели для анализа динамики социальных сетей в исследованиях образования// Вопросы образования. – 2015. – N 1. – С. 201 213.
  4. Социальные сети как инструмент изучения психологического портрета потребителя [Электронный ресурс]. – URL: https://econet.ru/articles/69899-sotsialnye-seti-kakinstrument-izucheniya-psihologicheskogo-portretapotrebitelya (дата обращения 19.10.2022).
  5. Анализ личности по социальным сетям как эффективный метод подбора кадров [Электронный ресурс]. – URL: https://www.4dk.ru/news/d/20181005135017- analiz-lichnosti-po-sotsialnym-setyam-kak-effektivnyymetod-podbora-kadrov (дата обращения 19.10.2022).
  6. Ilić S. et al. Deep contextualized word representations for detecting sarcasm and irony //arXiv preprint arXiv:1809.09795. – 2018.
  7. Ke G. et al. Lightgbm: A highly efficient gradient boosting decision tree //Advances in neural information processing systems. – 2017. – Т. 30.
  8. Sparck Jones K. A statistical interpretation of term specificity and its application in retrieval //Journal of documentation. – 1972. – Т. 28. – №. 1. – С. 11-21.
  9. Rogers A. et al. RuSentiment: An enriched sentiment analysis dataset for social media in Russian //Proceedings of the 27th international conference on computational linguistics. – 2018. – С. 755-763.
  10. Sidorov N., Slastnikov S. Some Features of Sentiment Analysis for Russian Language Posts and Comments from Social Networks //Journal of Physics: Conference Series. – IOP Publishing, 2021. – Т. 1740. – №. 1. – С. 012036.
  11. Blinov V., Bolotova-Baranova V., Braslavski P. Large dataset and language model fun-tuning for humor recognition //Proceedings of the 57th annual meeting of the association for computational linguistics. – 2019. – С.4027-4032.
  12. Пикабу. [Электронный ресур]. – URL.: https://pikabu.ru (дата обращения 29.10.2022).
  13. Лидеры и аутсайдеры авторынка РФ в 2021 году [Электронный ресурс]. – URL: https://www.autostat.ru/infographics/50415/ (дата обращения 23.10.2022).
  14. Идеальная длина публикаций для соцсетей [Электронный ресурс]. – URL: https://rusability.ru/pfanshtil/idealnaya-dlina-publikatsiidlya-sotssetei/5fd295792dda593c3483df32 (дата обращения 24.10.2022).
  15. KPI в SMM: как оценить эффективность продвижения в социальных сетях? [Электронный ресурс]. – URL: https://vk.com/@smmmad-kpi-v-smm-kak-ocenit- effektivnost-prodvizheniya-v-socialnyh (дата обращения 24.10.2022).
  16. Система мониторинга и анализа социальных медиа и СМИ [Электронный ресурс]. – URL: https://branalytics.ru/ (дата обращения 28.10.2022).
  17. Медиалогия: мониторинг СМИ и соцсетей, инструмент оценки эффективности коммуникаций [Электронный ресурс]. – URL: https://www.mlg.ru/ (дата обращения 28.10.2022).
  18. Kostenetskiy P.S., Chulkevich R.A., Kozyrev V.I. HPC Resources of the Higher School of Economics // Journal of Physics: Conference Series. – 2021. – T. 1740. – №1. – С. 012050.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».