Расширение базы данных сбалансированного лингвистического корпуса значениями тонального словаря (корпусный эксперимент)
- Авторы: Горожанов А.И.1, Степанова Д.В.2
-
Учреждения:
- Московский государственный лингвистический университет
- Минский государственный лингвистический университет
- Выпуск: № 7(888) (2024)
- Страницы: 29-35
- Раздел: Языкознание
- URL: https://ogarev-online.ru/2542-2197/article/view/299410
- ID: 299410
Цитировать
Полный текст
Аннотация
В предлагаемом исследовании ставится цель разработать и апробировать алгоритм расширения сбалансированного динамического лингвистического корпуса объемом более 3 млн токенов коннотативными характеристиками. При этом авторы опираются на оригинальные программные решения, созданные в лаборатории фундаментальных и прикладных проблем виртуального образования ФГБОУ ВО МГЛУ. В результате получен штатно функционирующий корпус с возможностью дополнения отдельных его фрагментов данными о коннотациях токенов и предложений.
Об авторах
Алексей Иванович Горожанов
Московский государственный лингвистический университет
Автор, ответственный за переписку.
Email: a.gorozhanov@linguanet.ru
доктор филологических наук, доцент, профессор кафедры грамматики и истории немецкого языка факультета немецкого языка
РоссияДарья Валерьевна Степанова
Минский государственный лингвистический университет
Email: daryastepanova79@gmail.com
кандидат филологических наук, доцент, доцент кафедры теории и практики английской речи факультета английского языка
БелоруссияСписок литературы
- Горожанов А. И., Гусейнова И. А., Степанова Д. В. Обработка естественного языка и художественный текст: база для корпусного исследования // Вестник Российского университета дружбы народов. Серия: Теория языка. Семиотика. Семантика. 2024. Т. 15. №1. C. 195–210. doi: 10.22363/2313-2299-2024-15-1-195-210.
- Степанова Д. В. Программный комплекс для генерации динамического корпуса текстов СМИ // Вестник Минского государственного лингвистического университета. Серия 1: Филология. 2023. № 6 (127). С. 123–130. EDN FMBTKO.
- Горожанов А. И. Расширение стандартного сбалансированного лингвистического корпуса, построенного по правилам spaCy, коннотативными характеристиками // Филологические науки. Вопросы теории и практики. 2023. Т. 16. № 11. С. 3888–3893. doi: 10.30853/phil20230594. EDN FVUIUL.
- Черничкин Д. А., Кривенко А. И. Медиаобраз России в казахстанских телеграм-каналах // Политическая экспертиза: ПОЛИТЭКС. 2023. Т. 19. № 4. С. 565–586. doi: 10.21638/spbu23.2023.404. EDN POURDG.
- Комарова Е. В. Проблема цифрового этикета в русских и английских медиатекстах: на материале миграционного дискурса // Медиалингвистика. 2023. Т. 10. № 2. С. 253–264. doi: 10.21638/spbu22.2023.207. EDN MFJOQV.
- Глушак В. М. Отрицание немецких полярных слов и выражений в автоматизированном анализе тональности текста // Филологические науки. Вопросы теории и практики. 2023. Т. 16. № 10. С. 3287–3292. DOI 10.30853/ phil20230510. EDN CWDXEU.
- Чернышевич М. В. Принципиальная схема решения задачи АСАТ и его лингвистическое обеспечение // Вестник Минского государственного лингвистического университета. Серия 1: Филология. 2018. № 3 (94). С. 72–80. EDN WXUUJR.
Дополнительные файлы
