Лексико-семантический анализ оригинала и перевода художественного текста с использованием инструментов Python

Обложка

Цитировать

Полный текст

Аннотация

В статье рассматриваются возможности автоматизированного лексико-семантического анализа художественного текста и его перевода с применением библиотеки NLTK на языке программирования Python. Языки программирования позволяют значительно ускорить работу лингвистов, систематизировать результаты сбора данных в упорядоченном виде. Объектом анализа выступают оригинал повести американского писателя XIX века Уильяма Гилмора Симмса «Grayling: or, “Murder Will Out”» и перевод на русский язык, выполненный М.Л. Павлычевой. Особое внимание уделяется выявлению различий в структуре лексики, частотности употребления слов и словосочетаний, в распределении частей речи, а также степени лексического разнообразия. Исследование направлено на выявление переводческих трансформаций, влияющих на семантическую и стилистическую организацию текста, и на оценку возможностей автоматизированного анализа при сравнении оригинала и перевода В работе применяются методы обработки естественного языка (NLP) с использованием библиотеки NLTK в среде Python, включая нормализацию текста, частеречное тегирование, частотный анализ, биграммное моделирование и расчет коэффициента лексического разнообразия. Исследование демонстрирует, что автоматизированный лексико-семантический анализ позволяет объективно выявить ключевые различия между оригиналом и переводом: в тексте перевода наблюдается более высокое лексическое разнообразие, обусловленное флективной природой русского языка и активным использованием переводческих трансформаций; увеличивается частотность связующих элементов, а тематически маркированные биграммы заменяются более нейтральными конструкциями. Кроме того, выявлены существенные ограничения стандартных NLP-инструментов при обработке русскоязычных текстов, что подчеркивает необходимость адаптации методов к специфике русского языка. Исследование подтверждает необходимость комплексного подхода при анализе оригинала и перевода художественного текста, сочетающего вычислительные методы и лингвистическую интерпретацию. Перспективы исследования включают применение современных морфологических анализаторов, расширение корпуса текстов и интеграцию методов машинного обучения для глубокого сравнительного анализа оригиналов и переводов художественных текстов.

Об авторах

Зарема Миниаминовна Сафина

ФГБОУ ВО Уфимский университет науки и технологий

Email: safinazarem@yandex.ru
ORCID iD: 0009-0009-3486-7757
доцент; кафедра лингводидактики и переводоведения;

Дарья Николаевна Лукахина

ФГБОУ ВО Уфимский университет науки и технологий

Email: dlukaxina@mail.ru
магистр; кафедра лингводидактики и переводоведения;

Список литературы

  1. Van Der Post H. Natural Language Processing with Python: A comprehensive guide to NLP in the age of AI for 2024. Reactive Publishing, 2023.
  2. Hammond M. Python for Linguists. Padstow, Cornwall: TJ International Ltd, 2020.
  3. Сафина З.М. Методы квантитативной лингвистики при исследовании оригинала и перевода художественного текста // Филология: научные исследования. 2025. № 10. С. 56-64. doi: 10.7256/2454-0749.2025.10.76298 EDN: NGJXWK URL: https://nbpublish.com/library_read_article.php?id=76298
  4. Rana Y. Python: Simple though an Important Programming language // International Research Journal of Engineering and Technology (IRJET). 2019. Vol. 06, Iss. 2. Pp. 1856–1858.
  5. Сафина З. М. Переводческий анализ художественного текста на языке Python // Глобальный научный потенциал. 2024. № 11 (164), Т. 1. С. 177-180. EDN: RTJTGQ.
  6. Ладушина М. И. Как язык Python помогает лексикографам // Journal of Applied Linguistics and Lexicography. 2022. Т. 4, № 2. С. 107-121. doi: 10.33910/2687-0215-2022-4-2-107-121. EDN: UIYYDM.
  7. Гагарин С. Н. Базовые методики анализа языковых картин политики с помощью языка программирования Python и библиотеки NLTK (на материалах корпусов британского парламентского дискурса) // Филологические науки в МГИМО. 2024. 10(2). С. 125-140. doi: 10.24833/2410-2423-2024-2-39-125-140. EDN: GDGMAO.
  8. Simms G.W. Grayling; or Murder Will Out // The Wigwam and the Cabin. New York: Redfield, 1856. Pp. 2-36.
  9. Симмс У. Г. Грейлинг, или "Тайное становится явным" (пер. М. Л. Павлычевой) // Вигвам и хижина. Санкт-Петербург: Дмитрий Буланин, 2018. С. 27-55.
  10. Bird S., Klein E., Loper E. Natural Language Processing with Python. O'Reilly Media, 2009.
  11. Хайрова Н. Ф., Мамырбаев О. Ж., Петрасова С. В., Мухсина К. Ж. Современные технологии обработки текстовых данных на базе пакета NLTK Python: учеб. пособ. Харьков: ООО "В деле", 2020.
  12. Сафина З. М., Корнилова А. Д., Смакова А. Л. Количественный и статистический анализ лексических единиц в художественном переводе // Вестник Башкирского университета. 2022. Т. 27, № 3. С. 741-746. doi: 10.33184/bulletin-bsu-2022.3.42. EDN: FGZGYW.
  13. Морозкина Е. А., Воробьев В. В., Сафина З. М. Статистические методы исследования в художественном переводе // Доклады Башкирского университета. 2023. Т. 8, № 3. С. 130-137. doi: 10.33184/dokbsu-2023.3.15. EDN: KHORTY.
  14. McCarthy P.M., Jarvis S. vocd: A theoretical and empirical evaluation // Language Testing. 2007. 24 (4). Pp. 459-488. doi: 10.1177/0265532207080767. EDN: JTJVXN.
  15. Jurafsky D., Martin J.H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. New Jersey: Prentice Hall, 2009.
  16. Мифтахова Р. Г., Морозкина Е. А. Нейронное представление семантического поля // Вестник Башкирского университета. 2021. Т. 26, № 4. С. 1130–1135. doi: 10.33184/bulletin-bsu-2021.4.48. EDN: KWAPJJ.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).