Longitudinal studies of language errors based on a German-language learner corpus

Cover Page

Cite item

Full Text

Abstract

In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.

About the authors

Irina Avramovna Kotyurova

Petrozavodsk State University

Email: koturova@petrsu.ru
Petrozavodsk, Russian Federation

Georgiy Romanovich Safonov

Petrozavodsk State University

Email: jiri.safonov@gmail.com
Petrozavodsk, Russian Federation

References

  1. Трудности и перспективы цифровой трансформации образования / под. ред. А. Ю. Уварова, И. Д. Фрумина. М.: НИУ ВШЭ, 2019. 344 с. doi: 10.17323/978-5-7598-1990-5
  2. Павлова О. Ю. Использование языковых корпусов в обучении иностранному языку // Язык и культура. 2021. № 54. С. 283–298. doi: 10.17223/19996195/54/16
  3. Большие данные в образовании: доказательное развитие образования / под ред. О. А. Фиофановой. М.: Дело. 2021. 342 с.
  4. Modeling Language Learning Using Specialized Elo Ratings. Innovative Use of NLP for Building Educational Applications / J. Hou, M. Koppatz, J. M. Hoya Quecedo, N. Stoyanova, M. Kopotev, R. Yangarber; eds. H. Yannakoudakis, E. Kochmar, C. Leacock, N. Madnani, I. Pilán, T. Zesch. Stroudsburg, PA: Association for Computational Linguistics, 2019. P. 494–506. http://dx.doi.org/10.18653/v1/W19-4451
  5. Granger S. The International Corpus of Learner English: a new resource for foreign language learning and teaching and second language acquisition research // TESOL Quarterly. 2003. Vol. 37, № 3. P. 538–546.
  6. Камшилова О. Н. Учебный корпус текстов: потенциал, состав, структура. СПб.: Книжный дом, 2012. 56 с.
  7. Ахапкина Я. Э. Эрратологическая разметка корпуса русских учебных текстов: тактические решения // Труды Института русского языка им. В. В. Виноградова. 2019. № 4 (22). С. 9–21.
  8. Грудева Е. В., Бучилова И. А., Волкова Н. А. Корпусы ошибок: целевая аудитория, возможная архитектура корпуса // Вестник Череповецкого государственного университета. 2018. № 5 (86). С. 63–72. URL: https://cyberleninka.ru/article/n/korpusy-oshibok-tselevaya-auditoriya-vozmozhnaya-arhitektura-korpusa (дата обращения: 21.01.2023).
  9. Котюрова И. А., Щеголева Л. В. Корпус студенческих текстов на немецком языке как источник данных для образования и науки // Вопросы образования. 2022. № 4. С. 322–349. URL: https://cyberleninka.ru/article/n/korpus-studencheskih-tekstov-na-nemetskom-yazyke-kak-istochnik-dannyh-dlya-obrazovaniya-i-nauki (дата обращения: 21.01.2023).
  10. Götz S. Learner Corpora to Inform Testing and Assessment // The Routledge Handbook of Corpora and English Language Teaching and Learning. Routledge, 2022. P. 311–326.
  11. Vinogradova O., Login N. The Design of Tests with Multiple Choice Questions Automatically Generated from Essays in a Learner Corpus // Higher School of Economics Research Paper No. WP BRP. 2017. Vol. 60. P. 16.
  12. Bowles M. A. Using instructor judgment, learner corpora, and DIF to develop a placement test for Spanish L2 and heritage learners // Language Testing. 2022. Vol. 39, № 3. Р. 355–376. https://doi.org/10.1177/02655322221076033
  13. Granger S. The computer learner corpus: a versatile new source of data for SLA research // Learner English on computer. Routledge, 2014. P. 3–18.
  14. Kwon H. English learner corpora and research in Korea // Corpora. 2022. Vol. 17, № Supplement. P. 5–22.
  15. Liu K., Oiwun Cheung J., Zhao N. Learner corpus research in Hong Kong: past, present and future // Corpora. 2022. Vol. 17, № Supplement. P. 79–97.
  16. Смульская Е. Д. Лонгитюдные исследования в лингвистике: опыт и перспективы // Известия РГПУ им. А. И. Герцена. 2016. № 182. C. 53–58.
  17. Сибирякова Н. Б. Интерференция с родным (русским) языком при пунктуационных ошибках в текстах студентов на немецком языке // Языковые контакты в поликультурном мире. Курск, 2022. С. 87–94.

Supplementary files

Supplementary Files
Action
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».