Импульсный источник возбуждения в речевом сигнале

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Свойства речевого взрыва смычки исследуются на материале базы данных 39 дикторов, содержащей однозначные и многозначные числительные с параллельной записью сигналов на телефонную трубку и направленный микрофон. Детектирование речевого взрыва выполняется кратковременным и долговременным детектором спектрально-временных неоднородностей, а также детектором меры сходства собственных функций спектра взрыва согласных и текущего спектра речевого взрыва. Вероятность присутствия звонкой или глухой смычки оценивается в пространствах амплитудного спектра и спектра групповой задержки по отношению энергии в области высоких и низких частот. Место артикуляции заднеязычного согласного влияет на распределения вероятности длительности интервала между началом речевого взрыва и началом гласного, частоты пика с максимальной амплитудой в высокочастотной области, отношения энергии в области высоких и низких частот спектра речевого взрыва, а также меры сходства собственных функций спектра взрыва согласного и текущего спектра речевого взрыва.

Полный текст

Доступ закрыт

Об авторах

В. Н. Сорокин

Институт проблем передачи информации РАН

Автор, ответственный за переписку.
Email: vns@iitp.ru
Россия, Москва

Список литературы

  1. Jongman A., Miller J.D. Method for the location of burst-onset spectra in the auditory-perceptual space: A study of place of articulation in voiceless stop consonants // J. Acoust. Soc. Am. 1991. V. 89. N 2. P. 867–873.
  2. Bonneau A., Djezzar L., Laprie Y. Perception of the place of articulation of French stop bursts // J. Acoust. Soc. Am. 1996. V. 100. P. 555–564.
  3. Dorman M.F., Studdert-Kennedy M., Raphael L. Stop-consonant recognition: Release bursts and formant transitions as functionally equivalent, context-dependent cues // Perception & Psycophysics. 1977. V. 2. N 2. P. 109–122.
  4. Stevens K., Blumstein S. Invariant cues for place of articulation in stop consonants // J. Acoust. Soc. Am. 1978. V. 64. P. 1358–1368.
  5. Blumstein S., Stevens K. Acoustic invariance in speech production: evidence from measurements of the spectral characteristics of stop consonant // J. Acoust. Soc. Am. 1979. V. 66. P. 1001–017.
  6. Ohde R.N., Stevens K.N. Effect of burst amplitude on the perception of stop consonant place of articulation // J. Acoust. Soc. Am. 1983. V. 74. P. 706–714.
  7. Steinschneider M., Fishman Y.I., Arezzo J.C. Representation of the voice onset time (VOT) speech parameter in population responses within primary auditory cortex of the awake monkey // J. Acoust. Soc. Am. 2003. V. 114. N 1. P. 307–321.
  8. Sharma A., Dorman M.F. Cortical auditory evoked potential correlates of categorical perception of voice-onset time // J. Acoust. Soc. Am. 1999. V. 106. N 2. P. 1078–1083.
  9. Steinschneider M., Volkov I.O., Noh M.D., Garell P.C., Howard III M.A. Temporal encoding of the voice onset time phonetic parameter by field potentials recorded directly from human auditory cortex// J. Neurophysiol. 1999. V. 82. P. 2346–2357.
  10. Blumstein S.E., Myers E.B., Rissman J. The Perception of Voice Onset Time: An fMRI Investigation of Phonetic Category Structure // J. Cognitive Neuroscience. 2005. V. 17. N 9. P. 1353–1366.
  11. Rimol L.M., Eichele T., Hugdahl K. The effect of voice-onset time on dichotic listening with consonant-vowel syllables // Neuropsychologia. 2006. V. 44. N 2. P. 191–196.
  12. Auzou P., Ozsancak C., Hard R., Morris J., Jan M., Eueustache F., Hannequin D. Voice onset time in aphasia, apraxia of speech and dysarthria: a review // Clinical Linguistics & Phonetics. 2000. V. 14. N 2. P. 131–150.
  13. Min S.N., Park S.J., Im J.N., Subramaniyam M.A. Bayesian Model for Prediction of Stroke with Voice Onset // 3rd Int. Conf. on Advances in Mechanical Engineering (ICAME2020). IOP Conf. Series: Materials Science and Engineering. 2020. 912(6). 062003. https://doi.org/10.1088/1757–899X/912/6/062003
  14. Johansson I.-L., Samuelsson Ch., Müller N. Consonant articulation acoustics and intelligibility in Swedish speakers with Parkinson’s disease: a pilot study // Clinical Linguistics & Phonetics. 2023. V. 37. N 9. P. 845–865.
  15. Lisker L., Abramson A. A cross-language study of voicing in initial stops: Acoustical measurements // Word. 1964. V. 20. P. 384–422.
  16. Ladefoged P., Madison I. The sounds of the world’s languages. Blackwell Publishing, 1996.
  17. Cho T., Ladefoged P. Variation and Universals in VOT: Evidence from 18 Languages // J. Phonetics. 1999. V. 27. P. 207–229.
  18. Chodroff E., Golden A., Wilson C. Covariation of stop voice onset time across languages: Evidence for a universal constraint on phonetic realization // J. Acoust. Soc. Am. 2019. V. 145 (1). EL109-EL115.
  19. Cho T., Whalen D.H., Docherty G. Voice onset time and beyond: Exploring laryngeal contrast in 19 languages // J. Phonetics. 2019. V. 72. P. 52–65.
  20. Winn M.B. Manipulation of voice onset time in speech stimuli: A tutorial and flexible Praat script // J. Acoust. Soc. Am. 2020. V. 147. N 2. P. 852–866.
  21. Fant G. Speech and Sounds. MIT Press, 1973.
  22. Robb M., Gilbert H., Lerman J. Influence of Gender and Environmental Setting on Voice Onset Time // Folia Phoniatrica et Logopaedica. 2005. V. 57. P. 125–133.
  23. Niyogi P., Ramesh P. The voicing feature for stop consonants: Recognition experiments with continuously spoken alphabets. // Speech Commun. 2003. V. 41. P. 349–367.
  24. Сорокин В.Н. Синтез речи. М.: Наука, 1992.
  25. Winn M.B., Chatterjee M., Idsardi W.J. The roles of voice onset time and F0 in stop consonant voicing perception: Effects of masking noise and low-pass filtering // J. Speech Lang. Hear. Res. 2013. V. 56. N 4. P. 1097–1107.
  26. Yu V., De Nil L., Pang E. Effects of age, sex and syllable number on voice onset time: Evidence from children’s voiceless aspirated stops // Language and Speech. 2015. V. 58. N 2. P. 152–167.
  27. Stouten V., Van Hamme H. Automatic Voice Onset Time Estimation from Reassignment Spectra // Speech Communication. 2009. V. 51. N12. P. 1194–1205.
  28. Hansen J.H.L., Gray Sh.S., Kim W. Automatic voice onset time detection for unvoiced stops (/p/, /t/, /k/) with application to accent classification // Speech Communication. 2010. V. 52. P. 777–789.
  29. Lin Ch.-Y., Wang H.-Ch. Automatic estimation of voice onset time for word-initial stops by applying random forest to onset detection // J. Acoust. Soc. Am. 2011. V. 130. N 1. P. 514–525.
  30. Sonderegger M., Keshe J. Automatic Discriminative Measurement of Voice Onset Time // J. Acoust. Soc. Am. 2012. V. 132. N 6. P. 3965–3979.
  31. Prathosha P., Ramakrishnan A.G., Ananthapadmanabha T.V. Estimation of voice-onset time in continuous speech using temporal measures // J. Acoust. Soc. Am. 2014. V. 136. N 2. EL122.
  32. Сорокин В.Н. Теория речеобразования. 1985.
  33. Stevens K.N. Acoustic phonetics. MIT, 1998.
  34. Сорокин В.Н. Детекторы артикуляторных событий // Акуст. журн. 2020. Т. 66. № 1. С. 71–85.
  35. Patterson R.D., Holdsworth J. A functional model of neural activity patterns and auditory images // Advances in Speech, Hearing and Language Processing. 1996. V. 3. P. 547–563.
  36. Сорокин В.Н., Чепелев Д.Н. Первичный анализ речевых сигналов // Акуст. журн. 2005. Т. 51. № 4. С. 536–542.
  37. Whiteside S., Henry L., Dobbin R. Sex differences in voice onset time: A developmental study of phonetic context effects in British English // J. Acoust. Soc. Am. 2004. V. 116. N 2. P. 1179–1183.
  38. Sussman H.M., McCaffrey H.A., Matthews S.A. An investigation of locus equations as a source of relational invariance for stop place categorization // J. Acoust. Soc. Am. 1991. V. 90. P. 1309–1325.
  39. Iskarous Kh., Fowler C.A., Whalen D.H. Locus equations are an acoustic expression of articulator synergy // J. Acoust. Soc. Am. 2010. V. 128. N 4. P. 2021–2032.
  40. Montgomery A., Reed P.E., Crass K.A., Hubbard H.I., Stith J. The effects of measurement error and vowel selection on the locus equation measure of coarticulation // J. Acoust. Soc. Am. 2014. V. 136. N 5. P. 2747–2750.
  41. Речь. Артикуляция и восприятие. М.: Наука, 1965.
  42. Klatt D.H. Linguistic uses of segmental duration in English sentences // J. Acoust. Soc. Am. 1976. N 5. P. 1208–1221.
  43. Olson D.J. Phonetic feature size in second language acquisition: Examining VOT in voiceless and voiced stops // Second Language Research. 2022. V. 38(4). P. 913–940.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Площадь Svt (—), Svs (—); давление Puvs на глухой (-∙-) и звонкой (-∙-) смычке; давление Pvt на глухой (—) и звонкой (—) смычке; скорость V на глухой (—) и звонкой (—) смычке; импульсный источник W на глухой (—) и звонкой (—) смычке

Скачать (139KB)
3. Рис. 2. Звукосочетание /апатакА/. (а) — Сверху вниз: речевой сигнал, суммарный отклик кратковременного динамического детектора, сонограмма речевого сигнала; начало речевого взрыва — пунктир. (б) — Трехмерная сонограмма кратковременного динамического детектора

Скачать (214KB)
4. Рис. 3. Распределения разности оценок положения пика детектора d1 и момента начала импульсного источника по данным ручной разметки

Скачать (68KB)
5. Рис. 4. Полуавтоматическая оценка начала импульсного речевого взрыва на сегментах /смычка-гласный/

Скачать (72KB)
6. Рис. 5. Рассогласование между положением максимума сходства собственных функций П!, Тh, Kh и ручной разметкой начала речевого взрыва

Скачать (74KB)
7. Рис. 6. Автоматическая оценка начала взрыва в слове /сто/

Скачать (161KB)
8. Рис. 7. Распределения ∆Tvot речевых взрывов глухих и звонких согласных; ручная разметка

Скачать (84KB)
9. Рис. 8. Распределение ∆Tvot глухих взрывных согласных по результатам ручной разметки

Скачать (71KB)
10. Рис. 9. Распределения относительной энергии импульсных взрывов Т! и Д! в амплитудном спектре; направленный микрофон

Скачать (79KB)
11. Рис. 10. Амплитудные и фазовые отношения на глухих и звонких речевых взрывах. По оси абсцисс — относительная энергия амплитудного спектра, по оси ординат — относительная энергия спектра групповой задержки

Скачать (185KB)
12. Рис. 11. Спектры звонких и глухих речевых взрывов: кратковременный динамический детектор (—); взрыв (---)

Скачать (193KB)
13. Рис. 12. Распределение частоты максимального пика спектра речевого взрыва для глухих взрывных

Скачать (67KB)
14. Рис. 13. Распределение отношения средней энергии в полосе 0.8–3 кГц к энергии в полосе 3–6 кГц

Скачать (76KB)
15. Рис. 14. Мера сходства собственных функций спектра речевого взрыва Пh (—) и спектров речевых взрывов Тh и Кh

Скачать (63KB)
16. Рис. 15. Мера сходства собственных функций кратковременного детектора спектра речевого взрыва Кh (—) и спектров кратковременного детектора речевых взрывов Пh и Тh

Скачать (51KB)

© Российская академия наук, 2024

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».