METHODOLOGY CONCEPT OF SPEAKER ATTRIBUTION IN THE COCKPIT OF A MOVING AIRCRAFT

Cover Page

Cite item

Full Text

Abstract

The paper analyzes speaker voice identification methods that are widely used in the practice of flight accidents investigation by speech recorded in the cockpit of a moving aircraft during an emergency situation on board. The advantages and disadvantages of each of methods are described, the factors reducing the reliability of the identification are indicated, and the methodological foundations for using utterances of persons recorded on a phonogram, whose attribution has already been established as an additional data source, are formulated. The prerequisites for constructing a step-by-step methodology for attributing utterances of persons recorded in the cockpit of a moving aircraft using the latest achievements in the field of forensic examination of audio recordings are given.

Full Text

Introduction (Введение)

Важнейшей частью работы комиссии по расследованию лётного происшествия является анализ звукозаписей, полученных с бортового устройства записи, входящего в состав оборудования воздушного судна, а также звукозаписей, сделанных на станциях записи наземных служб в процессе осуществления радиообмена с бортом, на котором развивается нештатная ситуация. Информация о причинах возникновения неполадок, получаемая параметрическим регистратором с оборудования борта, не всегда может быть интерпретирована однозначно без анализа действий экипажа, получающего сведения о ситуации на борту непосредственно в ходе полёта. Анализ речевого обмена членов экипажа существенно дополняет картину происшествия, что позволяет выделить новые аспекты развития нештатных ситуаций, сформулировать признаки их проявления и разработать методики для их предотвращения с целью повышения безопасности полётов.

Взаимодействие членов летного экипажа в кризисных ситуациях оказывает значительное влияние на принятие решений по управлению воздушным судном. Профессионализм лётного состава проявляется в адекватной оценке сложившейся лётной обстановки и навыках успешного взаимодействия друг с другом, сопровождающегося обменом речевыми сообщениями.

Появление постороннего лица в кабине воздушного судна во время полета является нарушением установленных требований по обеспечению безопасности полетов. Даже присутствие посторонних лиц в кабине приводит к снижению внимания членов экипажа. В том случае, если данное лицо принимает непосредственное участие в разговорах, оценивает обстоятельства сложившейся ситуации, запрашивает / добавляет дополнительные сведения или отдаёт указания (например, пользуясь своим положением старшего по званию), его речевые сообщения могут оказать решающее воздействие на принятие лётным экипажем решений в критической ситуации.

В рамках расследований лётных происшествий целями исследования имеющихся звукозаписей являются:

  • установление текстового содержания реплик членов экипажа, а также лиц, участвующих в радиообмене между экипажем и наземными службами (или экипажами других бортов);
  • установление текстового содержания реплик иных лиц, ведущих переговоры непосредственно в кабине воздушного судна в процессе развития нештатной ситуации на борту;
  • атрибуция реплик – установление принадлежности реплик конкретным лицам – наиболее важная цель с точки зрения установления причин происшествия и меры установления ответственности конкретных лиц.

Необходимость в идентификации (установлении принадлежности реплик) конкретного лица по голосу и речи, записанной в кабине воздушного судна, возникает в общем случае при расследовании авиационных происшествий с экипажами, состоящими из нескольких человек, или в частном случае, когда в кабине воздушного судна присутствуют иные лица, не входящие в его состав [Арбузов и др., 2022; Зубов и др., 2019; МАК…, б.г.].

Для атрибуции реплик – установления их принадлежности лицам, участвующим в речевом взаимодействии, – могут быть использованы методы судебной криминалистической идентификации по голосу и речи, разработанные в рамках существующих методик идентификации, используемых различными ведомствами1 [Кураченкова и др., 2007; Патент…, 1998] для проведения исследований голоса и звучащей речи (фоноскопической экспертизы) в рамках расследования уголовных дел. Однако, как правило, продолжительность отдельных реплик дикторов недостаточна для проведения полноценного сравнения с образцами голоса и речи и, в соответствии с имеющимися рекомендациями (в зависимости от используемой в учреждении методики) по оценке их пригодности для проведения идентификационного исследования, такие реплики не могут быть источником достоверных сведений.

Насущной проблемой расследования лётных происшествий, включающих исследование фонограмм бортовых устройств записи, является разработка концепции пошаговой методики атрибуции реплик лиц, записанных в кабине движущегося воздушного судна, с использованием последних достижений науки и техники в области судебной криминалистической идентификации по голосу и речи.

Методическое обеспечение процесса принятия идентификационного (атрибуционного) решения позволит исследователю в своей работе опираться на научно обоснованные методы, обеспечивать достоверность и повторяемость получаемых результатов.

 

Materials and methods (Материалы и методы)

Объекты исследования

Объектом исследования является речевой материал лиц, записанный в кабине движущегося воздушного судна средствами бортового устройства записи. Речевой материал диктора формируется массивом отдельных его реплик.

Окружающая акустическая и электромагнитная обстановка обстоятельств осуществления звукозаписи оказывает значительное влияние на записанный речевой сигнал членов экипажа (и иных лиц, в случае их появления в кабине). Значительный уровень фоновых аэродинамических шумов приводит к необходимости повышения громкости голоса с целью повышения надёжности доставки речевого сообщения его получателю, что может приводить к изменению характеристик голоса и речи диктора.

Важно отметить, что слуховая система человека с течением времени адаптируется к распознаванию речевых сигналов в условиях однотипных шумов. Данное обстоятельство приводит к тому, что получатель речевого сообщения в обстановке шумов, типичных для его профессиональной деятельности, осуществляет распознавание его содержания лучше, чем слушатель, для которого такая акустическая обстановка привычной не является. Также, по этой причине в состав комиссии, участвующей в опознании членов экипажа по голосу, включаются профессиональные пилоты, для которых акустическая обстановка кабины движущегося воздушного судна является типичной по роду их профессиональной деятельности. В том случае, если решение о принадлежности голоса и речи конкретному члену экипажа принимается лицом, для которого такая акустическая обстановка типичной не является, надежность данного решения оказывается ниже.

 

Источники звукозаписей

Запись акустической обстановки в кабине воздушного судна на бортовое устройство записи производится с микрофонов, установленных в кабине (т. н. «открытые» микрофоны), и с микрофонов гарнитур экипажа. Запись реплик членов экипажа, ведущих радиопереговоры с наземными службами, фиксируется также на станциях записи наземных служб.

Технические требования к бортовым устройствам звукозаписи и записи параметров движения воздушного судна предполагают сохранность акустической (и параметрической) информации, в том числе в условиях высоких температур, действующих на достаточно продолжительных интервалах времени, что обусловлено частым развитием пожара на месте происшествия. Бортовые устройства записи также подвержены регулярному износу и в обычных штатных режимах работы. По этим причинам в бортовых устройствах записи до настоящего времени не такое большое распространение получили современные устройства цифровой звукозаписи, а запись осуществляется на магнитный носитель. Аналоговая звукозапись характеризуется меньшим отношением уровня полезного речевого сигнала к уровню фоновых (в т. ч. собственных) шумов, в большей степени подвержена искажениям, амплитудно-частотная характеристика бортового устройства звукозаписи зачастую обладает ярко выраженной нерегулярной структурой, высоким коэффициентом нелинейных искажений.

Качество записанных речевых сигналов, зафиксированных наземными станциями записи, как правило, выше, ввиду того, что требования к ним не предполагают такой значительной устойчивости к разрушающим механическим и температурным воздействиям, как требования к бортовым устройствам звукозаписи.

 

Существующие подходы к атрибуции реплик

Рассмотрим, какие способы и методы атрибуции реплик используются в практике проведения исследования звукозаписей, сопровождавшихся развитием нештатных ситуаций на борту движущегося воздушного судна, а также их сильные стороны и ограничения.

В работе [Зубов и др., 2019] даны описания основных подходов к атрибуции реплик лиц, чья речь записана в кабине движущегося воздушного судна:

  • cитуационный анализ, включающий в себя функциональную и канальную идентификацию;
  • аудитивный анализ;
  • лингвистический анализ;
  • инструментальный анализ.

К преимуществам ситуационного анализа относятся:

  • возможность установления принадлежности реплик, которые могли быть произнесены либо только одним конкретным лицом в рамках выполнения им своих профессиональных обязанностей в соответствии с протоколом взаимодействия членов экипажа воздушного судна, либо кем-то из членов экипажа при взаимодействии с наземными службами;
  • возможность однозначной атрибуции реплик, имеющихся в отдельном канале (как правило, канале радиообмена с наземными службами, реже – в каналах радиообмена с другими бортами).

К недостаткам данного метода относится малая совокупная продолжительность реплик, транслирующихся в выделенных каналах, или реплик, отражающих работу экипажа по протоколу действий. Все прочие реплики, которые не соответствуют упомянутым выше критериям, не могут быть однозначно атрибутированы с использованием данного метода.

Проблемой и для аудитивного, и для лингвистического анализа является типичный для рассматриваемой в настоящей работе обстановки записи высокий уровень фоновых (аэродинамических, механических) шумов и искажений, вносимых в записываемые звуковые сигналы оборудованием воздушного судна. Несмотря на значительные возможности этих подходов в рамках атрибуции свободной (не протокольной) речи, а также высокий уровень надёжности в случае, когда дикторы достаточно сильно отличаются на аудитивном уровне, присутствующие на фонограмме шумы и искажения затрудняют атрибуцию и опознание дикторов по их звучащей речи, в том числе даже лицами, хорошо знавшими их манеру говорения как в различных бытовых и производственных ситуациях, так и при использовании различных каналов. Изменение манеры речи диктора в рамках конкретной коммуникативной ситуации, в которой принимает участие ограниченный круг известных диктору лиц, может, также, происходить за счет внутридикторской вариативности.

Основным методом инструментального подхода идентификации по голосу и речи (а, соответственно, в обсуждаемой задаче и к их атрибуции) является метод сравнения спектрального состава речевых сигналов [Зубова и др., 2007; Каганов, 2019]. Инструментальные методы, будучи формализованными до конкретных числовых значений, могут нести в себе не только информацию о принадлежности реплики конкретному лицу, но и оценку степени надежности такого решения, что является безусловным преимуществом метода.

Необходимо отметить, что помимо перечисленных объективных методов, в практическом ключе применяется также метод опознания – совместного прослушивания исследуемой фонограммы комиссией слушателей, в которую могут входить лица, по роду своей основной профессиональной деятельности имеющие навыки распознавания речевых сообщений в условиях акустической обстановки в кабине движущегося воздушного судна при осуществлении служебных обязанностей.

 

Discussion (Дискуссия)

Методы судебной криминалистической идентификации лиц по голосу и речи

Судебная криминалистическая идентификация лица по голосу и речи представляет собой одну из важнейших областей судебной акустики [Gold et al., 2011]. В зарубежной литературе судебная криминалистическая идентификация лица по голосу и речи упоминается также под терминами (судебное) сравнение дикторов, (судебное) распознавание дикторов, (судебное) сравнение голосов [Rose, 2002].

Суть криминалистической идентификации человека по голосу и звучащей речи состоит в выделении из речевого материала такого устойчивого комплекса признаков, который будет достаточен для установления индивидуально-конкретного тождества.

Все существующие в настоящее время методики судебной криминалистической идентификации лиц по голосу и речи основываются на комплексном подходе к проведению исследования – использованию баз знаний различных наук: лингвистики и акустики. Исследование голоса и речи включает в себя аудитивный, лингвистический и инструментальный анализ, каждый из которых обеспечивает свой вклад в интегральное решение и окончательный вывод.

Методы аудитивного (перцептивного) исследования устанавливают следующие идентификационные признаки данной группы: тембр; высота голоса и диапазон её изменения; стиль произношения; темп речи, интонационная выраженность фраз; длительность пауз и их заполнение; артикуляция; стиль произношения; речевое дыхание; манера речи; речевая культура; выразительность речи; словарный запас; стиль речи и др.

Лингвистическая часть исследования речевого материала позволяет выявить в речи особенности реализации единиц устной речи на различных уровнях: звук – слово – фраза – речевой поток. Соответственно, лингвистические идентификационные признаки делятся на несколько подгрупп: фонетические, синтаксические, лексико-семантические.

Инструментальная часть исследования обычно состоит в изучении статистических характеристик частоты основного тона (характеристика голосового источника) и в проведении формантного анализа спектральных характеристик речевых сигналов говорящего (исследование частотного отклика артикуляторного тракта).

Современное состояние науки и техники в данной области знаний и экспертная практика позволяют с достаточной степенью надёжности утверждать, что при произнесении каждого звука речи основные максимумы спектра (форманты) и иные неоднородности спектра (в т. ч. минимумы – антиформанты) речевого сигнала связаны с размерами и анатомо-геометрической структурой речеобразующего аппарата диктора, а также с акустико-механическими свойствами тканей и органов, участвующих в речеобразовании [Каганов, 2019]. Формантная структура речевого сигнала и характер её изменения обусловлены анатомическим строением речевого аппарата и произносительными навыками конкретного диктора, среди которых есть как сознательно контролируемые стереотипы оформления речевых высказываний, так и автоматические (неконтролируемые).

В работе [Арбузов и др., 2024] было установлено, что к факторам, которые необходимо учитывать при проведении криминалистической идентификации по голосу и звучащей речи, относятся:

  • внутридикторская вариативность – способность диктора пользоваться широким перечнем конкретных реализаций имеющихся выразительных средств: в различных ситуациях речевого общения в зависимости от множества лингвистических и экстралингвистических контекстов (коммуникативной роли, формата коммуникации, профессиональной специфики разговора и пр.), обстоятельств осуществления коммуникативного акта, обусловленных физиологическим состоянием дикторов (стресс различной природы, болезнь и пр.);
  • канал, используемый для передачи речевых сообщений (очная встреча собеседников, телефонный разговор, радиоканал);
  • условия записи фонограмм: на улице, в помещении, в различных температурных условиях, в условиях помех и искажений различной природы и пр.

К ситуации сложной акустической и коммуникативной обстановки записи относится ситуация осуществления речевого взаимодействия в кабине движущегося воздушного судна, в том числе в случае развития нештатной ситуации на борту.

Согласно теории судебной экспертизы [Каганов, 2019] идентификационное исследование по голосу и речи включает в себя четыре этапа: предварительное исследование, в рамках которого проводится оценка пригодности речевого материала для проведения исследования; раздельное исследование, включающее в себя выделение устойчивых идентификационных признаков различных групп анализа для идентифицируемого лица и лица, которое было отражено в образцах; сравнительное исследование, включающее сопоставление значений различных признаков голоса и речи, выделенных в исследуемой фонограмме и фонограмме-образце; формирование вывода о принадлежности голоса и речи одному или разным лицам (в вероятностной или категорической форме).

Основными параметрами пригодности речевого материала2 являются: продолжительность речевого материала, отношение уровня полезного речевого сигнала к уровню фоновых широкополосных шумов, частотный диапазон записанного речевого сигнала, разборчивость речи, параметры шумов и искажений.

Сопоставимость речевого материала [Best Practice Manual…, 2022] играет важную роль при проведении идентификационного исследования и позволяет снизить вклад внутридикторской вариативности за счет совпадения различных обстоятельств осуществления коммуникативного акта на исследуемой фонограмме и фонограмме образце.

  

Обстоятельства осуществления записи, шумы и искажения, имеющиеся на фонограммах, записанных в кабине движущегося воздушного судна

Основными источниками [Арбузов и др., 2023; Попов и др., 2009] интенсивного аэродинамического шума в кабине экипажа являются: воздушный поток, обтекающий конструктивные элементы воздушного судна; реактивная струя силовой установки.

К источникам механического шума относятся: силовая установка, система кондиционирования воздуха, бортовое оборудование.

Электромагнитные сигналы (в акустическом диапазоне частот) не оказывают влияния на шумовую обстановку в кабине движущегося воздушного судна в момент осуществления речевого взаимодействия. Однако, они порождают электромагнитные наводки на аналоговые цепи бортового устройства звукозаписи и, впоследствии, оказывают значительное влияние на процесс атрибуции реплик или идентификационный анализ при воспроизведении и изучении зарегистрированных сигналов переговоров экипажа.

По природе своего происхождения шумы являются аддитивной компонентой сигнала. Согласно [Алдошина, 2000; Попов и др., 2009], основной стратегией их удаления и снижения их амплитуды является вычитание по образцу, выбранному в паузе речевых переговоров. Широкое распространение также получили методы адаптивной фильтрации: спектр сигнала накапливается на выбранном исследователем интервале времени и вычитается из спектра анализируемого сигнала. Иерархия временных масштабов акустических событий определяется скоростью изменения спектров шумового и полезного – в данном случае речевого – сигналов. Накопленный за выбранный характерный интервал времени средний спектр помехи, меняющийся медленнее спектра речевого сигнала, содержит, в основном, информацию о спектре помехи и, таким образом, может быть удалён из общего сигнала без значительного влияния на полезный речевой сигнал.

Значительный негативный вклад в записываемый сигнал вносят и искажения канала записи [Меркулова, 2015]. Искажения сигнала могут быть локализованы как во временной области (клиппирование, «перегрузка», «задувание» микрофона, эхо электронной природы, недостаточная и/или нелинейная чувствительность микрофона), так и в частотной (неравномерность амплитудно-частотной характеристики (АЧХ) канала записи, её изрезанность, нелинейные эффекты, детонация, интерференция). Искажения носят характер мультипликативной операции над сигналом. По этой причине их компенсация затруднена: передаточная функция преобразования не может быть установлена однозначно; а потерянный сигнал не может быть полностью восстановлен. Основным подходом к компенсации искажений в частотной области является инверсная фильтрация: по установленному в паузе речи профилю АЧХ канала записи или адаптивно – по АЧХ, накопленной за выбранное исследователем характерное время.

В основе результативных методов обработки речевых сигналов, записанных в том числе в обсуждаемой в настоящей работе обстановке обстоятельств осуществления записи, лежит понимание принципов работы слуховой системы человека и её особенностей: эффектов частотной и временной маскировки [Алдошина, 2000; Зубова и др., 2007]. В целом, все используемые подходы к обработке речевых сигналов заключаются в выравнивании амплитудно-частотной характеристики записанного сигнала с сохранением выраженности максимумов частотного отклика артикуляторного тракта.

 

Влияние шумов и искажений фонограмм, записанных в кабине движущегося воздушного судна, на методы идентификации диктора по голосу и речи

Как уже было указано в пункте «Существующие подходы к атрибуции реплик» настоящей работы, наибольшее влияние шумов акустической обстановки в кабине движущегося воздушного судна и искажений, возникающих при её фиксации бортовым устройством записи, оказывается на методы аудитивной и лингвистической групп. Инструментальные методы повышения разборчивости речи нацелены в основном на установление текстового содержания речевых сообщений. Несмотря на то, что это даёт существенный вклад в ситуационный анализ, характеристики голоса и речи, устанавливаемые на аудитивном уровне, подвергаются значительным изменениям. Прирост результативности лингвистических методов исследования в частях синтаксической и лексико-семантической подгрупп может практически полностью нивелироваться искажениями, возникающими для признаков фонетической подгруппы.

Методы удаления шумов и повышения разборчивости речи, используемые в экспертной практике, не оказывают существенного воздействия на определение мгновенных значений частоты основного тона голоса (высоты голоса) при произнесении вокализованных звуков – метод инструментального анализа речевых сигналов. Автокорреляция спектра тонального (речевого) сигнала достаточно устойчива к его фильтрации, что сохраняет эффективность инструментальных методов вычисления основного тона голоса на основе динамических кепстрограмм3.

Внутридикторская вариативность позволяет реализовывать различное распределение значений основного тона голоса в зависимости от обстоятельств осуществления коммуникативного акта [Каганов, 2007; Narasimhan et al., 2022]. Например, частота основного тона голоса увеличивается в среднем на 20 Гц при повышении громкости речи на 6 дБ. В случае переговоров в кабине движущегося воздушного судна – наличия значительного по амплитуде уровня фоновых шумов – указанное обстоятельство подлежит обязательному учёту при проведении инструментального анализа речевого материала.

Речь дикторов, записанная в условиях сложной шумовой обстановки, в том числе, в кабине движущегося воздушного судна, имеет ограниченную пригодность для исследования, а условие сопоставимости образцов становится обязательным требованием для решения задач атрибуции и идентификации.

Повышение громкости голоса в шумной акустической среде кабины воздушного судна приводит к усилению амплитуды звуков речи и их характеристических особенностей, таких как форманты, исследование положения которых проводится в рамках спектрального анализа – второй метод инструментального подхода. Повышение основного тона снижает различимость частотных максимумов артикуляционного тракта, что снижает как разборчивость речевых сигналов, так и точность определения положения формант [Shouted…, 2022].

Влияние обработки сигнала на идентификационные признаки, выявляемые при спектральном анализе, несколько более существенно [Столбов и др., 2014]. Согласно имеющейся практике [Арбузов и др., 2023] установлено, что точность определения формантных характеристик в нефорсированной речи при низком уровне фонового шума сравнима с изменениями, вызванными инверсной фильтрацией сигнала. Важно отметить, что только в случае схожести спектральных характеристик записи со спектром артикуляционного тракта фильтрация требует особого внимания при анализе конкретных артикуляций.

Исследование [Арбузов и др., 2023] показало, что точность методов вычисления идентификационных признаков голоса и речи сопоставима с характерными масштабами модификации сигналов, обусловленных его обработкой. Осуществление говорящим лицом контроля успешной доставки своего речевого сообщения способствует его записи.

Сопоставимость речевого материала, выступающего в качестве образцов голоса и речи, с голосом и речью, записанными на борту движущегося воздушного судна (так же как и в ситуации с основным тоном), играет значительную роль при проведении сравнительного инструментального анализа [Morrison et al., 2012].

 

Results (Результаты)

Концепция методики атрибуции реплик

Текстовое содержание речевых сообщений в кабине движущегося воздушного судна значительно расширяет понимание группой расследования обстоятельств лётного происшествия. В результате обработки звукового сигнала применяемыми методами повышения разборчивости речи аудитивные, фонетические и инструментальные идентификационные признаки могут утрачиваться. Данное обстоятельство может быть скомпенсировано выявлением лексико-семантических и синтаксических признаков лингвистической группы исследования. Впоследствии для атрибуции реплик может быть использован как исходный звукоряд, так и обработанный, т. к. ситуационная атрибуция реплик напрямую зависит от содержания речевых сообщений.

Атрибуция реплик, выполненная на начальном этапе, формирует массивы реплик каждого члена экипажа, которые затем могут быть использованы для проведения сравнительного исследования речевых сообщений, принадлежность которых еще не установлена. Для выполнения данной операции могут быть использованы традиционные методы идентификации по голосу и речи. В этом случае в качестве исследуемого речевого материала выступает речевое высказывание, принадлежность которого не установлена, а в качестве образцов – накопленный массив реплик конкретного лица. Увеличение продолжительности массива речевых высказываний, принадлежность которых достоверно установлена, повышает надежность дальнейшей работы.

Как уже упоминалось, задача идентификации лица по фонограмме, записанной в кабине движущегося воздушного судна, требует решения в том случае, когда лицо не входит в состав лётного экипажа и находится в кабине, оборудованной системой звукозаписи, в нарушение существующих протоколов безопасности осуществления полётов. Случаи развития нештатной ситуации, сопровождающиеся присутствием постороннего лица в кабине движущегося воздушного судна, достаточно редки, но это лишь подтверждает обоснованность данных требований.

С точки зрения установления принадлежности высказываний, реплики посторонних лиц вносят дополнительную неясность, т. к. увеличивают объёмы речевого материала и расширяют круг лиц, которыми данные высказывания могли бы быть сделаны.

Следует подчеркнуть, что в задаче атрибуции реплик, для решения которой в качестве образцов голоса и речи члена экипажа могут выступать высказывания, принадлежность которых ему уже была однозначно установлена, вопрос сопоставимости практически становится неактуальным.

Однако при проведении идентификационного исследования в отношении лиц, не входящих в состав экипажа, но присутствующих (и разговаривающих) в кабине воздушного судна во время полёта, задача сопоставимости речевого материала на фонограмме переговоров в кабине воздушного судна и в предоставляемых для исследования образцах голоса и речи встаёт наиболее остро.

Для разработки эффективных методов атрибуции реплик лиц, записанных в кабине движущегося воздушного судна, необходимо учитывать, также, недостаточный, с точки зрения методов классической идентификации по голосу и речи, частотный диапазон записанного речевого сигнала.

 

Условия и требования к методам, используемым для проведения атрибуции и идентификации по голосу речи лиц, записанных в кабине движущегося воздушного судна

Методы атрибуции и идентификации должны обладать следующими свойствами:

  • шумостойкость – влияние аддитивных шумов на идентификационные признаки должны быть невелики и предсказуемы. Типичные значения отношения уровня полезного речевого сигнала к уровню фоновых шумов, начиная с которых методы должны способствовать решению поставленной задачи, 6 – 12 дБ;
  • устойчивость к искажениям – к особенностям профиля амплитудно-частотной характеристики канала записи должны применяться компенсационные приёмы, не оказывающие значительного влияния на выбранные идентификационные признаки;
  • устойчивость к «шумоочистке» и методам компенсации искажений – применяемые методы обработки сигнала не должны оказывать значительного влияния на характеристические значения идентификационных признаков метода;
  • работоспособность на коротких речевых высказываниях – методы должны быть применимы и результативны по отношению к репликам даже малой (менее секунды) продолжительности;
  • устойчивость к ограничению частотного диапазона – идентификационные признаки должны удовлетворять ситуациям снижения верхней границы полосы пропускания до 3200 Гц.

С точки зрения традиционной фоноскопической экспертизы (экспертизы звукозаписей) данные требования являются очень сильными. В настоящее время ни одна методика судебной криминалистической экспертизы не удовлетворяет указанным ограничениям – в процессе предварительного исследования для речевого материала с указанными характеристиками в подавляющем большинстве случаев будет сделан вывод о его непригодности для проведения идентификационного исследования. Однако специфика осуществления переговоров в кабине движущегося воздушного судна позволяет сузить пространство интерпретаций и обеспечить максимальный результат от использования классических методов исследования.

 

Conclusion (Заключение)

В данной работе сформулирована рабочая концепция для разработки научно обоснованной методики атрибуции (установления принадлежности) реплик членов экипажа, записанных в кабине движущегося воздушного судна, которая учитывает как особенности объекта исследования (речевой материал, записанный в специфической шумовой обстановке), так и особенности существующих методов судебной криминалистической идентификации диктора по голосу и речи для решения данной прикладной, насущной, узкоспециальной задачи.

Авторы надеются, что приведённые рассуждения позволят в перспективе построить пошаговую методику атрибуции реплик лиц, записанных в кабине движущегося воздушного судна с использованием последних достижений в области судебной криминалистической экспертизы звукозаписей (фоноскопической экспертизы).

 

1 Идентификация человека по магнитной записи его речи. Методическое пособие для экспертов, следователей и судей. М.: РФЦСЭ МЮ РФ, 1995.

2 Идентификация человека по магнитной записи его речи. Методическое пособие для экспертов, следователей и судей. М.: РФЦСЭ МЮ РФ, 1995.

3 Идентификация человека по магнитной записи его речи. Методическое пособие для экспертов, следователей и судей. М.: РФЦСЭ МЮ РФ, 1995.

×

About the authors

V. I. Arbuzov

St. Petersburg State University of Civil Aviation named after Chief Marshal of Aviation A.A. Novikov

Author for correspondence.
Email: kafedra5@bk.ru
Doctor of Physical and Mathematical Sciences, Professor 38 Pilotov st., St. Petersburg, 196210, Russia

I. S. Siparov

St. Petersburg State University of Civil Aviation named after Chief Marshal of Aviation A.A. Novikov; North-Western Forensic Science Center of the Ministry of Justice

Email: ivan@siparov.ru
Senior State Forensic Expert 38 Pilotov st., St. Petersburg, 196210, Russia; 8 Nekrasova st., St. Petersburg, 190000, Russia

References

  1. Aldoshina I. A. (2000). Fundamentals of psychoacoustics. Moscow: Oborongiz, 2000. 154 p. EDN VMMCPR. (In Russian)
  2. Arbuzov V. I., Siparov I. S. (2022). Problems of identification of the speaker in the cockpit of an aircraft by his voice and speech during the development of an emergency situation on board. Actual problems of protection and safety: Proceedings of the XXV All-Russian Scientific and Practical Conference. St. Petersburg: Russian Academy of Rocket and Artillery Sciences, 2022. 157-160. EDN XULSZA. (In Russian)
  3. Arbuzov V. I., Siparov I. S. (2023). The influence of the noise environment in the cockpit of an aircraft and distortions of the recording channel on the identification signs of voice and speech. Actual problems of protection and safety: Proceedings of the XXVI All-Russian Scientific and Practical Conference. St. Petersburg: Lyubavich Printing House, 2023. 2: 271-275. EDN UOTHGU. (In Russian)
  4. Arbuzov V. I., Siparov I. S. (2024). Experimental program to establish the reliability of the method of identification by voice and speech of speakers recorded in the cockpit of a moving aircraft. Actual problems of protection and safety: Proceedings of the XXVII All-Russian Scientific and Practical Conference. St. Petersburg: Russian Academy of Rocket and Artillery Sciences, 2024. 454-458. EDN RNFEVO. (In Russian)
  5. Baicharov N. V., Kaplin I. P., Kurachenkova N. B. (1998). Patent No. 2107950 C1 Russian Federation, IPC G10L 17/00. Method of identification of a person by phonograms of arbitrary oral speech: No. 96116251/09: application 08.08.1996 : published 27.03.1998 EDN KQSZMA. (In Russian)
  6. Best Practice Manual for the Methodology of Forensic Speaker Comparison (2022). Available at: https://enfsi.eu/wp-content/uploads/2022/12/5.-FSA-BPM-003_BPM-for-the-Methodology-1.pdf (accessed 03 February 2025).
  7. Gold E., French P. (2011). International practices in forensic speaker comparison. International Journal of Speech, Language and the Law. 18(2): 293-307.
  8. IAC – Interstate Aviation Committee: official website. Available at: https://mak-iac.org/upload/iblock/1e5/expert_forenex.pdf (accessed 2 February 2025) (In Russian)
  9. Kaganov A. S. (2007). On the stability of identification features in the task of criminalistic identification of a person by voice and sounding speech. Forensic examination. 4(12): 70-79. EDN IJCJPL. (In Russian)
  10. Kaganov A. S. (2019). Criminalistic identification of the speaker: theory, experiment, practice. Moscow: Yurlitinform, 2019. 332 p. (In Russian)
  11. Kurachenkova N. B., Baichorov N. V., Ermakova M. A. (2007). Identification of persons by oral speech in Russian. The Dialect methodology. A manual for experts. 2nd edition, revised and expanded. Moscow, 2007. 136 p. (In Russian)
  12. Merkulova A. G. (2015). Investigation of speech recognition of pilots in simulated experimental conditions. Occupational medicine and industrial ecology. 9: 94. EDN UMGRCR. (In Russian)
  13. Morrison G. S., Ochoa F., Thiruvaran T. (2012). Database selection for forensic voice comparison. Proceedings of Odyssey 2012: The Language and Speaker Recognition Workshop. Singapore, International Speech Communication Association, 2012. 62-77.
  14. Narasimhan V. L., Samuel R. S. (2022). A study on formant frequencies under different conditions and its effects on forensic speaker identification. Journal of Forensic Medicine and Toxicology. 39(2): 8-17. doi: 10.5958/0974-4568.2022.00028.x. EDN XWPGUO.
  15. Popov Yu. V., Martynyuk A. A., Krasotkina I. A. (2009). Tones and noises in the cabin of the aircraft crew. Sources and characteristics. Problems of flight safety. 9: 35-45. EDN KXDCUB. (In Russian)
  16. Prieto S., Ortega A., López-Espejo I., Lleida E. (2022). Shouted and whispered speech compensation for speaker verification systems. Digital Signal Processing. 127: 103536. doi: 10.1016/j.dsp.2022.103536. EDN RCURIM.
  17. Rose P. (2002). Forensic speaker identification. London: Taylor-Francis Ltd. 2002. 360 p.
  18. Stolbov M. B., Zubov G. N. (2014). Software tools for noise purification of speech recordings. Speech technologies. 1-2: 103-113. EDN XYMSXZ. (In Russian)
  19. Zubov G.N., Zubova P. I. (2019). Voice identification of the aircraft crew. Forensic expert. 1: 9-11. EDN YWBXCP. (In Russian)
  20. Zubova P. I., Koval S. L. (2007). Identification of a person by voice and sounding speech based on a comprehensive analysis of phonograms. Theory and practice of forensic examination. 2007. 3(7): 68-76. EDN MEHBUP. (In Russian)

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».