Экспертное исследование параметров распределения ЧОТ.

Экспертное исследование параметров распределения ЧОТ

Экспертное исследование параметров распределения ЧОТ

Иванов И.Л.
г.Орёл

(Пособие для экспертов системы экспертных учреждений Министерства юстиции Российской Федерации (СЭУ МЮ РФ), авторы: Каганов А.Ш. и др. подписано в печать 2004г.)

Глава 3. Технические и программные средства, применяемые в судебной фонографической экспертизе

§ 1. Теоретические основы проведения инструментальной части
идентификации говорящего.

Идентификационные признаки, связанные с оценкой параметров источника возбуждения речевого тракта.

Касим – коэффициент асимметрии, %;

dFо – среднее значение первой производной ЧОТ при ее возрастании, Гц/с;

D(+dFо) – дисперсия среднего значения первой производной ЧОТ при ее возрастании;

–dFо – среднее значение первой производной (ЧОТ) при ее снижении, Гц/с;

D(–dFо) – дисперсия среднего значения первой производной ЧОТ при ее снижении;

Важным является тот факт, что согласно ряду работ [1; 5; прил. 1 настоящего пособия] выбранные для анализа параметры ЧОТ являются стабильными во времени характеристиками. Например, полученные Е.В. Беловол [1] данные свидетельствуют об однородности 12 из перечисленных параметров у каждого из испытуемых на протяжении 5 месяцев эксперимента. Различие в эмоциональном состоянии испытуемых, хотя и влияло на анализируемые акустические параметры, не оказало значимого воздействия на их индивидуальную стабильность во времени. Если на заключительном этапе исследования параметров ЧОТ проанализировать средневзвешенное относительное отклонение анализируемых параметров основного тона исходного речевого материала от соответствующих параметров фонограммы–образца, можно увидеть, что оно находится в пределах среднестатистической внутридикторской вариативности.

При этом результаты инструментальной части исследования характеристик источника возбуждения речевого сигнала достоверны, поскольку базируются на представительной выборке (общее число измеренных периодов основного тона N легко может быть подсчитано как в материале исходных, так и сравнительных записей).

1.Как показывает экспертная практика, и неоднократные попытки ввести данные параметры исследования статистического распределения основного тона в программный продукт, не привели к существенному положительному эффекту. С чем это возможно связано:

2.Эмоциональное состояние идентифицируемого приводится в одинаковое состояние перед производством отбора образцов голоса и речи.

3.Создаётся одна и та же ситуационная обстановка.

4.Создаётся одинаковая акустическая обстановка для всех разнесённых по времени (в течение 5 месяцев, как было отмечено в книге) случаев отбора образцов.

5.Используется один и тот же канал записи.

6.Используется одна и та же аппаратура записи.

Таким образом, реальная экспертная практика показывает, что данные условия, как правило, не соблюдаются.

1.Эксперт не имеет возможности использовать для исследования ранее накопленные за фигурантом образцы голоса и речи.

2.Резко отличается ситуационная обстановка.

3.Резко отличается эмоциональное состояние.

4.Отличается канал записи (разговор по телефону из автомата и отбор свободной речи в помещении в приподнятом эмоциональном состоянии, когда фигурант понимает что он свидетельствует против себя) и т.д.

5.АЧХ сравнительных фонограмм, как правило, не совпадает.

И если ещё эксперт может ходатайствовать о дополнительных образцах голоса и речи, то второго дубля исходной записи не будет представлено.

Может требоваться шумоочистка как образцов, так исследовательского материала, темпокоррекция и т.д.

Таким образом, неоднократная попытка ввести данные параметры в программный продукт не привели к успеху.

В результате исследования dFо – среднее значение первой производной ЧОТ при ее возрастании, Гц/с и dFо – среднее значение первой производной (ЧОТ) при ее снижении, Гц/с (скорость нарастания, скорость убывания) была попытка объединить эти два параметра в один: dFо – среднее значение первой производной ЧОТ (средняя скорость изменения ЧОТ).

Исследование данного параметра оказалось устойчивым признаком. Для его проверки использовалась следующая методика:

1.Исследуются образцы голоса и речи, отобранные с использованием разных каналов записи, и с разным эмоциональным состоянием отобранные у одного фигуранта. Эти участки начинаются сравниваться между собой. Для примера сейчас будет исследован голос подростка 13 лет:

Параметры основного тона и темпа речи	чтение по телефону-автомату на улице	чтение в помещении (диктофон)	свободная речь в помещении (диктофон)
Количество периодов ОТ	2775	1586	325
Среднее значение Hz	181,0 3,3%	193.4 3,4%	187.1
Максимальное значение Hz	220,5 2,0%	239.7 6,5%	225.0
Минимальное значение Hz	149,0 8,4%	157.5 3,1%	162.6
СКО Hz	13,3 7,4%	13.1 5,5%	12.4
Значение диапазона ОТ(D)	1,16 1,5%	1.14 0,3%	1.14
Средняя скорость изменения ОТ Hz/сек	295,1 1,5%	282,2 3,0%	290.8

Для примера, в качестве исходной используется очень маленький по длительности материал=325 периодам ОТ.

Как мы наблюдаем за параметрами нового коэффициента, он прекрасно вписывается в таблицу основных статистических параметров голоса и речи, а по отдельным показателям – даже лучше основных.

По реальной экспертной практике в течении двух лет, данный параметр хорошо зарекомендовал на малых количествах по объёму исследовательского материала (анонимные звонки, террористические угрозы и т.д.). Для примера: реальная экспертиза по заминированию школы.

Исходная фонограмма № 1

«Пейсят втарая школа заминирована, не приедите через пять секунд –взарвётся.»

Общая длительность отобранного для анализа речевого материала составила 3.5 сек

Параметры основного тона и темпа речи	Образец Б__в И.В. фонограмма №1	Образец Б__в И.В. фонограмма №2	Образец И__в В.С. фонограмма №1	Образец И__в В.С. фонограмма №2	Исходная фонограмма М1
Количество периодов ОТ	10165	4553	4274	4109	527
Среднее значение Hz	162,5	203,4	123,9	165,2	197,3
Максимальное значение Hz	250,0	296,3	166,7	228,6	229,6
Минимальное значение Hz	80,0	60,6	60,6	62,5	127,0
СКО Hz	29,08 44,8%	38,46 91,6%	12,52 37,6%	25,50 27,0%	20,08
Значение диапазона ОТ (D)	1,44 17,1%	1,47 19,6%	1,22 0,1%	1,37 11,3%	1,23
Средняя скорость изменения ОТ Hz/сек	348,9 44,6%	387,6 60,6%	289,8 20,1%	280,5 16,2%	241,3

При анализе двух подозреваемых к причастию о сообщении о заминировании школы, из таблицы видно что ближе по коэффициентам подходит фигурант И__в В.С. (Аудитивная часть даёт такой же результат). Эмоциональное состояние на исходной фонограмме и на фонограммах-образцах сильно отличается, используются разные каналы записи и т.д.

Таким образом, есть предложение дальше продолжить исследование данного параметра.

А с учётом экспертной практики в течение 2 лет, он в принципе уже может использоваться экспертами.

Список литературы

1. Беловол Е.В. Проявление свойств темперамента в акустических характеристиках речи: Автореф. канд. дис. – М.: Союз, 1999.
5. Каганов А.Ш., Михайлов В.Г. Особенности подготовки образцов голоса и речи для проведения идентификационной фонографической экспертизы: Криминалистика XXI век / Материалы Всероссийской научно–практической конференции. – Ростов н/Д: ЮРЦСЭ МЮ РФ, 2001. – С. 113 – 120.