Eliminación de rastros de otros objetos fonográficos de la señal de voz mediante descomponerlos en elementos de microondas..
Zhenilo Valery Romanovich, Doctor en Ciencias Técnicas
ELIMINACIÓN DE HUELLAS DE OTROS OBJETOS FONO DEL HABLA SEÑAL POR SU DESCOMPOSICIÓN EN ELEMENTOS DE MICROONDAS
Fuente: revista «Equipos Especiales»
Eliminar de la señal del habla rastros de otros objetos fonográficos que interfieren con la percepción correcta del habla o reducen la calidad de su sonido es una tarea bastante urgente. Desafortunadamente, para resolver este problema, muchos métodos de filtrado, incluidos los adaptativos, a veces resultan insuficientemente eficaces. Esta cuestión es especialmente grave en la ciencia forense, que requiere preservar la autenticidad de las huellas de los fonoobjetos estudiados en todas las etapas del estudio y, en particular, en la etapa de limpieza de la señal del habla del ruido y las interferencias.
Actualmente, los sistemas de filtrado de señales de voz de que disponen los expertos forenses tienen una propiedad muy negativa. Todos ellos, de una forma u otra, distorsionan las huellas de los fonoobjetos, sobre los cuales el experto posteriormente toma una decisión sobre tal o cual tema de examen.
En este sentido, se llevaron a cabo estudios especiales en el Centro de Expertos Forenses del Ministerio del Interior de Rusia ( I.N. Timofeev, T.I. Goloshchapova, I.V. Dokuchaev. Posibilidades de utilizar herramientas de reducción de ruido de señales multicanal al realizar investigaciones de identificación: Resúmenes de la Conferencia Internacional «Informatización de los sistemas de aplicación de la ley», M., 1997. P. 194 — 196.) para determinar qué sistemas de filtrado de señales para aumentar la inteligibilidad del habla se pueden utilizar para limpiar las huellas del habla del ruido, interferencias y capas de huellas de otros objetos fono, y cuáles no. Resultó que casi todos los sistemas existentes para filtrar las señales del habla cambian (distorsionan) los parámetros acústicos de las señales del habla, que se utilizan para tomar decisiones sobre la identidad de las huellas de la voz y la articulación del hablante, sobre el diagnóstico y la identificación de las condiciones de grabación del sonido. , etc. Esto se debe a que el objetivo inicial de cualquier sistema automático de este tipo es aumentar la inteligibilidad del habla percibida por el oído, hasta llegar a distorsionar la propia señal del habla, haciéndola completamente diferente de la señal del habla natural.
Sin duda, la tarea de mejorar la inteligibilidad de las señales del habla es tan difícil como cualquier otra en la tecnología del habla. Por lo tanto, los desarrolladores de estos sistemas se ven obligados a hacer ciertos sacrificios en la calidad de la señal de voz clara resultante. Una señal de voz viva es un rastro de un objeto fono inteligente en condiciones terrenales reales — con todos los efectos de reflexión de ondas, reverberación, detonación de grabadoras, etc. A priori es muy difícil describir matemáticamente una traza de este tipo con un grado suficiente de fiabilidad. Es por eso que los desarrolladores de sistemas para aumentar la inteligibilidad descuidan posibles cambios en una serie de características cualitativamente importantes de la señal de voz filtrada para resolver el problema principal: lo que se dice en condiciones de interferencia o ruido.
En la práctica, surge con mayor frecuencia la siguiente situación: para medir los parámetros de las señales de voz para estudios de identificación, primero es necesario limpiar las señales de la interferencia. y el ruido, pero después de este procedimiento, los estudios de identificación que eliminan los rastros de las señales del habla a menudo se vuelven simplemente inaceptables.
Para que de alguna manera la solución a este problema despegue, es necesario, según el autor, incluir la inteligencia de un experto en el propio sistema de purificación de señales de voz, y no dejar al sistema de procesamiento automático de señales el derecho a » decidir” qué es importante dejar en la señal del habla y qué se puede eliminar. Este enfoque será muy impopular al principio, ya que la productividad «laboral» de los sistemas informáticos automáticos en la parte informática es incomparablemente mayor que la productividad laboral humana. Sin embargo, hay que recordar que la productividad de su trabajo en la parte intelectual varía igualmente, pero en la otra dirección.
Todas las primeras tecnologías de sistemas de filtrado de señales hombre-máquina tendrán una baja productividad. Sin embargo, a medida que se desarrollen y se tipifiquen, sin duda se acelerarán transfiriendo a la computadora todos los procesos informáticos que obviamente requieren mucha mano de obra.
A continuación se muestra un enfoque para crear dicha tecnología. Se basa en la estratificación de todos los rastros de objetos fono presentes en una señal determinada en dos grupos, seguida de la restauración de dos señales en el dominio del tiempo para que cada una de ellas contenga rastros de un solo grupo y, lo más importante, permanezca auténtico.
Cabe señalar que en fonoscopia este enfoque es posible porque antes de la etapa de conversión de una onda acústica en eléctrica (en un micrófono), todas las señales acústicas se comportan como ondas ordinarias con todas las propiedades, ventajas y desventajas consiguientes. Por lo tanto, si, por ejemplo, en la toma de huellas dactilares, la imposición de una nueva huella dactilar cubierta con pintura sobre una vieja puede cubrir completamente los elementos individuales de esta última, entonces en la fonoscopia, la superposición de dos ondas acústicas (señales del habla) conduce a su interferencia. En la fonoscopia, si se mezclan rastros de varios fonoobjetos, estos «viven» independientemente unos de otros, sin destruirse entre sí, sino sólo interferir. La superposición de una huella sobre otra no destruye ésta del mismo modo que la superposición de varias huellas dactilares.
En el trabajo «Computer Phonoscopia» (1995), el autor propuso una clasificación de los principales tipos de fonoobjetos que se encuentran con mayor frecuencia en la práctica forense. Son pocos: una persona, una grabadora (o, en general, una grabadora de voz), una armónica, una voz, una serie de impulsos del mismo tipo, etc. Con un número reducido de elementos de clasificación, detrás de cada uno de ellos se esconde un complejo sistema específico de descripción matemática de sus propiedades. Cada uno de estos tipos de objetos fonográficos tiene su propia tecnología para su análisis, procesamiento o purificación. La forma más sencilla de crear una tecnología de este tipo es para objetos fonográficos como los armónicos. Sin embargo, como estos en su forma pura son relativamente raros en la práctica, el desarrollo de tecnologías correspondientes es menos relevante que, por ejemplo, el desarrollo de tecnologías para un fonoobjeto del tipo “persona”. Por lo tanto, es aconsejable comenzar con la implementación de tecnología para analizar y procesar rastros de fonoobjetos del tipo “otro”, principalmente de acuerdo con el criterio “relación de costos de desarrollo — a la relevancia práctica”. Sin embargo, si el número de desarrolladores de sistemas fonoscópicos en los departamentos científicos del Ministerio del Interior sigue creciendo, en un futuro próximo podemos esperar una solución a un problema similar en relación con otros tipos de fonoobjetos.
También es más útil desarrollar una tecnología para separar las huellas de diferentes objetos fonográficos pertenecientes a la categoría «otros», porque, de hecho, esta tecnología debería ser extremadamente universal, por lo que, muy probablemente, en algunos casos podrá para ayudar a separar rastros de los tipos de objetos fonográficos mencionados anteriormente. Por supuesto, a pesar de su versatilidad, puede volverse tecnológicamente menos efectivo, pero, repetimos, esto nos permitirá avanzar en la solución de un problema fundamentalmente difícil para la ciencia forense.
La categoría de un fonoobjeto “otro” supone que se desconocen las propiedades reales de este fonoobjeto. En consecuencia, no existe una descripción matemática de sus propiedades y, por lo tanto, quizás el único aparato matemático actualmente aceptable para representar y analizar rastros de estos fonoobjetos sea la descripción espectral clásica basada en la transformada de Fourier.
Dado que las funciones básicas de la transformada de Fourier son armónicos, está claro que la tecnología propuesta será más adecuada para aquellas señales cuyos principales elementos de información sean componentes armónicos. En realidad, todas estas son secciones tonales de las señales del habla.
La representación de las huellas de un objeto fonográfico mediante ecografías tradicionales permite al experto distinguir visualmente los componentes individuales de tiempo y frecuencia incluso de varias señales mixtas. rastros de diferentes fonoobjetos. Permítanos recordarle que es casi imposible hacer lo mismo en el dominio del tiempo usando el oscilograma original.
Para facilitar una descripción más detallada, introduciremos varias definiciones auxiliares.
La construcción de ecografías tiene muchos grados de libertad. Desde la ecografía — Dado que en realidad se trata de una serie secuencial de espectros de amplitud que se suceden en un paso de tiempo constante, hablaremos de ella como de una película que consta de muchos fotogramas. Cualquier película de este tipo se describe mediante dos parámetros principales: velocidad de fotogramas y resolución de cada fotograma. Pero si en las películas la conexión entre estos parámetros generalmente no se especifica, en la fonoscopia sí. La esencia de esta conexión es la siguiente. Supongamos que los espectros para construir un sonograma se calculan utilizando una ventana de tiempo gaussiana que proporciona una resolución de frecuencia igual a sf Hz. En este caso, construir una película con una frecuencia superior a 2psf fotogramas por segundo no tiene sentido debido a la aparición de redundancia de información de espectros adyacentes o, como también los llamaremos, fotogramas de la película de ecografía (en adelante, por brevedad, simplemente llamaremos ecografía a la película de ecografía).
Si se cumple con la relación óptima entre la velocidad de fotogramas y su resolución, resulta que la tarea de sonofilm tiene solo un grado de libertad. Puede ser la velocidad de fotogramas o la resolución de un fotograma individual. Supongamos que se ha elegido la velocidad de fotogramas como grado de libertad para construir la sonopelícula. ¿Cuál debería ser?
La elección de la velocidad de fotogramas de la sonopelícula depende de las propiedades de la señal visualizada o, en otras palabras, de las propiedades del fonoobjeto en estudio. Si son murciélagos o delfines, entonces la frecuencia de las sonopelículas debería ser relativamente alta. Si se trata de sonidos periódicos de las olas del mar u otros procesos que fluyen lentamente (señales de electrocardiograma, respiración, etc.), entonces la frecuencia de la sonopelícula será relativamente baja. Para diferentes mecanismos que producen señales periódicas, la velocidad de fotogramas de las sonopelículas que reflejan más claramente sus propiedades será diferente.
Aún no se ha establecido con precisión cuál debería ser la frecuencia de la película sonora de una señal del habla humana. Es muy posible que esté cerca de la frecuencia mínima de una película normal, en la que el parpadeo de los fotogramas aún no es visible, pero si la película se ve a una frecuencia más baja, entonces el parpadeo se vuelve perceptible. Para los resultados que se presentan a continuación, el autor seleccionó empíricamente una frecuencia de construcción de sonofilm de 150 fotogramas por segundo. En aras de la objetividad, cabe señalar que para resolver esta cuestión es necesario realizar estudios especiales sobre la frecuencia óptima de construcción de una sonopelícula. El criterio de optimización dependerá del problema a resolver. Puede ser, por ejemplo, una medida de la diferencia entre la señal de voz original y la sintetizada a partir de todos los rastros de la misma señal de voz reflejada en la sonopelícula.
Hablando de la reflexión de una huella de un objeto fono con propiedades desconocidas en una sonopelícula, hay que tener en cuenta que su naturaleza puede ser completamente arbitraria — un impulso, una serie de componentes armónicos individuales, una serie de impulsos que se convierte (o no) en voz, etc. En todos estos casos, su descripción matemática será diferente. La elección de la descripción básica está determinada en realidad por el tipo de transformación de la señal original de la forma oscilográfica a la forma ecográfica. Por lo tanto, si se construye una sonopelícula utilizando la transformada de Fourier y la ventana de tiempo gaussiana, entonces los elementos básicos en los que se descompondrán las huellas de los fonoobjetos deben pertenecer a la misma categoría. En este caso, el reflejo del elemento más simple de una huella fono-objeto en una sonopelícula se representará de la siguiente forma:
, (1)
donde
sf es la resolución de frecuencia de los espectros;
t0 – posición de la ventana gaussiana en el tiempo (de hecho, este es el tiempo del cuadro actual de la sonopelícula);
w0 – componente armónico de frecuencia de la traza fono-objeto en el cuadro actual;
j0 – fase inicial del componente armónico de la traza fono-objeto en el cuadro actual;
a0 – tasa de cambio en la amplitud del componente armónico de la traza fono-objeto en el cuadro actual;
d0 – tasa de cambio en la frecuencia del componente armónico de la traza fono-objeto en el cuadro actual;
A0 – amplitud del componente armónico de la traza fono-objeto en el cuadro actual.
La descomposición de la señal de voz original en una serie de elementos de microondas (1) en cada cuadro de la sonopelícula se lleva a cabo al calcular cualquier sonograma de amplitud tradicional.
El componente armónico elemental de la señal, presentado por La fórmula (1), en algunas propiedades, se parece al concepto de “wavelet”, actualmente popular en las tecnologías de la información del habla. Por ejemplo, como una wavelet, la función e(t) tiende muy rápidamente a cero cuando t se desvía de t0 en más de unos pocos pies cuadrados.
En el marco actual, cada componente armónico elemental de la traza de un objeto fono de un tipo a priori desconocido para nosotros puede tener cinco grados de libertad: A0, w0, j0, a0 y d0. Si este componente es lo suficientemente potente, entonces todos sus parámetros se pueden calcular con un grado razonable de precisión a partir de un cuadro instantáneo del espectro complejo.
La última afirmación distingue de manera muy significativa la tecnología de trabajar con un fonoobjeto de naturaleza desconocida (fonoobjetos de un «otro» grupo) de fonoobjetos de un determinado grupo. Si se trata de fonoobjetos de un determinado grupo, entonces la dinámica de su huella se puede modelar y predecir durante un período de tiempo relativamente largo. En estos casos, en fotogramas individuales de la sonopelícula, puede producirse una desaparición completa de la huella del fonoobjeto que nos interesa en las huellas de fonoobjetos más potentes. Sin embargo, debido a la interferencia de trazas de diferentes objetos fonográficos, su separación es teóricamente posible.
Cuando se trabaja con fonoobjetos de un grupo «diferente», no se puede esperar que en el patrón de interferencia un experto pueda identificar claramente rastros de un fonoobjeto necesario o innecesario. Por lo tanto, en realidad, las huellas sólo pueden separarse correctamente con la condición de que la huella de uno de los fonoobjetos sea significativamente más poderosa que la del otro. En este caso, al estimar los parámetros de los elementos de microondas (1) de la traza del objeto fono más potente en el marco de la sonopelícula, se pueden despreciar los fenómenos de interferencia.
Probar la viabilidad tecnológica de las hipótesis expresado, se llevaron a cabo los siguientes experimentos.
Experimento 1.Comprobación de la calidad de descomposición de la señal del habla en elementos de microondas (1) en cada cuadro de la sonopelícula. En la figura. 1 en la parte superior muestra la dinámica del nivel de potencia de la señal de voz experimental, y en la parte inferior se muestra la sonopelícula correspondiente.
Fig. 1. Nivel de potencia y película sonora de la señal de voz original
A partir de las condiciones experimentales, se supone que todos los rastros en todos los fotogramas de la sonopelícula resultante deben incluirse en un análisis posterior. Por lo tanto, todos los rastros del sonofilm se descomponen en elementos de microondas (1). A partir de estos elementos de microondas se creó una nueva señal de voz. El resultado de este montaje se muestra en la Fig. 2. El análisis de la señal de voz sintética así obtenida mostró lo siguiente.
Para el oído, la señal sintética prácticamente no se diferencia de la original. No contiene armónicos, “metal” u otros sonidos sintéticos no naturales.
Fig. 2. Nivel de potencia y sonofilm de la señal de voz sintetizada a partir de todos los rastros reflejados en el sonofilm de la Fig. 1
De la dinámica del nivel de potencia y la sonopelícula de la señal sintetizada se desprende claramente (Fig. 2) que la señal sintética se diferencia de la señal del habla original en el patrón de ruido que acompaña a la señal del habla, que es claramente visible en las pausas del habla.
Las mayores diferencias se observan en la región de frecuencia cero y frecuencia de Nyquist. Esto se debe a que es imposible estimar los componentes de microondas de la señal original con suficiente precisión en estas regiones. Por lo tanto, se pierden para el análisis y la síntesis. Pero en realidad se trata de una pérdida pequeña, ya que, por ejemplo, en este caso se perdieron componentes de frecuencia de cero a 25 Hz. Estas pérdidas auditivas no son perceptibles. Las pérdidas en la misma banda de frecuencia estrecha de 25 Hz de ancho, pero cerca de la frecuencia de Nyquist, tampoco pueden denominarse tales en el sentido estricto de la palabra, ya que en el proceso de conversión de analógico a digital (ADC) de trazas de objetos fono, todos sus componentes de frecuencia que se encuentran cerca de la frecuencia de Nyquist siempre se eliminan (por ejemplo, filtros de entrada ADC).
La comparación de la forma oscilográfica de la descripción de la señal original con la recién obtenida a partir de elementos de microondas (Fig. 3) también muestra su buena concordancia. La mayor diferencia se nota sólo en la sección sorda de la señal del habla en la parte izquierda del oscilograma, y en las secciones tonales de la señal del habla las señales original y sintética apenas se diferencian entre sí. Y esto a pesar del alto grado de no estacionariedad natural de la señal de voz en el área mostrada.
Fig. 3. Fragmentos de oscilogramas de las señales presentadas en la Fig. 1 y 2 (arriba — la señal original original, abajo — una artificial, hecha de elementos individuales de microondas)
Experimento 2 .Comprobación de la exactitud del cálculo y resta de potentes interferencias armónicas. Para llevar a cabo este experimento, se mezcló con la señal original una potente interferencia modulada en frecuencia. La sonopelícula de la señal recibida se muestra en la Fig. 4. El nivel de potencia de interferencia era 5 dB más débil que la sección más potente de la señal de voz original. De oído, la señal de voz era bastante inteligible a pesar de la presencia de ruidos muy molestos.
>p>
Fig. 4. Sonofilm de la señal de voz original con potente interferencia de frecuencia modulada mezclada
Durante el experimento, el experto notó una pequeña área de rastros de interferencia en la sonopelícula, que se descompusieron automáticamente en elementos de microondas (1) y se restaron de la señal en estudio.
p>
El resultado de este experimento se muestra en la Fig. 5, donde se ve claramente que el algoritmo para calcular los elementos de microondas y su eliminación funcionó de manera extremadamente correcta. Esto se reflejó en la pureza de la película sonora de la nueva señal procesada. En el lugar donde se ubicó la interferencia, sus huellas son prácticamente invisibles.
Fig. 5. Sonofilm del resultado de eliminar de elementos individuales de microondas los rastros de interferencia reflejados en el sonofilm en la Fig. 4
Es importante enfatizar que en este experimento la señal del habla en sí no fue sometida a la descomposición de todos los rastros en elementos de microondas y al posterior ensamblaje de una nueva señal. La señal de voz permaneció completamente auténtica (igual al original). Sólo se descompusieron rastros de interferencia en elementos de microondas, que se restaron de la señal experimental.
Los resultados de este experimento ilustran bien la diferencia en las tecnologías de limpieza de rastros en fonoscopia y toma de huellas dactilares. En la fonoscopia, al eliminar los elementos de microondas de interferencia potente, se pueden ver (y, por lo tanto, escuchar) rastros de la señal útil debajo de ellos en su forma original (auténtica). Esto es posible básicamente gracias a la aditividad de las señales acústicas. Por lo tanto, es muy posible extraer una señal de voz a partir de una serie de poderosas interferencias armónicas que la ahogan por completo. Para probar esta afirmación, se llevó a cabo el siguiente experimento.
Experimento 3. Extracción de una señal de voz de una mezcla de interferencias moduladas en frecuencia que superan las secciones más potentes de la señal de voz en más de 20 dB.
A la señal de voz pura se le mezclaron potentes interferencias de frecuencia modulada, haciendo que los rastros de voz fueran completamente inaudibles. En la figura. La figura 6 muestra el nivel de potencia de la señal original (parte superior de la figura) y el fragmento correspondiente de la sonopelícula (parte inferior de la figura). En una pequeña sección de la señal experimental, el experto identificó rastros de interferencia. Estas trazas se descompusieron automáticamente en elementos de microondas y se restaron de la señal en estudio. Como resultado, se obtuvo una nueva señal, cuyo nivel de potencia y película sonora se muestran en la Fig. 7.
Fig. 6. Sonofilm de la señal de voz original con una potente interferencia de frecuencia modulada mezclada, por lo que los rastros de la voz no son audibles en absoluto
Arroz. 7. Sonofilm del resultado de la eliminación de datos de elementos individuales de microondas de todos los rastros de interferencia reflejados en el sonofilm en la Fig. 6
Observemos los siguientes resultados importantes del experimento. En primer lugar, la calidad del sonido del fragmento restaurado de la señal de voz después de su amplificación es muy satisfactoria. En segundo lugar, en la sección de señal procesada el nivel de ruido disminuyó aproximadamente 60 dB. El contorno del nivel de potencia de la señal extraída (en la Fig. 7 arriba) difiere poco del original (en la Fig. 1 arriba). Para poder ver todas las sutilezas de la nueva señal, tuvimos que aumentar el nivel de renderizado de su sonofilm en más de 20 dB. En tercer lugar, la comparación de sonofolms en la Fig. 6 y 7 muestran que en la señal procesada se hicieron visibles huellas de voz completamente enmascaradas. Sin embargo, son visibles algunos restos de huellas de interferencia.
Cabe señalar que tales resultados solo se pueden lograr en los casos en que hay rastros de la señal de voz en la señal en estudio y no se pierden como resultado de recortes, fuertes distorsiones no lineales o cuando la señal útil es más débil que la interferencia es tanta que en principio no puede ser detectada por el equipo.
Los resultados experimentales indican la promesa de la tecnología propuesta para descomponer señales en elementos de microondas. Sin embargo, en la práctica pueden surgir una serie de dificultades, entre las cuales la reverberación ambiental es una de las más importantes. Para identificarlos se realizó otro experimento.
Experimento 4.Extracción de una señal de voz a partir de un conjunto de interferencias moduladas en frecuencia que hacen que la voz sea completamente ininteligible cuando se graba en una habitación con propiedades de reverberación desconocidas.
En la Fig. La figura 8 muestra la dinámica del nivel de potencia y la película sonora de una grabación de sonido experimental.
Arroz. 8. Sonofilm de la señal de voz original mezclada con una poderosa interferencia de frecuencia modulada en una habitación con propiedades de reverberación desconocidas
Al escuchar este fonograma experimental, solo puedes reconocer una voz masculina , pero no puede comprender ninguna de las dos palabras debido al enmascaramiento completo de la señal del habla. El nivel de interferencia superó las secciones más potentes de la señal de voz entre 6 y 10 dB.
Después de que el experto notó rastros de interferencia en la sonopelícula, los descompuso en elementos de microondas y los restó de la señal experimental original. El resultado de este procesamiento se muestra en la Fig. 9.
La señal de voz así purificada se volvió completamente inteligible, pero persistieron algunas interferencias. Sin embargo, el nivel de interferencia no disminuyó tan significativamente como en el Experimento 3. Llegó a estar sólo 20 dB por debajo de las partes más potentes de la señal de voz (es decir, la interferencia disminuyó entre 26 y 30 dB, y no en 60 dB, como ocurría en el experimento 3). caso en el experimento 3).
En la parte inferior de la Fig. 9 muestra que las huellas de interferencia están significativamente debilitadas, pero no han desaparecido por completo. Sólo aquellos rastros que permanecieron en sus frecuencias constantes en cuadros adyacentes desaparecieron por completo. Si el rastro se movía en frecuencia a alta velocidad de un cuadro a otro, entonces era el que menos se debilitaba. Esto se explica por el hecho de que, en realidad, en el último caso, en un cuadro hay simultáneamente dos trazas de interferencia armónica muy próximas. Primer rastro — la ola principal y la segunda — reflejado en las paredes de la habitación. Dado que la onda reflejada llega un poco más tarde que la directa, su frecuencia siempre irá por detrás de la frecuencia de la onda principal en una cantidad que depende de la velocidad de modulación de la frecuencia de la señal de interferencia. Si examina cuidadosamente el rastro de las señales de interferencia en la Fig. 8, se puede observar que, además de la principal interferencia modulada en frecuencia, junto a ella se pueden ver rastros debilitados de su propia onda reflejada desplazada hacia la derecha.
Dado que en este experimento las ondas reflejadas tienen una amplitud significativamente menor que las directas, se puede argumentar que, de hecho, después de una etapa de procesamiento de la señal, solo se eliminaron ondas directas potentes y todas las reflejadas permanecieron sin cambios. Las únicas excepciones fueron aquellas áreas de interferencia donde prácticamente no cambiaron de frecuencia. En este caso, tanto las ondas directas como las reflejadas se eliminan completamente simultáneamente.
Los rastros de las ondas reflejadas restantes se pueden volver a etiquetar, descomponer en elementos de microondas y restar de la señal en estudio. Pero al mismo tiempo, las restricciones a la corrección de todas estas operaciones comienzan a afectar, ya que el nivel de la señal de interferencia se acerca demasiado al nivel de la señal de voz en sí. En este caso, es posible eliminar por error los rastros de la señal del habla, como resultado de lo cual aparecerán franjas de luz simplemente vacías en la sonopelícula. Pero cabe destacar una vez más que en todas las demás secciones de todos los fotogramas de la sonopelícula se garantiza que los rastros de la señal del habla estudiada seguirán siendo auténticos, lo cual es muy importante para los estudios y exámenes fonoscópicos forenses.
La tecnología propuesta se puede utilizar para resolver una amplia clase de problemas, desde la restauración de fonogramas de archivo preservando su autenticidad hasta la grabación de discursos ahogados por poderosas interferencias.