Métodos y equipos para el filtrado adaptativo de señales de voz.

metodi i apparatura adaptivnoi filtracii rechevogo signal

Métodos y equipos para el filtrado adaptativo de señales de voz.

Métodos y equipos para el filtrado adaptativo de señales de voz

Métodos y equipos de filtrado adaptativo de una señal de voz
V. I. Zolotarev,
Ph.D., investigador principal

Información general sobre interferencias y filtrado adaptativo
El registro, análisis y procesamiento de la información de audio es uno de los factores más importantes a la hora de realizar actividades de seguridad de la información. En este caso, suele ser necesario procesar la señal de audio para mejorar su calidad e inteligibilidad. Al realizar pruebas de audición o recibir  grabaciones en cinta de una señal de voz en condiciones reales para este  la señal se ve afectada por diversas interferencias. que reducen la calidad de la señal útil (de voz), incluidos  su inteligibilidad, hasta la ruptura de la comunicación. La tarea de reducir el nivel de interferencia para restaurar el significado del mensaje en una serie de situaciones prácticas es extremadamente relevante.
El efecto de la interferencia en una señal útil se puede presentar de forma simplificada utilizando los siguientes modelos. La Figura 1a muestra un modelo del efecto del ruido aditivo en una señal de voz, es decir el ruido se suma a la señal útil. Este modelo corresponde situaciones en las que la grabación se realiza en espacios abiertos y en  La interferencia puede incluir ruido del viento, ruido de la calle y de la construcción, etc.
En la Fig. 1b presentado modelo Efectos del ruido aditivo y multiplicativo. En este caso, antes del ingreso a  El receptor (oído humano) de información, una mezcla aditiva (señal de voz más ruido acústico), recorre una ruta de transmisión que tiene una característica de transferencia dependiente de la frecuencia. Por lo tanto, la mezcla de aditivos sufre cambios adicionales. multiplicativo distorsión: la mezcla se multiplica por las resonancias de la característica de transferencia del camino (convolucionada con la respuesta impulsiva del camino «Н»).  Esto El modelo corresponde a registrar una señal en interiores o transmitir señales por vías de radio y teléfono.

                   Fig.1a ;   Figura 1b
 

La tarea de eliminar o reducir el nivel de interferencia aditiva y multiplicativa se complica por la variabilidad de las características de la interferencia acústica (ruido del viento, follaje, tráfico, música, etc.) y las rutas de transmisión (una persona que habla camina por la habitación, gira la cabeza, etc.). Por tanto, para eliminar eficazmente la distorsión de la señal del habla, es necesario que el dispositivo que realiza esta función supervise constantemente los cambios en las características de la interferencia a lo largo del tiempo y ajuste constantemente su respuesta al impulso de acuerdo con estos cambios. Estas capacidades están disponibles en dispositivos que utilizan filtrado adaptativo para aislar la interferencia, o más bien evaluarla, con su posterior compensación en una mezcla de señal útil e interferencia.
La señal distorsionada se puede representar como una señal de un solo canal, es decir en forma de una mezcla de señal útil e interferencia (señal de voz ruidosa — sistema de defensa aérea), o en forma de señal de dos canales, cuando además del canal principal — ADMS, también existe un canal de referencia, cuya señal es lo más cercana posible a la interferencia presente en el ADMS. Según el tipo de presentación de la señal de entrada, se distinguen los dispositivos de filtrado adaptativo de un solo canal y de dos canales. En las figuras 2 y 3, respectivamente, se presentan diagramas de bloques simplificados de dispositivos de uno y dos canales, donde se presenta un filtro o procesador adaptativo que consta de dos bloques: un filtro transversal (para calcular la estimación de ruido « n^») y un procesador CLP (para calcular la respuesta impulsiva del filtro o el vector de coeficientes de predicción lineal «W») y un sumador separado para calcular el resultado de compensación «e& #187;.
En el procesador KLP, los valores de W se calculan de la siguiente manera. de tal manera que lo predicho en el momento j  valor n(j) compensó el componente de ruido n(j) con un resto mínimo. Valores W n^ y «e» se calculan en cada período de muestreo. Configuración para una compensación total del componente de ruido  llevado a cabo no instantáneamente, sino durante un tiempo determinado (tiempo de adaptación), que se regula mediante el coeficiente de adaptación m.

metodi i apparatura adaptivnoi filtracii rechevogo signal 2

                        &nb sp ; Figura 2

   Si solo hay un sistema de defensa aérea de un solo canal, la compensación se realiza de acuerdo con el esquema de la Fig. 2. En este caso, la señal de referencia se genera a partir del SRS. Según este esquema, se pueden reducir los ruidos aditivos que tienen componentes periódicos (por ejemplo, el ruido de varios motores, motores, música, etc.), y también se puede reducir la influencia del ruido multiplicativo, incluidas las distorsiones de reverberación.
Para realizar la compensación de ruido en un sistema de defensa aérea de dos canales, se utiliza un esquema de filtrado adaptativo, como se muestra en la Fig. 3, donde llega el sistema de defensa aérea por el canal principal, y por el canal de referencia — sólo el ruido «n», correlacionado con el ruido «n» en el sistema de defensa aérea. El retardo ajustable está diseñado para compensar el retardo de la señal acústica que se produce en uno de los canales (la Fig. 3 muestra la compensación del retardo en el canal principal). Si hay una señal correspondiente en el canal de referencia, este esquema puede compensar casi cualquier ruido aditivo con eficiencia variable.

metodi i apparatura adaptivnoi filtracii rechevogo signal 3

      &nbsp ;                         Figura 3

En ambas opciones para presentar el insumo  señal El filtrado adaptativo se realiza mediante el mismo procedimiento. En un filtro digital adaptativo en cada periodo  muestreo «p» proyecciones w(i) del vector W y calcular la convolución de W con la señal de entrada. Como resultado de esto, en el j-ésimo momento  tiempo para la señal original x(j) se determina  valor día libre señal e(j), donde se compensa la componente de interferencia.
El ajuste (adaptación a las condiciones externas) del vector W se realiza según los principios de optimización según el criterio del valor medio mínimo del módulo de señal de salida. Al recibirlo El algoritmo de adaptación computacional utiliza el aparato matemático de filtrado óptimo. La convergencia del algoritmo se realiza mediante el método de descenso más pronunciado y, para simplificar los cálculos, se utiliza la aproximación estocástica del gradiente según Widrow-Hopf.
En la versión de un solo canal, se utiliza un algoritmo de deconvolución adaptativa («escaneo») para procesar los sistemas de defensa aérea, y en la versión de dos canales — compensación adaptativa. La diferencia fundamental entre las opciones de procesamiento es la generación de señales de entrada que se utilizan en el procedimiento computacional posterior. B  Versión monocanal, ambas señales de entrada (principal y  de referencia)  se están formando  a partir de una señal de entrada, mientras que la señal de entrada original es la principal, y la de referencia se forma a partir de la original utilizando un retardo unitario. En la versión de dos canales, las señales principal y de referencia existen realmente y se utilizan directamente en el proceso de cálculo posterior. Lo mismo informática el procedimiento para ambas opciones es el mismo y se ve así: 
w(j,i) = w(j-1,i) + m x(j-1-i) Sgn e(j),                           (1)
donde j=1,2,3…    — tiempo discreto actual (cada momento de tiempo está separado del momento siguiente por el período de muestreo Td); i=1,2,3,…,р — número de serie de la proyección del vector W. 
De acuerdo con este algoritmo, el procesador KLP (ver Fig. 2 y 3) para cada período de muestreo — Td calcula (predice)  en el siguiente j-ésimo momento de tiempo discreto «р» coeficientes de predicción lineal (proyecciones «p» W). Con la ayuda el coeficiente de adaptación regula la velocidad de convergencia del algoritmo. y en En última instancia
la velocidad de seguimiento cambia las características de la interferencia. Previsto valor W(j)   utilizado en el procesador de filtro transversal para calcular una estimación del valor de ruido — n^(j) en el j-ésimo momento de tiempo y el valor de la señal (de salida) compensada e(j):
n^(j) = w(1,j)x(j-1) +… + w(i,j)x(j-i)+…+ w(p,j)x(j-p)     (2)
e(j) = x(j) — n^(j) = s(j)+n(j)-n^(j) ;                     (3)
La expresión (2) representa una expresión discreta. convolución de la señal de entrada con un vector  coeficientes de predicción lineal. A medida que avanza la adaptación, la estimación de la interferencia se acerca cada vez más al  interferencia y su compensación en la señal de entrada se vuelve más completa.
Vale la pena señalar algunos puntos que son útiles para el trabajo práctico con  señal de un solo canal. En el límite, la adaptación  W  sucede antes Descorrelación completa de la señal de entrada, es decir. antes recibiendo en salir «blanco»  ruido. En este caso, no importa por qué interferencia  la envolvente espectral de la señal de entrada tiene desigualdades: debido a la interferencia aditiva con señales «coloreadas» espectro o debido a convolución con resonancias del camino de transmisión. Esto también se aplica al habla misma. señal, que es producto de la convolución de la voz y el ruido. fuentes de excitación con la respuesta impulsiva del tracto articulatorio, es decir, Si elige incorrectamente la velocidad de adaptación, que se regula mediante el coeficiente de adaptación m, no sólo podrá compensar la interferencia, sino también distorsionar significativamente la señal de voz.
En una situación real, la descorrelación de la interferencia (suponiendo que la velocidad de adaptación se elija correctamente y que la señal de voz en el sistema de defensa aérea no sufra distorsiones adicionales causadas por el procesamiento adaptativo) nunca puede ser completa y su profundidad está limitada por la zona de insensibilidad de el dispositivo. A su vez, esta zona está determinada por la componente constante (la finitud de la grilla de bits del ADC, los dispositivos aritméticos del procesador y la resolución del filtro «k», k = p Td) y la componente variable (la constancia de las estadísticas de ruido y el valor numérico del coeficiente de adaptación). En el límite, con interferencia estacionaria o periódica y el coeficiente de adaptación tiende a cero (la velocidad de adaptación es mínima), la zona muerta es mínima y está determinada únicamente por su componente constante.
    En presencia de interferencias no estacionarias, por ejemplo, interferencias musicales, que pueden considerarse como una señal modulada en frecuencia, cuyo espectro es más amplio que el de una señal convencional, y para descorrelacionarla es necesario ampliar la banda de frecuencia operativa. del dispositivo, es decir reducir Td, reducir aún más la resolución del filtro reduciendo el número de CLP (valor «p»), porque La constante de tiempo de los filtros de banda ancha es menor y reaccionan más rápidamente a una señal de entrada cambiante y también aumentan la velocidad de adaptación para rastrear las características cambiantes del ruido al calcular el vector W.
En presencia de ruido multiplicativo en el forma de un «estable» reverberación,  su impacto se puede compensar aumentando la resolución del filtro debido a ambos factores y eligiendo la velocidad media de adaptación.
Con base en lo anterior, podemos formular requisitos generales para un dispositivo de filtrado adaptativo diseñado para reducir efectivamente el nivel de varias clases de interferencia en un sistema de defensa aérea de un solo canal. Este dispositivo debe tener una banda de frecuencia operativa ajustable, un número ajustable de CLP y una velocidad de adaptación ajustable, y limitado en la parte superior para reducir la influencia del filtrado adaptativo en la señal de voz.
 

    Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
    Принять