Limpieza de ruido de fonogramas.

logo11d 4 1

Limpieza de ruido de fonogramas.

Eliminación de ruido de fonogramas

Eliminación de ruido de fonogramas

En algunas áreas de la actividad humana, es necesaria una transcripción precisa de las grabaciones de voz. Este artículo discutirá los problemas que surgen al transcribir fonogramas y las formas de resolverlos.

La grabación sonora del habla se utiliza activamente como uno de los medios para garantizar la seguridad en diversas áreas de la actividad humana. En particular, se graban en cinta las instrucciones orales y las negociaciones de las tripulaciones de aviones y grandes barcos, del personal de instalaciones técnicas complejas, de diversos servicios médicos, de emergencia y de aplicación de la ley, y de algunas organizaciones comerciales; En algunos casos, es necesario grabar la voz y otras señales acústicas en instalaciones industriales. Se utilizan medios explícitos y ocultos de grabación de sonido para registrar información operativa durante negociaciones, reuniones, conferencias, deliberaciones, así como durante la búsqueda, el control y otras acciones para garantizar la seguridad.

En algunos casos, la baja calidad de la grabación sonora resultante (fonograma) crea ciertas dificultades para descifrar la información necesaria. Las razones de esto suelen radicar tanto en la elección y el uso fallidos o ineptos de los medios de transmisión y grabación de información acústica, como en la dificultad objetiva e incluso la imposibilidad de obtener grabaciones sonoras «limpias» y de alta calidad en algunas circunstancias específicas.

En este artículo no nos detendremos en la elección de micrófonos y otras fuentes de captación de señales acústicas, su ubicación, la organización de los canales de comunicación con los equipos de grabación o la elección óptima del equipo de grabación de sonido. Este tema absolutamente importante debería dedicarse a una publicación separada. Solo me gustaría señalar que en la mayoría de los casos es más barato, más fácil y más útil invertir dinero y tiempo en el soporte técnico y organizativo del proceso de grabación de sonido de buena calidad, en lugar de intentar luego «exprimir» la información necesaria de grabaciones de baja calidad. Por ejemplo, creemos que las grabadoras de voz en miniatura como «Pearicorder» de la empresa japonesa Olimpus son de poca utilidad para obtener una grabación rápida de sonido en situaciones graves, ya que no tienen las características de rendimiento necesarias para la grabación de habla tranquila y ruidosa.

Tareas de procesamiento de grabaciones de audio

Al procesar grabaciones de audio, un técnico se enfrenta a las siguientes tareas:
— establecer e imprimir en papel el contenido textual del discurso grabado, es decir, obtener un “texto”;
— preparar el material de audio de demostración necesario a partir de las grabaciones de sonido originales;
— realizar la máxima limpieza posible del habla para eliminar interferencias y distorsiones — realizar un examen de las grabaciones de sonido;

Al realizar un examen, generalmente es necesario establecer la presencia de rastros de edición o copia deliberada de una grabación de sonido; determinar el tipo o identificar una instancia específica de un dispositivo de grabación de sonido; indicar las circunstancias de la grabación de sonido, método, entorno, ubicación del equipo de grabación de sonido, tipo de fuente de ruido audible, etc.; establecer la identidad o diferencia de la voz en una grabación de sonido determinada (en disputa) con una voz, cuya muestra se presenta en otro fonograma (comparativo). En algunos casos, es necesario determinar las características distintivas del hablante a partir de la grabación sonora del discurso oral (por ejemplo, sexo, edad, lugar de nacimiento, profesión, presencia de enfermedades, etc.).

Cuando se trabaja con grabaciones de sonido de alta calidad y un pequeño volumen de material grabado, las dos primeras tareas pueden ser resueltas por casi cualquier usuario de una grabadora convencional con un gran volumen de material, simplemente estableciendo el tamaño. El contenido textual exacto de la grabación sonora puede requerir una cantidad de tiempo inaceptablemente grande.

Pero para cualquier trabajo con grabaciones de sonido de baja calidad, se necesita un especialista capacitado y técnicamente competente y diversos medios técnicos.

A su vez, la resolución de cualquier problema experto requiere de un especialista cualificado que conozca técnicas especiales y que debe tener a su disposición el equipo adicional necesario.

Texto del discurso grabado

A pesar de su aparente sencillez, esta tarea tiene sus inconvenientes. Para recibir un mensaje de texto, debe escuchar la grabación de sonido y al mismo tiempo grabar el texto en papel. Dado que normalmente es imposible escribir o teclear texto al ritmo de hablar, a menudo hay que detener la reproducción de la grabación y rebobinar la cinta para volver a escucharla. Si la creación de textos se lleva a cabo esporádicamente, entonces solo necesitará una grabadora común y un bolígrafo con una hoja de papel o una máquina de escribir. Pero si dicho trabajo se realiza con frecuencia y en grandes volúmenes, requiere urgencia o, en general, es una rutina diaria, entonces es apropiado utilizar equipo especial.

Está claro que la solución óptima sería utilizar un dispositivo puramente automático capaz de reconocer la voz y escribir texto de forma independiente. Los autores de este artículo son partidarios y desarrolladores de este tipo de herramientas desde hace mucho tiempo. Sin embargo, hoy en día no existe ningún equipo a la venta que tenga características aceptables (en el mejor de los casos, requiere una sintonización prolongada para un hablante específico) y, aparentemente, es imposible contar con el reconocimiento automático de un habla ruidosa arbitraria en este siglo.

¿Qué es una grabadora-transcriptora?

Desde hace mucho tiempo, para obtener textos de grabaciones sonoras, se utiliza una grabadora-transcriptora especial, controlada por un pedal con un interruptor electrónico “Stop”/“Play”/“0tcat” (Philips, Grundig, Sanyo) . Trabajar con una grabadora transcriptora es más conveniente y productivo que con equipos de reproducción de sonido convencionales. Sin embargo, cabe señalar las graves deficiencias de los transcriptores. Estos incluyen un rebobinado mecánico bastante lento, una vida útil corta (los cambios mecánicos constantes pronto conducen a fallas), el estiramiento de la cinta (esto se vuelve inaceptable si este casete es la única evidencia material), una baja calidad de sonido y la necesidad de escuchar repetidamente fragmentos clave. La conciliación lleva mucho tiempo, es decir, comparar el fonograma y el texto después de la impresión (en casos críticos, este es un procedimiento obligatorio). Además, al imprimir el texto de las grabaciones en tiempo real (por ejemplo, cuando las negociaciones aún están en curso, pero ya se requiere el texto de las declaraciones en su etapa inicial), surge un problema grave con el cambio repetido de casetes en las grabadoras y su Entrega urgente al mecanógrafo. Finalmente, para borrar la grabación de ruido e interferencias, es necesario conectar dispositivos adicionales.

Capacidades del transcriptor informático

Los transcriptores informáticos modernos (por ejemplo, Caesar-16) no tienen las desventajas anteriores. Normalmente, un transcriptor de computadora es una placa que se inserta en una computadora personal o una pequeña unidad conectada al puerto de impresora de la PC.

Antes del trabajo, se conecta una grabadora de voz a la entrada del transcriptor y unos auriculares a una de las salidas. El operador inserta un casete con el texto dictado en la grabadora de voz conectada, enciende el programa transcriptor e imprime el texto de la grabación de audio, escuchando los fragmentos necesarios en un modo conveniente. En este caso, la grabación de sonido del casete se ingresa simultáneamente en la memoria de la computadora.

El programa transcriptor proporciona la combinación óptima de las propiedades de un editor de texto moderno (para escribir rápidamente) y las funciones de una grabadora digital (esto garantiza una escucha de audio de calidad). Además, algunas funciones completamente nuevas están disponibles sólo para transcriptores digitales. Por lo tanto, utilizando las teclas «rápidas», puede controlar («Detener», «Retroceder», «Rebobinar, reproducir» instantáneo) y establecer marcadores en el texto (para marcar un fragmento al que debe volver para escucharlo más a fondo). . Durante la operación, la pantalla muestra contadores de tiempo para la reproducción y grabación de audio en la PC. Todo el sistema de menús y teclas de acceso rápido te permite organizar tu trabajo de la forma más cómoda.

Dado que durante el funcionamiento la grabación de sonido del casete se convierte a formato digital y se transfiere continuamente al disco duro del PC, para una calidad de sonido óptima (banda de frecuencia de hasta 4,5 kHz, rango dinámico superior a 70 dB), el disco duro del PC requiere 36 MB de espacio libre en discursos cada media hora. La práctica muestra que el uso de cualquier método para comprimir el flujo de información del habla por parte de un transcriptor es inapropiado, ya que esto inevitablemente deteriora la calidad del sonido y cansa al operador.

El «punto culminante» del software del producto es la provisión de un modo dúplex, es decir, un modo de grabación continua de sonido en el disco duro de la PC mientras se reproduce simultáneamente sonido desde el mismo disco, pero desde cualquier ubicación seleccionada arbitrariamente de este o de cualquier otro. grabación de audio digital ingresada previamente. El modo dúplex le permite comenzar inmediatamente a procesar grabaciones de audio sin esperar a que se complete la entrada a la PC.

La ventaja de una transcriptora de computadora es que el casete se reescribe solo una vez y las grabaciones de sonido importantes, como la propia grabadora, no se desgastan con numerosos encendidos, apagados y rebobinados. Al mismo tiempo, las partes difíciles de entender de una grabación de sonido se pueden imprimir correctamente gracias a la escucha repetida en un «anillo» con una reproducción lenta de la grabación sin distorsión del timbre del sonido.

Además, los últimos modelos de transcriptores digitales tienen otra característica extremadamente útil: asocian automáticamente el texto escrito con la secuencia de audio correspondiente. Esto brinda una oportunidad única para verificar rápidamente impresiones de texto y grabaciones de sonido originales, lo cual es necesario al documentar materiales críticos. Todas las cuestiones controvertidas se pueden resolver fácilmente, ya que para cualquier fragmento de texto se llama automáticamente el fragmento de sonido correspondiente y el texto se encuentra inmediatamente para la sección seleccionada de la grabación de sonido.

El uso de transcriptores digitales permite no solo reducir el tiempo de preparación de documentos y reducir la probabilidad de errores, sino también aumentar la eficiencia general y la comodidad del trabajo profesional. Han sido sometidos a pruebas prácticas exhaustivas y han demostrado su eficacia en los trámites operativos en los aparatos de las fuerzas del orden y la fiscalía, en bancos, hospitales y otras organizaciones.

Transcriptores con reducción de ruido

Los transcriptores informáticos con hardware de reducción de ruido incorporado brindan beneficios adicionales al usuario. Por ejemplo, en el producto Caesar16Sh, los procesadores de señal especiales están ubicados directamente en la placa de entrada/salida de voz, lo que le permite eliminar automáticamente las interferencias. El control de dicha reducción de ruido es bastante simple y accesible para un mecanógrafo común y corriente. A pesar de que estos transcriptores no tienen todas las capacidades de las estaciones de trabajo especializadas para reducir el ruido, son suficientes y extremadamente útiles en muchas situaciones. Cabe señalar que en términos de sus cualidades de «eliminación de ruido», estos transcriptores son superiores a productos nacionales como AF-512, KORS, PAKORS, Zolushka-Mono y el DAC-256 extranjero.

Transcripción de grabaciones de lengua hablada de baja calidad

El procedimiento para mejorar la calidad de una señal de grabación de voz tiene dos objetivos. En primer lugar, ayudar al operador a establecer el contenido textual exacto de la grabación sonora original. En segundo lugar, eliminar el ruido y la distorsión para que los oyentes no capacitados (por ejemplo, detectives y guardias de seguridad, gerentes, jueces, audiencias públicas) puedan comprender satisfactoriamente el contenido del fonograma. Para solucionar estos problemas se utilizan diferentes métodos y medios.

Cuando trabaja con voz grabada, el operador intenta extraer la mayor cantidad de información útil posible, fuerza su atención y está dispuesto a dedicar un tiempo relativamente largo a sintonizar un sonido inusual o incluso desagradable; El operador puede soportar fuertes cargas de ruido y escuchar el mismo material repetidamente en diferentes modos. Por lo tanto, la limpieza del ruido aquí no tiene como objetivo eliminar el ruido como tal, sino ayudar al operador a maximizar el uso de sus funciones auditivas, es decir, «desenmascarar» la señal útil en el ruido. Por ejemplo, si el ruido se nota, pero no interfiere con la comprensión del habla, no siempre es aconsejable eliminarlo, ya que esto puede dañar la señal útil. Al mismo tiempo, para los operadores que escuchan constantemente grabaciones ruidosas durante mucho tiempo, la reducción de ruido es deseable, ya que cuanto mayor sea la calidad de la grabación, menos cansado estará el operador y más tiempo podrá trabajar de manera efectiva.

Pero desde el punto de vista del cliente aficionado, que utiliza el fonograma de manera diferente que el operador, la grabación de sonido «limpia» debe contener un mínimo de ruido en las pausas del habla y un timbre lo más cercano posible al natural, a veces incluso en detrimento de la inteligibilidad.

Cómo utilizar las propiedades de la audición

Para trabajar con éxito con la grabación de sonido, se deben aprovechar las ventajas y tener en cuenta las desventajas del oído humano. Por tanto, notamos sus propiedades específicas: sensibilidad y selectividad, enmascaramiento, adaptación, fatiga, individualidad, organización asociativa de la memoria del habla. Ahora podemos considerar cómo se tiene en cuenta cada propiedad al procesar grabaciones de sonido de baja calidad.

Por ejemplo, al optimizar y nivelar el volumen del sonido de todas las señales al mismo nivel, es necesario tener en cuenta que la capacidad del oído para detectar señales en el fondo circundante y distinguir sus pequeños cambios depende de forma no lineal del volumen y la frecuencia de la señal. Así, para un habla tranquila, el nivel de detectabilidad de una señal a una frecuencia de 100 Hz puede ser 40 dB mayor que el nivel de detectabilidad para 2000 Hz, y para un sonido fuerte la frecuencia es prácticamente insignificante. Por lo tanto, se recomiendan dos opciones de escucha típicas, que le permitirán escuchar el máximo posible en la mayoría de situaciones. La primera opción es 80-90 (±6) dB al nivelar la amplitud promedio de todos los componentes espectrales de la señal grabada. El segundo es 40 dB cuando se eleva el espectro de amplitud promedio ecualizado en 25 dB para 100 Hz y en 8 dB para 5000 Hz con respecto a 2000 Hz.

Dado que el habla se autoenmascara (por ejemplo, después de sonidos fuertes, los silenciosos no se perciben durante algún tiempo), debe recordarse que el operador se cansa menos cuando escucha la grabación a un nivel de volumen constantemente bajo. El enmascaramiento auditivo de algunos componentes de una señal de audio por otros conduce al hecho de que los componentes de frecuencia más débiles no se escuchan cerca de picos espectrales fuertes. Por lo tanto, para mejorar la inteligibilidad, uno debe esforzarse por eliminar los pulsos de ruido de la señal, ecualizar la amplitud y suavizar el espectro. Además, a veces es importante hacer esto incluso en las áreas sonoras de palabras individuales, ya que bajo ciertas condiciones los sonidos individuales de una palabra pueden enmascarar a sus “vecinos”.

También hay que tener en cuenta que la «escucha» dirigida aumenta la capacidad de aislar una señal de voz distorsionada del fondo. Al mismo tiempo, los operadores experimentados que «promueven» los fonogramas desarrollan estereotipos auditivos ya preparados para reconocer eficazmente señales útiles en ruido de tipo habitual. Esto se debe a la adaptación de la audición, que conduce a un ajuste a corto plazo (fracciones de segundo) y a largo plazo (minutos) de los parámetros del sistema auditivo a las características de la señal auditiva. Sin embargo, hay que tener en cuenta que la adaptación a corto plazo de la audición a veces conduce a un cambio indeseable en los umbrales de percepción en las uniones de palabras poco inteligibles. Por lo tanto, es útil escuchar estas frases en partes, cambiando gradualmente el límite del «corte» de la señal en fragmentos del habla.

La duración media de una sección de un fonograma ruidoso descifrada por el operador se da en la siguiente tabla:

Dificultad durante 1 hora durante tiempo completo. día
bajo 4-10 min 25-60 min
promedio 30-50 seg 3-6 min
alto 5-10 seg 20-50 segundos

No debemos olvidar que después de escuchar sonidos fuertes durante mucho tiempo, la capacidad del oído para distinguir pequeños cambios de sonido disminuye y se recupera con bastante lentitud (de 2 minutos a un día). Por lo tanto, el operador debe evitar la sobrecarga auditiva y trabajar con un habla ruidosa «pesada» durante 20 a 40 minutos con los mismos descansos, pero no más de 4 a 6 horas por día.

Dado que el sistema auditivo humano está diseñado para procesar una señal estéreo, una cierta ganancia en el reconocimiento de grabaciones complejas proviene de una cierta «diversidad» de las propiedades de la señal suministrada para escuchar a cada oído por separado. Esto permite un procesamiento más especializado de cada señal de audio. Esta oportunidad la brinda el modo “pseudoestéreo”, que introduce algún cambio en el dominio espectral o temporal en una señal de audio mono en relación con otra.

También es de considerable importancia la capacidad de la memoria humana para asociar automáticamente combinaciones de sonidos oídos con palabras conocidas. Si la señal es ininteligible, buscar inconscientemente entre todas las posibles palabras candidatas puede llevar un tiempo inaceptablemente largo. Por lo tanto, el operador debe conocer el contenido del texto y tener información adicional para reducir el rango de palabras probables para un mejor reconocimiento de la grabación.

En general, la sensibilidad y la capacidad del oído para reconocer el habla en medio del ruido (especialmente en frecuencias altas) varía de persona a persona y, por regla general, disminuye con la edad. Por lo tanto, los operadores mayores y experimentados deben poder ecualizar las características de frecuencia de la ruta de escucha. Pero para descifrar una banda sonora ruidosa, se prefieren operadores menores de 35 años con alta sensibilidad auditiva y una psique flexible.

¿Cómo descifrar una grabación de sonido inaudible?

Proponemos considerar dos opciones para trabajar con un fonograma poco inteligible. La primera es una solución a la tarea relativamente simple de decodificar texto y reducir el ruido de un. señal de complejidad baja/media-baja (inteligibilidad inicial 70 -80% palabras). El segundo es la limpieza de ruido de grabaciones de sonido “pesadas” con inteligibilidad inicial nula.

Reducción de ruido en situaciones relativamente simples

Realizado por un operador con educación técnica y experiencia trabajando con equipos de audio. Para realizar el trabajo, se requiere el siguiente equipo: una grabadora de alta calidad, auriculares, un amplificador de potencia con parlantes (clase más alta), una computadora personal para preparar transcripciones de texto y una transcripción de computadora (preferiblemente con un filtro adaptativo incorporado). ), un ecualizador gráfico (con al menos 16 bandas en el rango de 100 -6000 Hz con un rango de ajuste dinámico de al menos 30 dB, una relación señal-ruido en el canal de extremo a extremo de al menos 70 dB y un analizador de espectro de corriente correspondiente), un filtro adaptativo con un número de coeficientes para una banda de señal de hasta 4000 Hz de al menos 500. Lo óptimo es el uso de una estación de trabajo basada en una PC con una placa aceleradora de computación.

Método para resolver el problema de reducción de ruido en situaciones relativamente simples

Determine el espectro promedio de la señal de grabación de sonido utilizando un analizador de espectro (para todo el casete que se está procesando o para su sección inicial de 1 a 2 minutos).

Corta el espectro de la señal desde arriba y desde abajo (normalmente hasta el rango de 2003900 Hz). Nivele el espectro dentro de este rango usando un ecualizador hasta lograr la apariencia más plana posible, luego seleccione de oído la posición de sonido óptima de los controles deslizantes del ecualizador en la sección inicial de la grabación de sonido.

Establezca el nivel de volumen óptimo utilizando un amplificador.

Aplique una señal al filtro adaptativo, seleccione de oído la mejor posición de ajuste (velocidad de adaptación, retardo, umbral de inicio de adaptación).

Aplique la señal de la grabadora a través del circuito instalado (amplificador, ecualizador, filtro adaptativo) a la entrada del transcriptor de la computadora (es conveniente utilizar el filtro adaptativo ubicado en la placa del transcriptor). Lleve audio a la PC colocándolo en el disco duro usando una frecuencia de muestreo de 10,000 Hz y una representación digital de 16 bits de la señal sin ningún tipo de compresión.

Imprime el texto de la grabación de audio en el programa transcriptor. Las secciones del habla difícilmente inteligibles se pueden escuchar repetidamente en un «anillo» ajustando el volumen de la pronunciación y la velocidad de reproducción del sonido. El anillo debe “deslizarse” según la señal con una duración ajustable dentro del rango de al menos 0,5 a 15 segundos.

Al final de la obra, se coteja el texto con la banda sonora y se realiza la grabación final del sonido limpio en una grabadora.

Reducción de ruido en situaciones difíciles

Realizado por un ingeniero operador de reducción de ruido con educación técnica, experiencia trabajando con equipos de audio y conocimiento de los conceptos básicos de análisis espectral, filtrado de señales y fisiología auditiva. También es deseable una alta sensibilidad auditiva individual.

El trabajo más eficaz es en parejas: ingeniero + operador-“oyente” (no mayor de 35 años, con psique estable y experiencia suficiente). Tengamos en cuenta que, por regla general, las mujeres afrontan mejor que los hombres recibir textos de grabaciones sonoras como un deber permanente.

Para realizar el trabajo, se requiere el siguiente equipo: una grabadora de alta calidad con capacidad de ajustarse a las características de la cinta, auriculares de alta calidad (2-3 pares), un amplificador de potencia con parlantes (clase más alta), una estación de trabajo de reducción de ruido basada en PC (al menos 486DX2-66, VLB/PCI, 8 MB de RAM, HDD 540 MB) con un acelerador de cálculo adicional para procesar señales en tiempo real, un filtro adaptativo externo autónomo para el número de coeficientes en una banda de hasta 4000 Hz de al menos 2000, brindando la capacidad de configurar la velocidad, algoritmo, modos de adaptación, retardo, modos de escucha (pseudoestéreo, predicción, filtrado). El software de la estación de trabajo debe incluir un potente editor de señal, programas para convertir una señal en el tiempo, eliminar el ruido impulsivo, un ecualizador de software en tiempo real con al menos 500 bandas, un programa para eliminar la interferencia de banda ancha, un transcriptor de computadora con un filtro adaptativo, programas para análisis de señales energéticas, espectrales y de autocorrelación. Por supuesto, en algunos casos puede resultar útil hardware y software adicional, pero para resolver la mayoría de los problemas prácticos lo anterior es suficiente.

Método de trabajo con un fonograma complejo (por ejemplo, con inteligibilidad inicial cero)

La grabación de audio compleja puede requerir que el operador adopte un enfoque diferente para procesar señales individuales. Este tipo de trabajo se puede realizar cómodamente utilizando herramientas informáticas. Por lo tanto, primero, toda la grabación de sonido se introduce en el disco duro del PC y se almacena allí en forma de archivo de datos, que luego es procesado por varios programas (al introducir una banda sonora en un PC, la representación digital suele ser de 16 bits, la frecuencia de muestreo es 10.000 o 16.000 Hz).

Luego, el texto se imprime en un programa transcriptor. Dado que se utiliza una u otra técnica para lograr la inteligibilidad, es conveniente cambiar entre diferentes programas de procesamiento de señales en el entorno Windows en modo multitarea.

Se pueden realizar más acciones en toda la grabación de sonido, pero si las características del sonido varían mucho de una sección a otra, los ajustes de procesamiento de sonido se seleccionan por separado para cada sección homogénea.

Es necesario optimizar el volumen del sonido. Para nivelar el volumen de réplicas de fonogramas individuales, se utilizan normalización manual y transformaciones no lineales de amplitud. La señal se escucha a diferentes volúmenes con una respuesta de frecuencia que cambia constantemente; para esto, se «preparan» filtros estándar en un ecualizador de computadora para llevar el espectro de sonido de una grabación de sonido determinada a la forma requerida, que se utilizan durante la escucha. La rápida transición de un tipo de conversión de señal espectral a otro se produce en tiempo real gracias al uso de un acelerador de cálculo adicional como parte de la estación de trabajo de reducción de ruido.

Lleva la señal a una forma óptima en tiempo y representación espectral y elimina el ruido aditivo, «desenmascara» la señal útil. En este caso, la señal se procesa directamente en la representación temporal, se eliminan los ruidos impulsivos (clics) y las grandes diferencias en la amplitud de la señal (pasos). Además, las características espectrales de la señal se procesan mediante un analizador de espectro y un ecualizador multibanda: — la banda de frecuencia superior e inferior está limitada (normalmente a 200-3900 Hz o 100-6300 Hz — el espectro se suaviza); (picos espectrales y cambios bruscos de más de 6 dB dentro de cada media octava — se ecualiza el rango dinámico del espectro promedio (no más de 10 dB dentro de una octava), distorsiones en la respuesta de frecuencia de la señal en el sonido); canal de grabación se compensan.

También es muy eficaz el modo de filtrado inverso automático, que se instala dentro del complejo ICAR o en un procesador de audio ultramoderno y extremadamente caro de Digital Audio Corp.

Con el filtrado adaptativo, puede eliminar las interferencias estacionarias de banda estrecha y las que varían lentamente en el tiempo (interferencias de red y telefónicas, pitidos, interferencias de tráfico, ruido de máquinas, música suave). El número de coeficientes de filtro adaptativo es de 400 a 4000, según el tipo de interferencia. El uso de un filtro autónomo externo también está completamente justificado.

Las interferencias estacionarias y que cambian lentamente de banda ancha se eliminan mediante resta de frecuencia. Por último, se elimina o reduce el ruido en las pausas.

Naturalmente, en cada situación concreta con la señal sólo se realizan las operaciones necesarias y el usuario se ve obligado a centrarse en los medios técnicos realmente disponibles. Entre ellos podemos destacar la estación de trabajo del experto «IKAR» y el único dispositivo autónomo del mercado: el filtro adaptativo digital de nueva generación «Cinderella-31» (con un número de coeficientes de filtrado de hasta 5600, así como un conjunto de servicios diversos, verdaderamente necesarios y útiles).

También cabe señalar que los sistemas diseñados para limpiar grabaciones de audio musical y preparar discos y casetes maestros (por ejemplo, «NoNoise» de Sonic Solutions) son costosos y para limpiar el ruido de grabaciones de sonido operativas son ineficaces, ya que permiten grabaciones «muy buenas». por hacer ”, pero fundamentalmente no están diseñados para soportar fuertes interferencias y distorsiones.

Reducción de ruido estéreo

Es necesario mencionar un método alternativo para obtener fonogramas autorizados, que se basa en el uso de grabaciones sonoras de dos o más fuentes sonoras. Por ejemplo, podría ser una grabación estéreo, en la que una señal mezclada con ruido se graba en un canal mono y el mismo ruido se graba en otro canal mono. O podría ser una grabación estéreo de una señal de dos micrófonos, que están ubicados de manera diferente en relación con las fuentes de la señal y la interferencia deseadas.

Por lo tanto, con la ayuda de algunos sistemas (por ejemplo, «Zolushka-S» y «Zolushka31»), puede construir automáticamente un filtro óptimo que elimine la interferencia de una grabación de sonido (se suministran dos señales a las entradas: una señal útil mezclada con interferencia en la entrada principal y una señal de interferencia en la segunda entrada de referencia). Por ejemplo, esto se puede utilizar para grabar una conversación tranquila en una habitación donde se reproduce una transmisión de radio o televisión a todo volumen. En este caso, el sonido se graba en una pista de la grabadora desde un micrófono ubicado en la habitación y que transmite una mezcla de señal útil e interferencia, y en otra pista de la misma grabadora se graba una señal directamente desde la fuente de interferencia (desde el punto de transmisión de radio o salida de sonido del televisor), o una señal de un segundo micrófono destinado a grabar el sonido de la interferencia. Luego, a partir de dicha grabación de sonido estéreo, utilizando un filtro estéreo adaptativo, se obtiene una señal inteligible para cualquier tipo de interferencia, y esto es posible incluso cuando casi no se escucha nada de voz en la grabación de sonido original.

Es interesante observar que cuanto más fuerte “suena la música” y menos miedo tienen las personas que hablan de escuchar, mejor se elimina la interferencia de la señal ruidosa.

El filtrado estéreo adaptativo mejora la inteligibilidad y la calidad de la grabación de sonido cuando se utiliza un par estéreo de micrófonos convencionales o direccionales. Sin embargo, en este caso, se requiere cierta experiencia en el uso de micrófonos en un entorno de grabación específico, y es deseable que un micrófono reciba la señal de voz deseada y el sonido de la interferencia, y el otro, básicamente, solo el sonido de la misma interferencia. . Cuanto mejor se siga esta regla, mayor será el resultado de la reducción del ruido estéreo.

    Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
    Принять