Protección acústica de negociaciones confidenciales.>p>
En la era de la información, cuando se aplica el principio: quien posee la información, es dueño del mundo.
Hay gente más que suficiente que quieren dominar el mundo de esta manera, y esto significa que hay una demanda constante de información obtenida a través de medios no autorizados.
En tal situación, el dolor de cabeza del propietario de la información — esta es su protección confiable.
En otras palabras, en el campo de la información hay una lucha eterna entre el proyectil y la armadura, el lado atacante y el lado defensor.
La información cuyo portador es una señal de voz o información de voz recibe una atención digna del lado atacante.
En el caso general, la información de voz es un conjunto que consta de información semántica, personal, de comportamiento, etc.
Como regla general, el mayor interés es la información semántica, cuya pérdida puede evaluarse indirectamente por la pérdida de inteligibilidad del habla. En el futuro, por información del habla entenderemos sólo información semántica.
Existen bastantes métodos para proteger la información del habla y los medios técnicos que implementan estos métodos y se mejoran constantemente, porque A medida que se desarrolla el pensamiento científico y técnico, el lado atacante dispone de medios técnicos cada vez más sofisticados que permiten no sólo mejorar las características cuantitativas de los canales técnicos conocidos de fuga de información, sino también crear nuevos canales.
Se puede organizar el número máximo de canales técnicos para la fuga de información para interceptar la información acústica del habla, por ejemplo, durante reuniones confidenciales o negociaciones.
La protección más eficaz en este caso
es la protección acústica de la sala en la que se llevan a cabo negociaciones confidenciales y, en el mejor de los casos, protección acústica de la señal acústica del habla.
Este artículo está dedicado a los problemas que surgen a la hora de organizar dicha protección y sus soluciones técnicas.
MÉTODOS DE PROTECCIÓN.
Términos, definiciones, breve descripción.
La protección acústica de una señal acústica del habla (voz) significa aquí un enmascaramiento confiable del habla mediante una señal de enmascaramiento acústico (ruido) que opera en la banda de frecuencia del habla y tiene una transmisión «suave». característica espectral.
Se consigue un enmascaramiento fiable cuando la mezcla acústica aditiva resultante de habla y ruido, o habla ruidosa, en cualquier punto del volumen controlado tiene una inteligibilidad verbal de no más del 20% (en la práctica, esto corresponde a la percepción de exclamaciones individuales y «palabras familiares»
Al mismo tiempo, los negociadores deben contar con las condiciones acústicas más cómodas posibles en las circunstancias dadas.
Cabe señalar que el concepto de «comodidad» En relación con la percepción de la información del habla, aún no existe una interpretación inequívoca entre los especialistas, y mucho menos se ha desarrollado una escala de calificación de comodidad.
Tradicionalmente asociamos la comodidad con la reacción de una persona a condiciones no naturales como la fatiga, que en teoría se puede evaluar.
Pero hasta la fecha, debido a la gran cantidad de investigación necesaria, se han encontrado correlaciones entre los tipos y la profundidad de las distorsiones. aún no se ha determinado la señal del habla y el grado de fatiga.
Por lo tanto, al evaluar la comodidad, utilizaremos exclusivamente evaluaciones intuitivas de alta calidad, confiando en el sentido común.
Existen varios tipos de equipos de protección acústica del habla, que se pueden dividir en dos grupos: equipos para la protección acústica de locales y equipos para la protección acústica del habla en sí.
El equipo perteneciente al primer grupo es un productor de barrera interferencia acústica a lo largo de las estructuras de cerramiento y, por regla general, se utiliza junto con equipos de protección contra vibraciones.
En este caso, se crean unas condiciones acústicas relativamente cómodas para el personal, pero no se protege acústicamente todo el volumen de la sala con todas las consecuencias consiguientes.
El segundo grupo de equipos incluye generadores de ruido acústico, que son situados cerca del lugar de las negociaciones y su ruido enmascara el discurso de los negociadores.
Al mismo tiempo, los negociadores no están protegidos de los efectos del ruido acústico. La comodidad y el nivel de camuflaje en este caso dejan mucho que desear.
Un mayor nivel de camuflaje y comodidad se distingue por los equipos que, además de un generador de ruido acústico, utilizan auriculares de intercomunicación diseñados para funcionar con ruido fuerte.
Este tipo incluye el equipo TF-011D, que utiliza teléfonos -auriculares con micrófono y OKP-6 con auriculares de teléfono-laringófono.
Al utilizar estos dispositivos, el oído de los negociadores queda protegido del ruido acústico mediante las almohadillas de los auriculares, a través de las cuales se presenta a los negociadores el discurso de sus socios. El discurso de los negociadores se percibe mediante un micrófono ubicado cerca de la boca del orador, o un laringófono desde la garganta del orador.
La confiabilidad del enmascaramiento del habla es alta, especialmente para OKP-6, pero la necesidad de usar Es posible que los auriculares no siempre sean convenientes para los usuarios.
Para mantener una alta confiabilidad del enmascaramiento del habla, mientras se deshacen de los auriculares y se reemplazan por otros, esta es la tarea que realizan los empleados de «Seguridad Empresarial&#; 187; y lo solucioné.
SOLUCIÓN DEL PROBLEMA
Al resolver este problema, los desarrolladores encontraron el siguiente problema.
Se sabe que durante una conversación telefónica, el nivel de voz promedio en la membrana del micrófono del teléfono es de 97,5 dB en la banda de frecuencia 100-10000 Hz. .
El micrófono del auricular está ubicado aproximadamente a la misma distancia de la boca del hablante que el micrófono del auricular y, en consecuencia, el nivel de voz en el micrófono del auricular será aproximadamente el mismo.
Con el enmascaramiento acústico del habla se puede crear, por un lado, un enmascaramiento fiable y, por otro, — Para un nivel aceptable de comodidad (calidad satisfactoria de la transmisión de la voz, consulte la Tabla 1), es necesario crear un campo de ruido alrededor de los altavoces con un nivel de 86 dB.
En este caso, la transmisión de voz a La relación de ruido en el micrófono del auricular es de +10 a +12 dB.
Tabla 1.
Calidad de voz |
W,% |
S,% |
A,% |
Bsh, dB |
Habla/ruido, dB |
ideal |
100-99 |
||||
excelente |
99-98 |
||||
bueno |
98-93 (95) |
58 |
35 |
81 |
+16 |
satisfactorio |
93-87 (90) |
47 |
25 |
86 |
+11 |
máximo permitido |
87-77 (82) |
33 |
18 |
92 |
+5 |
fallo de conexión |
77-60 (68) |
18 |
12 |
97 |
+0 |
camuflaje confiable |
15 |
4 |
5 |
104 |
-17 |
Explicaciones para la Tabla N1. La tabla contiene los resultados obtenidos según los datos de Sapozhkov M.A. y Pokrovsky N.B. para nivel de voz 97,5 dB y «blanco» ruido.
Aquí: W — inteligibilidad verbal (los valores medios del rango presentado se colocan entre paréntesis); S— inteligibilidad silábica; A— inteligibilidad de formantes; Bsh — nivel «blanco» ruido.
A una distancia de 1,2-1,5 m, el nivel de la señal del habla disminuye a 72-78 dB (las mediciones se realizaron en una frase de prueba tradicional en habitaciones de 600 metros cúbicos y 50 metros cúbicos ).
Si el nivel de ruido se mantiene en 86 dB en todo el volumen de la habitación protegida dentro de un radio de aproximadamente 1,3 m desde la boca del hablante, la relación habla-ruido ya será en promedio -10 dB y se deteriorará aún más con la distancia. .
Con base en los datos de la Tabla 1, podemos concluir que a una distancia de la boca del hablante de más de 1 m, el habla tiene una calidad por debajo del nivel de «fallo de comunicación», y a una distancia de más de 2 m, se garantizará un camuflaje fiable.
Aquí es necesario hacer algunas explicaciones y aclaraciones a lo dicho.
1. Calidad de voz «fallo de conexión» Se caracteriza por una completa ilegibilidad del texto principal y, según diversas fuentes, corresponde a valores W en el rango del 77% al 60%, y en algunas publicaciones el límite inferior del rango es el 50% de las palabras.
2. Los datos dados en la Tabla 1 corresponden a un nivel de voz de 97,5 dB y utilizar estos datos para otros niveles no es del todo correcto, pero a efectos ilustrativos es bastante aceptable.
Del razonamiento anterior se desprende claramente que la distancia entre el micrófono y la boca del hablante, es decir el rechazo de un auricular conduce a una disminución de la inteligibilidad del habla, hasta una interrupción de la comunicación a distancias de más de un metro de la fuente del habla.
En otras palabras, colocar un micrófono lejos de la boca del hablante simula la situación con un micrófono que escucha a escondidas.
Y esto es a lo que apunta el camuflaje acústico. Para ello, «blanco» ruido.
El hecho es que no existen algoritmos ni implementaciones de hardware y software que realmente puedan mejorar la inteligibilidad del habla contaminada con ruido blanco. ruido con una relación habla-ruido negativa.
El algoritmo McCooley y otras modificaciones del algoritmo de sustracción espectral destinadas a combatir el ruido «blanco». ruido, mejoran la comodidad auditiva, pero no la inteligibilidad del habla para lograr relaciones positivas entre voz y ruido.
Por lo tanto, el habla ruidosa interceptada por medios de monitoreo acústico no se puede limpiar de ruido.
Si se cumplen determinadas condiciones, es posible compensar con un alto grado de supresión cualquier ruido estacionario, incluido el ruido «blanco». ruido.
Dicha compensación se puede realizar utilizando un filtro adaptativo digital de dos canales (en el artículo «Equipo de filtrado adaptativo», «Confident», N1-2, 1999, el autor considera tal oportunidad).
En relación con el problema considerado, en el equipo desarrollado se utilizó un filtro adaptativo de dos canales (DAF) para la protección acústica de conversaciones confidenciales — «Sistema Digital de Negociaciones Confidenciales» (CNDS).
PRINCIPIO DE FUNCIONAMIENTO DE LOS EQUIPOS DE PROTECCIÓN PARA NEGOCIACIONES CONFIDENCIALES (CNDS)
El principio básico es que el ruido de enmascaramiento generado n llega no sólo al emisor electroacústico , sino también a la entrada de referencia del DAF (el diagrama de bloques del CNDS se muestra en la Fig. 1).
La segunda entrada principal del DAF recibe la señal x de la salida del micrófono receptor, que actúa como un micrófono de diadema.
Esta señal es una mezcla aditiva del discurso de los negociadores y el ruido. n1, que es ruido n, pero ha sufrido cambios al convertirse en señal acústica y debido a la acústica de la sala donde se llevan a cabo las negociaciones.
Fig. 1
Si estos cambios son lineales (el amplificador de potencia y el emisor no limitan la señal de ruido), entonces n y n1 están correlacionados.
La relación voz-ruido en esta mezcla es peor cuanto más lejos está el micrófono receptor. proviene de la boca del orador.
Por cierto, observamos que en este esquema solo se usa un micrófono para todos los participantes en las negociaciones, es decir, abandonamos los auriculares.
Uso la señal del canal de referencia, de acuerdo con el algoritmo adaptativo, en DAF se compensa el componente de ruido en la mezcla
habla y ruido, y así se presenta la voz purificada a los negociadores a través de auriculares.
La convergencia del algoritmo se lleva a cabo utilizando el método de descenso más pronunciado y, para simplificar los cálculos, se utiliza la aproximación estocástica de Widrow- Se utiliza gradiente de Hopf.
Para acelerar la convergencia, el módulo mínimo del error de filtro se utiliza como criterio de optimización.
IMPLEMENTACIÓN DEL CNDS.
Descripción del algoritmo, algunas características operativas, resultados de las pruebas.
La base del equipo CNDS es un procesador digital especializado que implementa las funciones de un generador, un filtro adaptativo digital de dos canales (CDAF) y control. funciones.
Se proporciona compensación para el componente de ruido en una mezcla de voz con ruido, CDAF.
El algoritmo para el funcionamiento de CDAF se puede representar mediante las siguientes expresiones:
p>
dónde:
x(j) — siguiente muestra de la señal principal;
n(j — siguiente muestra de la señal de referencia;
y(j) — siguiente muestra de la estimación de ruido;
s(j) — siguiente muestra de la señal de salida (señal de error);
v(j,i) — ;
m & #8212; coeficiente que determina la velocidad de adaptación;
p — número de coeficientes de ponderación del filtro;
r— retardo de la señal acústica;
j — valor de tiempo discreto, j= 1,2,3,…;
i — número de coeficiente de ponderación del filtro, i= 1,2,3,…,p;
sgn[.] — señal de señal [.].
La voz limpia (señal de error de filtro), de acuerdo con (1), se define como la diferencia entre la señal del canal principal y el valor de ruido previsto (estimación de ruido), que se calcula como la convolución de la señal del canal de referencia (ruido). con los coeficientes de ponderación del filtro transversal de acuerdo con (2).
La respuesta al impulso de este filtro (o el vector de coeficientes de ponderación de dimensión p) se actualiza en cada instante de tiempo discreto j de acuerdo con (3).
La adaptación (ajuste automático) del vector de peso se realiza a una determinada velocidad (velocidad de adaptación) hasta que se produce el mínimo de la expresión (1), es decir casi hasta la completa supresión del ruido de enmascaramiento en la señal que llega a los auriculares.
Así, durante el período de tiempo en que se produce la adaptación (tiempo de adaptación), se escuchará en los auriculares un ruido de enmascaramiento, que disminuirá de nivel, y el discurso de los negociadores aparecerá en su contexto.
En el futuro, en ausencia de cambios en la situación acústica de la habitación, los valores de los coeficientes de ponderación se estabilizarán y comenzará el proceso de seguimiento, que se caracteriza por la presencia de un signo variable del gradiente (el segundo término en (3 )) y su valor absoluto mínimo.
Durante este período de tiempo, los auriculares contendrán líquido casi «puro». discurso. Cuando la situación acústica cambia, por ejemplo, los negociadores comienzan a hacer gestos bruscos, el CDAF volverá a entrar en modo de adaptación y se volverá a escuchar ruido en los auriculares.
Para reducir la influencia de este efecto, la velocidad de adaptación, que está regulada por el coeficiente m, se selecciona como máxima (está limitada desde arriba por la condición de convergencia del algoritmo).
Por supuesto, con gestos intensos de todos los negociadores, maximizar la velocidad de adaptación no conducirá al efecto deseado y obligará a los negociadores a calmarse. Este — no es una restricción útil planificada.
Las restricciones (protecciones) planificadas que excluyen la posibilidad de que surjan situaciones que permitan la interceptación de información de voz que no esté adecuadamente enmascarada incluyen las siguientes.
- Protección contra la reducción no autorizada del ruido acústico.
Esta protección se implementa de la siguiente manera. El dispositivo con un micrófono incorporado se encuentra a una distancia de 1 a 1,5 metros de los parlantes (en el medio entre ellos).
A la izquierda y a la derecha de los parlantes, a cierta distancia, hay son dos altavoces que emiten un ruido de enmascaramiento de un nivel tal que la relación voz/ruido en el corte del micrófono era de aproximadamente -15- -19 dB. Al disminuir
Por alguna razón, el nivel de ruido de enmascaramiento alcanza valores cuando la relación voz-ruido mejora a aproximadamente -10- -12 dB, el proceso de adaptación se desactivará y aparecerá ruido de enmascaramiento en los auriculares. Para los negociadores, esto indicará la ocurrencia de una situación de emergencia.
2. Protección contra exceder el límite superior especificado del nivel del habla.
Al hablar a niveles elevados, se escuchará un sonido parecido a un crujido en los auriculares de los participantes en las negociaciones, lo que también indicará una emergencia. situación.
- Protección contra la violación de la topología de ubicación del equipo.
Cuando el equipo está desplegado o en uso, la distancia entre los altavoces o entre los altavoces y la unidad principal puede establecerse por debajo del límite especificado.
En este caso, el espacio detrás de los altavoces puede estar mal enmascarado.
Para evitar que esto suceda, se introdujo en el proceso de cálculo el parámetro r (2) y (3), que determina el valor límite del retardo acústico de la señal de ruido.
Si el retraso acústico (es decir, la distancia) en el paso del ruido de enmascaramiento desde el altavoz al micrófono es menor que el especificado, entonces no habrá adaptación y solo habrá ruido en los auriculares.
Las mediciones y pruebas realizadas arrojaron los siguientes resultados.
Las mediciones y pruebas realizadas arrojaron los siguientes resultados.
Las mediciones y pruebas realizadas arrojaron los siguientes resultados.
1. La inteligibilidad de formantes medida de una señal de voz ruidosa en la banda de frecuencia operativa (5 kHz) en el corte del micrófono es del 3 al 5%. Cabe señalar aquí lo siguiente. Desde enmascarar el ruido — «blanco» ruido y sufre cambios espectrales insignificantes durante la formación del campo acústico con la ayuda de altavoces, entonces es bastante aceptable medir la inteligibilidad de los formantes y sacar conclusiones basadas en los resultados de estas mediciones.
2. La profundidad de supresión del ruido de enmascaramiento en la señal que se presenta a los auriculares es de 26 — 30 dB con el número de coeficientes de ponderación igual a 1300.
3. El discurso de los negociadores, grabado en una grabadora de voz ubicada en el bolsillo del pecho de uno de los negociadores, es absolutamente ininteligible.
En conclusión, cabe señalar que desde la señal de discurso presentada a los negociadores a través de Los auriculares en los equipos CNDS están prácticamente libres de ruidos enmascarantes, entonces la comodidad de las condiciones de trabajo de los negociadores estará determinada únicamente por el grado de amortiguación del ruido externo por las almohadillas de los auriculares utilizados.
ZOLOTAREV VALERY IVANOVICH
Ph.D., investigador principal
Fuente: revista «Equipos especiales»