Nueva solución para proteger negociaciones confidenciales.
Zolotarev Valery Ivanovich, Candidato de Ciencias Técnicas
NUEVA SOLUCIÓN PARA PROTEGER LAS NEGOCIACIONES CONFIDENCIALES
En la era de la información se aplica un principio bien conocido: quien posee la información es dueño del mundo. Hay gente más que suficiente que quiere apoderarse del mundo de esta manera, lo que significa que existe una demanda constante de información obtenida ilegalmente. En tal situación, el dolor de cabeza del propietario de la información — esta es su protección confiable. Es decir, en el campo de la información hay una eterna lucha entre el proyectil y la armadura, el bando atacante y el bando defensor.
La información transmitida por una señal de voz o información de voz recibe una atención digna del lado atacante. En el caso general, la información del habla es un conjunto formado por información semántica, personal, conductual, etc. Como regla general, la de mayor interés es la información semántica, cuya pérdida puede evaluarse indirectamente como la pérdida de inteligibilidad del habla. En el futuro, por información del habla entenderemos sólo información semántica.
Existen bastantes métodos para proteger la información del habla y medios técnicos que implementan estos métodos, y se mejoran constantemente, porque A medida que se desarrolla el pensamiento científico y técnico, el lado atacante dispone de medios técnicos cada vez más sofisticados que permiten no sólo mejorar las características cuantitativas de los canales técnicos conocidos de fuga de información, sino también crear nuevos canales. Se puede organizar el número máximo de canales de fuga de información técnica para interceptar información de voz acústica, por ejemplo, durante reuniones y negociaciones confidenciales. La protección más eficaz en este caso
es la protección acústica de la sala en la que se llevan a cabo negociaciones confidenciales y, en el mejor de los casos, la protección acústica de la señal acústica del habla. Este artículo está dedicado a los problemas que surgen a la hora de organizar dicha protección y sus soluciones técnicas.
MÉTODOS DE PROTECCIÓN. Términos, definiciones, breve descripción.
La protección acústica de una señal acústica del habla (voz) aquí significa un enmascaramiento confiable del habla mediante una señal acústica de enmascaramiento (ruido) que opera en el banda de frecuencia del habla y con una característica espectral suave.
Se consigue un enmascaramiento fiable cuando la mezcla acústica aditiva resultante de habla y ruido, o habla ruidosa, en cualquier punto del volumen controlado tiene una inteligibilidad verbal de no más del 20% (en la práctica, esto corresponde a la percepción de exclamaciones individuales y “palabras familiares”) Al mismo tiempo, los negociadores deben crear las condiciones acústicas más cómodas posibles en las circunstancias dadas. Cabe señalar que el concepto de «comodidad» en relación con la percepción de la información del habla entre los especialistas aún no tiene una interpretación inequívoca y, más aún, no se ha desarrollado una escala de calificación de comodidad. Tradicionalmente asociamos la comodidad con la reacción de una persona ante condiciones no naturales, como la fatiga, que en teoría se puede evaluar. Pero hasta la fecha, debido a la gran cantidad de investigaciones necesarias, aún no se han determinado las correlaciones entre los tipos y la profundidad de la distorsión de la señal del habla y el grado de fatiga. Por lo tanto, al evaluar la comodidad, utilizaremos exclusivamente evaluaciones intuitivas de alta calidad, confiando en el sentido común.
Existen varios tipos de equipos de protección acústica del habla, que se pueden dividir en dos grupos: equipos de protección acústica de sala y equipos de protección acústica del habla propiamente dichos.
Los equipos del primer grupo producen interferencias acústicas de barrera a lo largo de las estructuras de cerramiento y, por regla general, se utilizan junto con equipos de protección contra vibraciones. En este caso se crean unas condiciones acústicas relativamente cómodas para el personal, pero no se protege acústicamente todo el volumen de la sala con todas las consecuencias consiguientes.
El segundo grupo de equipos incluye generadores de ruido acústico, que se ubican cerca del lugar de negociación y enmascaran con su ruido el discurso de los negociadores. Al mismo tiempo, los negociadores no están protegidos de los efectos del ruido acústico. La comodidad y el nivel de camuflaje en este caso dejan mucho que desear. Un mayor nivel de camuflaje y comodidad se distingue por los equipos que, además de un generador de ruido acústico, utilizan auriculares de intercomunicación diseñados para funcionar con ruido intenso. Este tipo incluye el equipo TF-011D, que utiliza auriculares con micrófono de teléfono y el OKP-6 con auriculares de laringófono. Al utilizar estos dispositivos, el oído de los negociadores queda protegido del ruido acústico mediante las almohadillas de los auriculares, a través de las cuales se presenta a los negociadores el discurso de sus socios. El discurso de los negociadores se percibe mediante un micrófono situado cerca de la boca del orador o mediante un laringófono situado en la garganta del orador. La confiabilidad del enmascaramiento del habla es alta, especialmente para OKP-6, pero la necesidad de usar auriculares puede no siempre ser conveniente para los usuarios.
Mantener una alta confiabilidad del enmascaramiento del habla, mientras se eliminan los auriculares y se reemplazan con auriculares, fue la tarea que se propuso el grupo de desarrolladores, representado por el autor de este artículo.
SOLUCIÓN DEL PROBLEMA
Al resolver este problema, los desarrolladores encontraron el siguiente problema. Se sabe que durante una conversación telefónica, el nivel medio del habla en la membrana del micrófono del auricular es de 97,5 dB en una banda de frecuencia de 100 — 10000 Hz. El micrófono del auricular está ubicado aproximadamente a la misma distancia de la boca del hablante que el micrófono del auricular y, en consecuencia, el nivel de voz en el micrófono del auricular será aproximadamente el mismo. Con el enmascaramiento acústico del habla se consigue, por un lado, un enmascaramiento fiable y, por otro, — Para un nivel aceptable de comodidad (calidad satisfactoria de la transmisión del habla, consulte la Tabla 1), es necesario crear un campo de ruido con un nivel de 86 dB alrededor de los altavoces. En este caso, la relación voz-ruido en el micrófono del auricular es más 10 — 12 dB.
Tabla 1.
Calidad de voz | W, % | S, % | A, % | Bsh, dB | Habla/ruido,
dB |
ideal | 100-99 | ||||
excelente | 99-98 | ||||
bueno | 98-93 (95) |
58 | 35 | 81 | +16 |
satisfactorio | 93-87 (90) |
47 | 25 | 86 | +11 |
máximo permisible |
87-77 (82) |
33 | 18 | 92 | +5 |
fallo de conexión | 77-60 (68) |
18 | 12 | 97 | +0 |
camuflaje confiable | 15 | 4 | 5 | 104 | -17 |
Explicaciones de la Tabla 1. La tabla contiene los resultados obtenidos en base a los datos de Sapozhkov M.A. y Pokrovsky N.B. para un nivel de voz de 97,5 dB y ruido “blanco”. Aquí: W— inteligibilidad verbal (los valores medios del rango presentado se colocan entre paréntesis); S— inteligibilidad silábica; A— inteligibilidad de formantes; Bsh — nivel de ruido “blanco”.
A una distancia de 1,2 — 1,5 m el nivel de la señal de voz se reduce a 72 — 78 dB (las mediciones se realizaron según una frase de prueba tradicional en habitaciones de 600 metros cúbicos y 50 metros cúbicos). Si el nivel de ruido se mantiene en 86 dB en todo el volumen de la habitación protegida dentro de un radio de aproximadamente 1,3 m desde la boca del hablante, la relación habla-ruido será en promedio — 10 dB y, a medida que te alejes, empeorará aún más. Con base en los datos de la Tabla 1, podemos concluir que a una distancia de la boca del hablante de más de 1 m, la calidad del habla está por debajo del nivel de «desconexión», y a una distancia de más de 2 m, un camuflaje confiable será estar garantizado. Aquí es necesario hacer algunas explicaciones y aclaraciones a lo dicho.
1. La calidad del habla “la ruptura de la comunicación se caracteriza por una total ilegibilidad del texto principal y, según diversas fuentes, corresponde a valores W en el rango del 77% al 60%, y en algunas publicaciones el límite inferior del rango es 50% de las palabras.
2. Los datos dados en la Tabla 1 corresponden a un nivel de voz de 97,5 dB y utilizar estos datos para otros niveles no es del todo correcto, pero a efectos ilustrativos es bastante aceptable.
Del razonamiento anterior queda claro que alejar el micrófono de la boca del orador, es decir, La negativa a utilizar auriculares provoca una disminución de la inteligibilidad del habla, hasta una interrupción de la comunicación a distancias de más de un metro de la fuente del habla. En otras palabras, colocar el micrófono lejos de la boca del hablante simula la situación con un micrófono que escucha a escondidas. Y el enmascaramiento acústico va en contra de esto. Para ello se utiliza ruido blanco como ruido de enmascaramiento. El hecho es que no existen algoritmos ni implementaciones de hardware y software que realmente puedan aumentar la inteligibilidad del habla ruidosa con ruido «blanco» con una relación habla-ruido negativa. El algoritmo McCooley y otras modificaciones del algoritmo de sustracción espectral, destinadas a combatir el ruido «blanco», pueden mejorar la comodidad auditiva, pero no la inteligibilidad del habla para relaciones positivas entre voz y ruido. Por lo tanto, el habla ruidosa interceptada por medios de monitorización acústica no puede eliminarse del ruido.
Si se cumplen determinadas condiciones, es posible compensar con un alto grado de supresión cualquier ruido estacionario, incluido el ruido blanco. Esta compensación se puede realizar utilizando un filtro adaptativo digital de dos canales (en el artículo «Adaptive Filtration Equipment», «Confident», N1-2, 1999, el autor considera esta posibilidad). En relación con el problema considerado, en el equipo desarrollado se utilizó un filtro adaptativo de dos canales (DAF) para la protección acústica de conversaciones confidenciales — Sistema Digital de Negociaciones Confidenciales (CNDS)*
Foto 1. Equipos de protección acústica para negociaciones confidenciales — Sistema Digital de Negociaciones Confidenciales (CNDS)
Nota
* Certificado de modelo de utilidad con prioridad de fecha 05/05/99
PRINCIPIO DE FUNCIONAMIENTO DEL EQUIPO DE PROTECCIÓN PARA LA NEGOCIACIÓN CONFIDENCIAL (CNDS)
El principio básico es que el ruido de enmascaramiento generado n va no solo al emisor electroacústico, sino también a la entrada de referencia del DAF (el diagrama de bloques CNDS se muestra en la Fig. 1). La segunda entrada principal del DAF recibe la señal x de la salida del micrófono receptor, que actúa como un micrófono de auriculares. Esta señal es una mezcla aditiva del discurso de los negociadores s y el ruido n1, que es el ruido n, pero ha sufrido cambios al convertirse en señal acústica y debido a la acústica de la sala donde se desarrollan las negociaciones.
Figura 1. Diagrama de bloques del CNDS
Si estos cambios son lineales (el amplificador de potencia y el emisor no limitan la señal de ruido), entonces n y n1 están correlacionados. La relación voz-ruido en esta mezcla es peor cuanto más lejos está el micrófono receptor de la boca del hablante. Por cierto, observamos que en este esquema solo se utiliza un micrófono para todos los participantes en las negociaciones, es decir, Rechazamos los auriculares. Utilizando la señal del canal de referencia, según el algoritmo adaptativo, el componente de ruido en la mezcla de voz y ruido se compensa en el DAF y la voz así purificada se presenta a los negociadores a través de auriculares. La convergencia del algoritmo se realiza mediante el método de descenso más pronunciado y, para simplificar los cálculos, se utiliza la aproximación estocástica del gradiente según Widrow-Hopf. Para acelerar la convergencia, se utiliza el módulo mínimo del error del filtro como criterio de optimización.
IMPLEMENTACIÓN CNDS. Descripción del algoritmo, algunas características operativas, resultados de las pruebas.
La base del equipo CNDS es un procesador digital especializado que implementa las funciones de un generador, un dos digital -filtro adaptativo de canal (CDAF) y funciones de control.
CDAF proporciona la compensación del componente de ruido en una mezcla de voz y ruido. El algoritmo de operación CDAF se puede representar mediante las siguientes expresiones:
s(j) = x(j) — y(j) (1)
(2)
v(j+1,i) = v(j,i) + m sgn[s(j)] n(j-r-i), (3)
donde:
x(j) — próxima lectura de la señal principal;
n(j) — siguiente muestra de señal de referencia;
y(j) — siguiente muestra de estimación de ruido;
s(j) — siguiente recuento de la señal de salida (señal de error);
v(j,i) — siguiente valor del coeficiente de peso del filtro;
m — coeficiente que determina la velocidad de adaptación;
p — número de pesos de filtro;
r — retardo de señal acústica;
j — valor de tiempo discreto, j= 1,2,3,…;
i — número de coeficiente de ponderación del filtro, i= 1,2,3,…,p;
sgn[.] — señal de señal [.].
La voz limpia (señal de error de filtro), de acuerdo con (1), se define como la diferencia entre la señal del canal principal y el valor de ruido previsto (estimación de ruido), que se calcula como la convolución de la señal del canal de referencia (ruido). con los coeficientes de ponderación del filtro transversal según (2). La respuesta al impulso de este filtro (o el vector de coeficientes de ponderación de dimensión p) se actualiza en cada instante de tiempo discreto j de acuerdo con (3). La adaptación (ajuste automático) del vector de peso se realiza a una determinada velocidad (velocidad de adaptación) hasta el mínimo de la expresión (1), es decir casi hasta la completa supresión del ruido de enmascaramiento en la señal que llega a los auriculares. Eso. Durante el período de tiempo en que se produce la adaptación (tiempo de adaptación), se escuchará un ruido de enmascaramiento en los auriculares, que disminuirá de nivel y el discurso de los negociadores aparecerá en su contexto. Posteriormente, en ausencia de cambios en la situación acústica de la habitación, los valores de los coeficientes de ponderación se estabilizarán y comenzará el proceso de seguimiento, que se caracteriza por la presencia de un signo variable del gradiente (el segundo término en (3)) y su valor absoluto mínimo. Durante este período de tiempo, el habla casi “pura” estará presente en los auriculares. Si la situación acústica cambia, por ejemplo, los negociadores empiezan a hacer gestos bruscos, el CDAF volverá a entrar en modo de adaptación y se volverá a oír ruido en los auriculares. Para reducir la influencia de este efecto, la velocidad de adaptación, que está regulada por el coeficiente m, se elige como máxima (está limitada desde arriba por la condición de convergencia del algoritmo). Por supuesto, con gestos intensos de todos los negociadores, maximizar la velocidad de adaptación no conducirá al efecto deseado y obligará a los negociadores a calmarse. Este — limitación útil no deseada. Las restricciones (protecciones) planificadas que excluyen la posibilidad de que surjan situaciones que permitan la interceptación de información de voz que no esté debidamente enmascarada incluyen las siguientes.
-
- Protección contra la reducción no autorizada del ruido acústico.
Esta protección se implementa de la siguiente manera. El dispositivo con micrófono incorporado se encuentra a una distancia de 1 — A 1,5 metros de los altavoces (en el medio entre ellos). A la izquierda y a la derecha de los altavoces, a cierta distancia, hay dos altavoces que emiten un ruido de enmascaramiento de tal nivel que la relación voz-ruido en el extremo del micrófono es de aproximadamente -15 — 19 dB. Si por alguna razón el nivel de ruido de enmascaramiento se reduce a valores en los que la relación voz-ruido mejora a aproximadamente menos 10 — 12 dB, el proceso de adaptación se desactivará y aparecerá ruido de enmascaramiento en los auriculares. Para los negociadores, esto indicará la ocurrencia de una situación de emergencia.
-
- Protección contra exceder el límite superior especificado del nivel del habla.
Al hablar en voz alta, se escuchará un sonido parecido a un crujido en los auriculares de los negociadores, lo que también indicará una situación de emergencia.
- Protección contra la violación de la topología de colocación del equipo .
Cuando el equipo está desplegado o en uso, la distancia entre los altavoces o entre los altavoces y la unidad principal puede establecerse en menos del límite especificado. En este caso, es posible que el espacio en la parte trasera de los altavoces no quede bien enmascarado. Para evitar que esto suceda, se introdujo en el proceso de cálculo el parámetro r (2) y (3), que determina el valor límite del retardo acústico de la señal de ruido. Si el retraso acústico (es decir, la distancia) en el paso del ruido enmascarante desde el altavoz al micrófono es menor que el especificado, entonces no habrá adaptación y solo habrá ruido en los auriculares.
Las mediciones y pruebas realizadas arrojaron los siguientes resultados.
Las mediciones y pruebas realizadas arrojaron los siguientes resultados.
1. La inteligibilidad de formantes medida de una señal de voz ruidosa en la banda de frecuencia operativa (5 kHz) en el corte del micrófono es de 3 — 5%. Aquí cabe señalar lo siguiente. Desde enmascarar el ruido — ruido «blanco» y sufre cambios espectrales insignificantes durante la formación del campo acústico con la ayuda de altavoces, entonces es bastante aceptable medir la inteligibilidad de los formantes y sacar conclusiones basadas en los resultados de estas mediciones.
2. La profundidad de supresión del ruido de enmascaramiento en la señal presentada a los auriculares es de 26 — 30 dB con el número de coeficientes de ponderación igual a 1300.
3. El discurso de los negociadores, grabado en una grabadora de voz ubicada en el bolsillo del pecho de uno de los negociadores, es absolutamente ininteligible.
En conclusión, cabe señalar que desde la señal de discurso presentada a los negociadores a través de Los auriculares prácticamente no enmascaran el ruido en los equipos CNDS, por lo que la comodidad de las condiciones de trabajo de los negociadores estará determinada únicamente por el grado de amortiguación del ruido externo por las almohadillas de los auriculares utilizados.