Busque señales estables de grabadoras de voz digitales..
Ivanov I.L.
Búsqueda de señales estables de grabadoras de voz digitales.
El uso generalizado de dispositivos de grabación de audio digital en las actividades de búsqueda operativa para expertos que realizan exámenes con dicho material fuente impone requisitos adicionales para realizar investigaciones y responder a las preguntas planteadas. Recientemente, la investigación de la práctica de los expertos en los últimos años ha revelado una serie de puntos que un experto necesita conocer en sus actividades diarias.
Para realizar una investigación sobre material suministrado en un CD láser o presentado en forma de grabadora de voz digital (o flash), también presentado para la investigación, es necesario familiarizar de manera integral al experto con el principio de grabación y compresión de voz digital. grabadoras. Al examinar varias grabadoras de voz utilizadas por las fuerzas del orden, se reveló que el formato de compresión principal utilizado en los algoritmos internos de las grabadoras de voz es similar al formato MP3, con diferentes velocidades de bits de compresión de la señal digitalizada. El formato de señal MP3 en representación espectral ya es bien conocido por los expertos y su representación típica se muestra en la siguiente figura. (Examen real)
Un estudio detallado del espectrograma presentado puede revelar una serie de características significativas relacionadas con los formatos de compresión típicos del MP3. algoritmo.
A. Densidad espectral desigual. Aquellos. Están disponibles ventanas cuadradas sin densidad espectral. Estas ventanas suelen tener una longitud de múltiplos de 64 conteos.
b. Existe un filtrado de paso alto, debido precisamente al formato de compresión, similar al MP3. En la figura presentada lo vemos en el espectro promedio de la Fig. abajo: En un archivo específico observamos su corte a 7500Hz.
Estos espectros promediados, la pendiente de la atenuación y el alcance del apogeo de la atenuación del filtro hasta -123 dB, como vemos en la figura, son típicos de los dispositivos de grabación digital que tienen un algoritmo de compresión interno, que es inalcanzable para la grabación analógica. dispositivos que utilizan cinta magnética como soporte.
v. En momentos de sobrecarga de la ruta de grabación, y el filtrado utilizado a menudo se realiza en filtros digitales, se producen hechos de sobrecarga de canal a corto plazo, a veces asociados con la aparición de Aliasing, visibles en la primera figura del artículo (en la banda de En el espectro filtrado observamos tres columnas estrechas del espectro no filtrado).
g. Algunos modelos de grabadoras de voz digitales, al comienzo del fonograma grabado, a veces también pueden dejar una señal del inicio (final) del fonograma en forma de señal de tono al final del fonograma. Pero pueden diferir entre sí en tonalidad.
(En un examen real, se cortó el final del fonograma, luego se copió una sección tonal del final del fonograma y se insertó en el original. Pero, en longitud (en número de períodos) resultó ser menos de lo esperado (no se capturó con precisión durante la copia), y esto no puede estar en grabadoras de voz digitales. Este resultó ser el primer signo de edición por computadora del fonograma. Más tarde, se encontró el lugar del corte, etc. el primer examen real apareció con signos de edición por computadora en el material presentado desde un dispositivo de grabación digital.)
d. Las investigaciones sobre la representación interna de archivos en una grabadora de voz digital han revelado que muchas grabadoras de voz, en su presentación interna, utilizan el mismo formato, similar al formato MP3, pero en la presentación interna (en la memoria de la grabadora) . Pueden presentarse con varias extensiones de archivo (en algunas de las grabadoras de voz estudiadas se utilizó la extensión *.rec). Este formato, junto con la codificación en formato MP3, tiene información de servicio adicional. Adobe Audition y Sound Forge se niegan a aceptar el estándar *.rec específico o lo perciben incorrectamente, violando la tasa de bits, la velocidad de reproducción, etc. Pero este formato es legible para software experto (Justiphone 2.3 y superior). Esto se debe a información de servicio en el encabezado del archivo, que los editores de sonido estándar no pueden percibir. Así, tenemos el original con extensión *.rec. En este sentido, al identificar dichos dispositivos de grabación en las fuerzas del orden, podemos recomendar que envíen el material original en este formato, así como en los formatos *.amr, *.mmf, etc. (Ahora puedes imaginar cómo puedes hacer un montaje en un fonograma de este tipo:
1. Conviértelo a Wav.
2. Haz un montaje.
3. Conviértalo a Rec o similar con compresión MP3 con la adición de información de servicio. ¿Y aquí está la pregunta? ¿Cómo hacer esto? Aquí es necesario comprender muy bien los encabezados de información de servicio en la representación interna en el dispositivo de grabación. Todavía no existen editores accesibles y ampliamente conocidos).
Cabe señalar que en la naturaleza no existe un algoritmo inequívoco para codificar y decodificar el formato MP3. Sólo existen recomendaciones de estándares para su implementación. Así, cada empresa que desarrolla software de codificación/decodificación desarrolla su propio software. Al final del artículo hay una descripción general de los estándares MPEG.
2. Al recibir y examinar inicialmente una señal digitalizada enviada para investigación, es necesario solicitar las características del dispositivo de grabación utilizado para grabar el fonograma en estudio (si el experto se encuentra con este modelo por primera vez o no puede decidir sin ambigüedades sobre el modelo de la grabadora y el software que la acompaña según las propiedades encontradas del software del archivo de audio).
3. Se examina el software suministrado con el dispositivo de grabación.
4. Una grabación de control en la grabadora de prueba puede revelar muchos signos que, en comparación con los signos del fonograma presentado para la investigación, pueden revelar discrepancias y signos de cambios realizados después de la grabación, tales como:
A. Convertir de un formato a otro y presentar el fonograma como un archivo con extensión *.wav (aunque vemos que está comprimido por el formato interno de la grabadora de voz y la extensión *.MP3, *.REC, *.amr, Se utiliza *.mmf y se puede copiar en un disco láser en este formato particular. La conversión es inaceptable (siempre que la representación interna en la grabadora de voz digital esté claramente identificada como similar al formato MP3. No confíe en el software). de las empresas de dispositivos de grabación, que pueden convertir incorrectamente de MP3 a MP3. El software puede incluir inicialmente ecualización espectral (suavizado), recorte del espectro, errores del programador, etc. En terminología experta, esto se interpreta como cambios realizados después de la grabación. En este caso, como regla general, la pendiente de la caída en la frecuencia de corte cambia. En algunos casos (debido al software), puede aparecer una frecuencia de Nyquist residual (como vemos en la siguiente figura (examen real))
b. Convierta de un formato a otro con reducción de resolución. Esto lleva a cortar el espectro de la señal en estudio y se trata de la misma manera que en el punto a. como cambios realizados después de la grabación.
Un espectro típico de la señal recibida al convertir el archivo anterior se muestra a continuación en *.wav 11025:
Observamos la ausencia de una banda filtrante característica del formato MP3 (como vimos anteriormente en la región de los 7500Hz ) y un corte de la banda de frecuencia de la señal en estudio en el nivel de 5500Hz.
Así, un estudio preliminar del software, la representación interna del archivo en la grabadora de voz digital, el formato de grabación, la detección y estudio de los armónicos del canal de grabación y el algoritmo de compresión pueden responder muchas preguntas a las que se enfrenta el experto.
Descripción general de los estándares MPEG:
MPEG-1
El estándar ISO-11172, llamado Estándar para codificar imágenes en movimiento y audio asociado para medios digitales con velocidades de datos de hasta y alrededor de 1,5 Mbit/s, es el primero de los estándares del grupo MPEG. Comúnmente conocido como MPEG-1, consta de cinco partes, enumeradas en la tabla
Parte 1: Sistemas | Describe cómo combinar varios videos — y sistemas de audio y transmisiones de audio |
Parte 2: Vídeo | Describe cómo comprimir una secuencia de imágenes |
Parte 3: Audio | Describe cómo comprimir audio de uno o dos canales |
Parte 4: Conformidad | Describe cómo probar la conformidad de una implementación |
Parte 5: Software | Implementación de referencia completa del estándar hecho por, en particular, para eliminar las inconsistencias causadas por las primeras implementaciones fallidas del estándar. |
El apartado de la norma relacionado con la compresión de sonido se divide en tres niveles. Cada nivel posterior le permite obtener una mayor calidad debido a una implementación más compleja. El estándar de tercer nivel le permite lograr la máxima calidad en caso de criticidad del volumen de datos, sin embargo, trabajar con él implica una mayor cantidad de cálculos para la compresión y descompresión. La extensión de archivo *.MP3 se utiliza con mayor frecuencia para archivos de audio de Capa 3. La tercera parte de MPEG describe en detalle el formato de flujo de bits MPEG correspondiente, pero no describe el método de compresión. Esto puede parecer extraño al principio, pero en realidad estamos hablando de una propiedad importante del estándar. El flujo de bits MPEG define esencialmente la composición espectral del sonido y cómo cambia con el tiempo (el espectro está codificado). Para ahorrar espacio, el compresor descarta información de forma selectiva. El estándar describe cómo se codifica la información restante y cómo un descompresor puede reconstruir el PCM basándose en los datos del flujo de bits codificado en MPEG. Dado que el proceso de codificación no está incluido en el estándar, los desarrolladores pueden utilizar una variedad de métodos para determinar qué información es importante. Estos métodos pueden incluir codificadores simplificados para aplicaciones que funcionan con audio de baja calidad o codificadores diseñados para funcionar con tipos especiales de sonidos (por ejemplo, la compresión de alta calidad de música orquestal probablemente será diferente de la compresión del lenguaje hablado).
MPEG-2
Como consecuencia del relativo éxito del estándar MPEG-1, ha habido interés en ampliar aún más el estándar para su uso en otras aplicaciones. El resultado fue el estándar ISO-13818, comúnmente conocido como MPEG-2. Es una extensión y clarificación del estándar MPEG-1, lo que permite su uso más amplio. En particular, este estándar especifica que cualquier decodificador que admita el estándar MPEG-2 también debe admitir MPEG-1. Por ejemplo, la tercera parte del estándar MPEG-2 amplía la codificación de audio MPEG-1 en dos direcciones. Para aplicaciones que utilizan audio inmersivo de alta calidad, se agrega la capacidad de utilizar hasta cinco canales de audio. Para aplicaciones de bajo ancho de banda, como la transmisión de radio por Internet, se encuentran disponibles velocidades de bits (hasta 8 Kbps) y velocidades de muestreo más bajas (hasta 16.000 muestras por segundo). MPEG-2 consta de nueve partes. Los nombres de las cinco primeras coinciden con los nombres de las partes del estándar MPEG-1, y las partes 6 a 9 proporcionan nuevas propiedades y mayor fidelidad.
MPEG-3
MPEG-3 fue pensado originalmente para admitir televisión de alta definición (HDTV). Se abandonó tan pronto como quedó claro que MPEG-2 sería suficiente.
MPEG-4
Representa un intento de desarrollar un estándar para un sistema con una tasa de bits muy baja. El trabajo en ello continúa hoy. La presencia de este estándar permitiría transmitir vídeo de baja calidad a través de líneas de comunicación a velocidades de transmisión de nivel de módem.