¿Qué es hoy?

chto segodnya

¿Qué es hoy?.

Análisis inteligente, análisis de vídeo, sistemas de videovigilancia inteligentes: últimamente ha pasado de moda hablar de detectores de movimiento «simples». Pero, de hecho, a excepción de los sistemas de reconocimiento de matrículas, los detectores de movimiento todavía pertenecen principalmente a la categoría de análisis de vídeo. A veces (rara vez) hay variaciones inversas y opuestas (relativamente hablando, «detectores de reposo»): detectores de objetos abandonados, detectores de «museos», pero todo esto, de hecho, pertenece a la categoría de detectores de movimiento.

La moda de la inteligencia surgió a finales del siglo pasado, cuando las capacidades de los detectores de movimiento alcanzaron un nivel aceptable para uso práctico y los detectores de movimiento comenzaron a colgarse con todo tipo de arcos, útiles y no tan útiles. En primer lugar, se trata de un ajuste automático a los cambios en las condiciones de iluminación, condiciones climáticas y otras características. A veces había funciones adicionales, como el análisis de la forma o el comportamiento del objeto observado, pero, por regla general, ambas se implementan de forma muy sencilla en la práctica: la sintonización automática significa la presencia de varios (de dos a cien) conjuntos diferentes de configuraciones que cambian según la hora del día, la época del año o algunas señales simples. El análisis del comportamiento también suele reducirse al hecho de que el movimiento en una dirección se considera sospechoso y en la otra, aceptable. El hecho es que los sistemas verdaderamente inteligentes requieren mucho tiempo para adaptarse al terreno, las características de los presuntos infractores, etc.
A modo de anécdota, os hablaré de un sistema creado en base a algoritmos neuronales, que es un ejemplo clásico de sistema de autoaprendizaje. Mostró resultados notables en una versión de maqueta, pero para entrenarla, supuestamente, necesitaba que le mostraran varios miles de videos filmados en diversas condiciones y, lo más desagradable, la mitad de ellos tenía que contener la situación detectable objetivo: el intruso. Imagínese la tarea: en un objeto específico, filmar al menos mil veces a una persona imitando a un intruso, realizando la penetración de diferentes maneras, es conveniente abarcar lo más ampliamente posible todas las maneras y métodos posibles de penetración. Y para generalizar este procedimiento a varios objetos, es necesario realizar el mismo procedimiento en miles de objetos. Son millones de experimentos. Lo que es peor: la muestra experimental, capaz de procesar sólo unas pocas docenas de ejemplos, funcionó relativamente bien en un Pentium de 3 GHz. Y si amplía sus capacidades para dominar millones de ejemplos, necesitará un grupo de al menos mil computadoras, todas para procesar una sola señal de video.
Volvamos a los tiempos modernos. ¿Cuál es la situación actual del análisis de vídeo? La situación es simple: las necesidades superan las capacidades. En los últimos años, la necesidad de sistemas que puedan reemplazar a una persona al analizar una señal de video ha crecido y es reconocida por la mayoría de los profesionales de la seguridad. La razón principal: el bajo precio de las cámaras de vídeo y su creciente número. Por ejemplo, en Gran Bretaña se instalan cientos de miles de cámaras como parte de “planes urbanos”. Junto con las cámaras de vídeo instaladas en propiedades privadas, el número total de cámaras de vídeo de que dispone la policía asciende actualmente a 4,2 millones.Al mismo tiempo, la amenaza del terrorismo sigue creciendo, al igual que la delincuencia común. Y, sin embargo, con la enorme cantidad de cámaras de vídeo disponibles, resultan de poca ayuda. En parte porque de alguna manera ahorraron en fósforos (iluminación, lentes, cámaras, sistemas de transmisión), pero la calidad final está determinada por el peor elemento (recuerde: ¿la velocidad del escuadrón está determinada por el barco más lento?). Pero, en gran medida, la eficacia de los sistemas de videovigilancia es baja porque su uso requiere numerosos especialistas altamente cualificados (operadores de videovigilancia) que mantengan constantemente su nivel.
De hecho, en el Reino Unido, el país más avanzado en términos de videovigilancia, no más de la mitad de todos los puestos de vigilancia funcionan las 24 horas. Al menos de alguna manera, sin mencionar a los operadores especialmente capacitados. Por supuesto, se está realizando la grabación de vídeo. Cada vez se acumulan más grabaciones de vídeo de mejor calidad. ¿Pero qué hacer con ellos? La misma policía británica tiene un estándar de una semana para un análisis cuidadoso de una cinta con 24 horas de grabación. Por supuesto, este análisis se realiza sólo «en caso de que algo suceda», es decir, cuando el delito se conoció además del sistema de videovigilancia, es decir, el sistema no ayudó a prevenirlo o detenerlo.
Sí, los operadores de CCTV, especialmente los que tienen experiencia y están especialmente capacitados, son muy caros. La mayoría de las salas de control no funcionan las 24 horas, e incluso cuando hay operadores presentes, sólo hay uno o dos operadores para cientos de cámaras. ¿Por qué entonces se siguen instalando cada vez más cámaras de vídeo? Hay varias razones. El primero es objetivo. Los ingleses sabios se basan en la ley de Moore y en el desarrollo de la tecnología y preparan los sistemas para el momento en que puedan utilizarse de forma eficaz. Al fin y al cabo, se pueden instalar nuevos ordenadores en las estaciones de vigilancia en unos pocos días, pero la instalación de cámaras de vídeo y redes de comunicación lleva años. Porque, dicho sea de paso, en la mayoría de los sistemas urbanos de Inglaterra existe el requisito de entregar vídeo en directo al sitio central en alta calidad.
La segunda razón es subjetiva (si no egoísta), como en el conocido caso en el que un alcalde español exigió al contratista que instalara un gran videowall en una sala diseñada para un solo operador, sin ocultar el hecho de que era Sólo necesitaba estar orgulloso de los alcaldes vecinos (el contratista resultó ser amigo del famoso Vlado Damjanovski, y este caso recibió cierta publicidad entre los especialistas).
Por tanto, la demanda de automatización del análisis de señales de vídeo es enorme. Sin embargo, en realidad sólo se ofrecen sistemas muy simples, que sólo pueden clasificarse como análisis de vídeo gracias al esfuerzo de los departamentos de publicidad de las empresas fabricantes. Sin embargo, estos sistemas (detectores de movimiento), por regla general, son muy difíciles de configurar, instalar e incluso operar y, por lo tanto, no se utilizan con mucha frecuencia.
Además, una característica de nuestro tiempo es la transición a la tecnología de transmisión de señales de vídeo IP. No entraré en detalles técnicos, pero diré lo principal: después de una fuerte compresión, es demasiado tarde para realizar un análisis. Las distorsiones y artefactos introducidos en la señal mediante algoritmos de compresión de información son mucho más peligrosos que cualquier ruido o fenómeno natural, porque no son en absoluto aleatorios, sino que surgen exactamente donde y cuando sucede algo interesante. Por supuesto, con una relación de compresión baja, especialmente si se utilizan cámaras de vídeo de megapíxeles, el resultado general no es tan malo, pero la solución natural para los desarrolladores es transferir el análisis «en la cámara». Hay muchos ejemplos: docenas de empresas conocidas y no tan conocidas ofrecen de una forma u otra sistemas de análisis distribuidos que garantizan la selección y la transmisión de alta calidad solo de áreas especialmente sospechosas, por regla general, seguido de un análisis adicional en un estación central.
De hecho, todos estos sistemas distribuidos son un intento de implementar en procesadores pequeños y baratos al menos parte de lo que recientemente aprendieron a implementar en potentes Pentium y cristales DSP especiales.
Hoy, el resultado más significativo: el flujo (calidad) digital disminuye en ausencia de cambios significativos (de manera similar a cómo el uso de detectores de actividad incluso primitivos en los antiguos multiplexores hizo posible implementar una redistribución dinámica de la calidad de la grabación). El inconveniente más grave es que, aunque todo el mundo afirma que la transferencia de metadatos cumple con los estándares MPEG-7 y MPEG-4, en realidad se trata de extensiones no estandarizadas y, por lo tanto, dichos sistemas aún no son compatibles entre sí y excluyen el uso de sistemas de gestión de terceros o análisis adicionales de todas las transmisiones de vídeo.
Mi comienzo resultó ser algo sombrío y pesimista, pero de hecho, la tecnología continúa desarrollándose, aunque no tan rápido como queríamos hace 10 años. ¿Qué nuevas tendencias han surgido en los últimos años?
Análisis de registros. Varias empresas están desarrollando soluciones (la mayoría se centran en la sufrida policía del Reino Unido) que permiten el análisis automatizado de registros, con criterios flexibles para detectar situaciones sospechosas. Permítanme llamar su atención: en el caso de analizar grabaciones, por supuesto, la calidad de la señal de video es mucho peor que la de la transmisión en vivo, pero es posible rebobinar la grabación muchas veces y seleccionar la configuración óptima, que, por desgracia, Es imposible en tiempo real. El objetivo de la búsqueda puede ser por criterios muy diversos. Por ejemplo, si la gente permanece durante largos períodos de tiempo en áreas que se sabe que son sitios de tráfico de drogas, las imágenes relevantes se envían manualmente para su posterior análisis. Por supuesto, no puede prescindir de la revisión manual (quizás sea más correcto decir «ojo»), pero al menos no tiene que mirar kilómetros (como correctamente: megacuadros, gigabytes) de registros con los ojos.
Asistencia al operador. Aproximadamente los mismos algoritmos utilizados para analizar registros, pero en tiempo real. Un operador capacitado puede ajustarlos interactivamente a medida que cambia la situación; como resultado, un sistema integrado hombre-máquina (resulta ser una especie de cyborg) funciona mucho mejor que una persona e incomparablemente mejor que 10 computadoras. Estos sistemas también proporcionan algoritmos no tanto para el análisis de vídeo, sino simplemente para hacer la vida más fácil, por ejemplo, mejora de la imagen, eliminación de ruido, control del zoom, control interactivo de la reversión de grabaciones breves, etc. En la categoría de análisis de vídeo en sí, se encuentran Medios especialmente populares (aunque no diré que funcionen bien) para rastrear rápidamente a una persona seleccionada. Como regla general, estos algoritmos funcionan según criterios muy simples: el color de la camisa, la continuidad del movimiento, pero en el futuro hay desarrollos en los que se lleva a cabo un análisis adicional del tamaño, la forma de una persona y su rostro. Por ejemplo, un grupo de empresas y universidades europeas está llevando a cabo una investigación cuyo objetivo es implementar un análisis integral: los criterios simples funcionan en condiciones simples, y los complejos, incluida la comparación de rostros, se incluyen si una persona pudiera , por ejemplo, cambiarse de ropa. Además del análisis de vídeo en sí, se está desarrollando (lentamente) la integración con datos de otros sensores, lo que permite un análisis exhaustivo no solo de la imagen, sino también de toda la situación en el sitio. Me gustaría subrayar que todos los sistemas mencionados son extremadamente caros y complejos, esencialmente experimentales, y sólo se utilizan en instalaciones especialmente importantes, como aeropuertos o edificios del gobierno central, donde se combina una especial importancia con una especial complejidad debido a la gran cantidad de visitantes completamente legales. chto segodnya 2Busque en la base de datos de fotografías. Una idea conocida desde hace mucho tiempo. Realmente no funciona, porque para la mayoría de los delincuentes buscados no hay buenas fotografías, y basándose en un identikit, los algoritmos de reconocimiento facial actuales no funcionan. E incluso si se tiene una buena fotografía (generalmente recortada, tomada durante el arresto previo de un delincuente, y luego solo para delincuentes), la calidad del reconocimiento de los algoritmos existentes disminuye categóricamente a medida que pasa el tiempo desde el momento de la captura. Los disparos aumentan. Sin embargo, aunque todos los experimentos conocidos actualmente sobre la introducción masiva de sistemas de reconocimiento facial en zonas urbanas han dado resultados negativos, estos experimentos continúan. Los primeros experimentos se llevaron a cabo en Miami a finales de los años 90. Actualmente continúan en varias ciudades inglesas y americanas. Hasta ahora se consideran ineficaces. Sin embargo, otras aplicaciones de la tecnología de reconocimiento facial automático funcionan bastante bien. Por ejemplo, en muchos estados (en los Estados Unidos), la policía utiliza activamente terminales móviles para reconocer a los sospechosos (en este caso, se utilizan condiciones de disparo controladas: el sujeto se ve obligado a cooperar con la policía, así como imágenes múltiples de alta calidad). -cámaras megapíxeles y comunicación GPRS con un potente ordenador del departamento de policía). Así pues, dada la ley de Moore y la creciente popularidad de las cámaras de vídeo de megapíxeles, podemos esperar que en los próximos años la tecnología de búsqueda de personas buscadas finalmente se ponga en práctica (con enmiendas a lo que se dijo sobre la falta de fotografías aceptables de terroristas buscados).

La Ley de Moore es la observación legendaria de Gordon Moore de las características de las tecnologías de producción de circuitos integrados, realizada por él a principios de los años 60. y se hizo famoso por la generalización de la afirmación de que «el rendimiento promedio de una computadora se duplica cada año y medio». La Ley de Moore celebró recientemente su 40º aniversario y, en términos generales, sigue siendo válida.

    Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
    Принять