Análisis de vídeo.
En cuanto al análisis de vídeo, la situación aquí no es sencilla. La realidad (por ejemplo, los mismos detectores de movimiento), tan pronto como nacen, se ve instantáneamente cubierta de mitos sobre sus capacidades supuestamente ilimitadas. Para ser justos, cabe señalar que algunos mitos, a su vez, rápidamente se convierten en realidad. ¿Cuál es la razón? Lo más probable es que la demanda de inteligencia de los sistemas de vídeo, los más, por así decirlo, accesibles al conocimiento masivo, sea muy alta. Hoy en día, supera con creces las capacidades del equipo. Esto, además de una cobertura superficial en los medios de comunicación y una representación no siempre adecuada en las películas (incluidas las buenas), da lugar en parte a mitos. Otra circunstancia importante que a veces obliga a los expertos a utilizar formulaciones como “más probablemente sí/no que no/sí” es que muchos desarrolladores tienen algoritmos que les permiten hablar de la “inteligencia” de los sistemas. Pero, ¿cómo funcionan no en stands de exposición, sino en objetos reales?
Por ejemplo, no hace mucho uno de los autores de las especificaciones técnicas habló de un sistema creado sobre la base de algoritmos neuronales. Este es, si se quiere, un ejemplo clásico de sistema de autoaprendizaje. Mostró resultados notables en una versión de maqueta, pero para entrenarla, supuestamente, necesitaba que le mostraran varios miles de videos filmados en diversas condiciones y, lo más desagradable, la mitad de ellos tenía que contener la situación detectable objetivo: el intruso. Imagínese la tarea: en un objeto específico, filmar al menos mil veces a una persona que simula un intruso, realizando la penetración de diferentes maneras, es conveniente abarcar lo más ampliamente posible todas las formas y métodos posibles de penetración. Y para generalizar tal procedimiento, es necesario realizar el mismo procedimiento en miles de objetos. Son millones de experimentos. Lo que es peor: la muestra experimental, capaz de procesar sólo unas pocas docenas de ejemplos, funcionó relativamente bien en un Pentium de 3 GHz. Y si amplía sus capacidades para dominar millones de ejemplos, necesitará un grupo de al menos mil computadoras, todas para procesar una única señal de video.
Pero, al grano. Unas palabras del experto de turno de la sección, el jefe del departamento técnico de la compañía ISS, Alexander KOSOSVSKY.
Los sistemas de videovigilancia inteligentes proporcionan reconocimiento facial y pueden ayudar a encontrar a un delincuente.
Hoy esto es más un mito que una realidad. Al menos en lo que se refiere a objetos con un gran tránsito de personas (estaciones de tren, calles de la ciudad, estaciones de metro). El reconocimiento facial en general es quizás la más difícil de las tareas para las que se utilizan tecnologías de análisis de vídeo. Para que el sistema de reconocimiento facial funcione, es necesario garantizar una serie de condiciones: seleccionar e instalar correctamente el equipo, asegurarse de que la base de datos contenga fotografías de alta calidad utilizadas para la identificación. El aspecto organizativo del proceso también es muy importante: el flujo de personas debe caer «correctamente» en el campo de visión de las cámaras de vídeo para que el sistema pueda «captar» a cada persona individual de la multitud.
Por lo tanto, repito, en condiciones de grandes aglomeraciones de personas, por ejemplo, en el flujo de pasajeros en una estación de metro durante las horas pico o en un estadio durante un evento deportivo importante, es casi imposible hacer esto. Pero está justificado y lógico utilizar un sistema de reconocimiento facial en la zona de control de pasaportes del aeropuerto, donde es muy posible crear las condiciones de iluminación necesarias, instalar correctamente cámaras de video y garantizar que se capture el rostro de cada pasajero. La identificación se realiza de forma inadvertida; no existe contacto físico entre el usuario y el sistema. Esto también hace que los sistemas de reconocimiento facial sean indispensables para controlar el acceso a instalaciones especialmente protegidas con control de acceso. Todo esto es cierto, pero no nos olvidemos de una condición como la presencia de fotografías de CALIDAD de las personas buscadas. Estos no siempre se encuentran ni siquiera en las bases de datos de los organismos encargados de hacer cumplir la ley. Supongamos que están buscando a un reincidente que fue fotografiado por última vez hace diez años. Entonces era gordo y tenía el pelo corto, pero ahora ha perdido peso, se ha dejado crecer el pelo y hasta se ha dejado bigote. ¿El sistema lo identifica? Es poco probable, hoy en día no existen los algoritmos necesarios para ello. Y basándose en los bocetos de los sospechosos, se puede detener con seguridad a un tercio de la población rusa, — Centrándose en ellos, cualquier inteligencia artificial se volverá loca.
Los análisis de vídeo son principalmente detectores de movimiento o detectores de objetos abandonados.
Todo lo que hoy entendemos bajo el concepto generalizado de “análisis de vídeo” comenzó con los detectores. Y hoy en día los detectores de movimiento son un componente indispensable de cualquier sistema de videovigilancia. ¿Qué son los detectores de movimiento modernos? Estos son dispositivos con un número ilimitado de zonas de detección y configuraciones de sensibilidad individuales para cada una de ellas, independientemente de la cantidad de canales de video procesados simultáneamente, esta es una configuración para detectar objetos de parámetros específicos; Un detector de movimiento de este tipo es una tecnología moderna verdaderamente eficaz para el procesamiento de vídeo inteligente. Hoy en día, la tarea prioritaria de los desarrolladores es «hacer» que el sistema de videovigilancia funcione de la forma más automática posible, sin intervención humana. Por lo tanto, varios sistemas contienen no sólo detectores de movimiento, sino también detectores de rotación y detectores de luz/superposición de cámaras de vídeo. Hay intentos exitosos de implementar mecanismos inteligentes de búsqueda en un archivo de video, de modo que el operador no necesite revisar el archivo de grabaciones de video, sino solo especificar un parámetro, un evento, por ejemplo, el hecho de que aparece una determinada persona. en un fotograma de vídeo, para ver el fragmento de vídeo correspondiente.
El detector de objetos abandonados es un componente más complejo de un sistema de videovigilancia; está diseñado para establecer la presencia de un objeto u objetos de ciertos parámetros en el campo de visión de las cámaras de video. Dicho detector se puede utilizar para garantizar la seguridad de lugares concurridos, locales tecnológicos, carreteras, donde la presencia no autorizada de personas u objetos representa una amenaza potencial. El detector de objetos abandonados tiene todas las razones para ser utilizado para el monitoreo por video del metro, estaciones de tren, aeropuertos, centros comerciales, entretenimiento, complejos deportivos y lugares de eventos públicos. Otro ámbito de aplicación «sin explotar» de este módulo es la prevención de situaciones de emergencia mediante la detección de movimientos no autorizados de personas, vehículos, detección de objetos extraños en áreas tecnológicas y de producción, en pistas y carreteras.
La transición a las tecnologías de transmisión de señales de vídeo IP dará un poderoso impulso al desarrollo de sistemas inteligentes
Por ahora, esto es más un mito que una realidad. El hecho es que los algoritmos de compresión provocan distorsiones y artefactos. Además, naturalmente surgen precisamente en aquellos momentos en los que sucede algo interesante e importante desde el punto de vista de garantizar la seguridad y el control del objeto.
Es decir, todavía quedan problemas sin resolver, pero es bastante obvio que el uso de tecnologías de análisis de vídeo en sistemas IP es una tendencia establecida. Y esto, en mi opinión, es lógico: el desarrollo de las tecnologías IP impulsa el desarrollo de la videovigilancia en general. Y, por lo tanto, los especialistas se enfrentan a la tarea de implementar todos sus logros y desarrollos ahora en la plataforma IP. Los proyectos de propiedad intelectual tienen cada día más demanda y el porcentaje de pedidos de sistemas inteligentes aumenta, por lo que hay muchas razones para que estas dos áreas se desarrollen activamente «de la mano».
Las características técnicas de las cámaras IP crean ciertas dificultades para el procesamiento analítico de vídeo de la imagen de vídeo procedente de ellas. Por ejemplo, por la noche, la grabación de vídeo de las cámaras IP no se puede utilizar para reconocer las matrículas. Pero estoy seguro de que estos problemas son temporales y los fabricantes de equipos IP los resolverán en un futuro próximo.
Sistemas inteligentes permiten reconocer las matrículas de los vehículos
Esto es una realidad, en primer lugar, aunque sólo sea porque los sistemas con funciones de reconocimiento de matrículas son los más populares y demandados. Sus herramientas pueden resolver una amplia gama de tareas de usuario. De hecho, la demanda de una variedad de clientes es muy grande; es natural que el mercado se haya formado y esté mejorando constantemente las ofertas técnicas. Los sistemas actuales de reconocimiento de matrículas, tanto nacionales como importados, son sorprendentemente diferentes de sus predecesores, digamos, de hace cinco años.
Los desarrolladores lograron resolver muchos problemas complejos y los sistemas actuales ya no temen el deslumbramiento de los faros de los automóviles, la oscuridad y la suciedad de las matrículas. Los sistemas pueden operar en una amplia gama de condiciones externas y están integrados con radares, equipos tecnológicos y de seguridad, actuadores y bases de datos externas. Pueden realizar un seguimiento de los automóviles en un estacionamiento, controlar la flota de transporte de una empresa y registrar la carga, y monitorear el flujo de tráfico de una ciudad entera.
La probabilidad de reconocimiento incondicional (y este es el principal indicador de eficiencia operativa) para algunos sistemas modernos supera el 90%.