Algunos aspectos del reconocimiento automático de matrículas.
Algunos aspectos del reconocimiento automático de matrículas
Actualmente, existen más de la mitad mil millones de coches. Todos estos vehículos tienen un número de identificación único como marca de identificación principal. Un número de identificación de vehículo es esencialmente un número de registro que le otorga el derecho legal a conducir en la carretera.
El problema de identificar un automóvil por su matrícula es un aspecto importante del control y la garantía de la seguridad vial. Los productos capaces de resolver este problema tienen demanda en una variedad de áreas. Por ejemplo, empresas de transporte por carretera, aparcamientos, cooperativas de garajes, comunidades rurales, gasolineras, puntos de control de acceso al lugar, etc.
Cuando hablamos de un sistema de reconocimiento automático de matrículas (License Plate Recognition, LPR), nos referimos a un complejo de software o hardware que implementa algoritmos de reconocimiento automático de matrículas para registrar eventos relacionados con el movimiento de los automóviles, es decir. para automatizar la entrada de datos y su posterior procesamiento. Estrictamente hablando, un sistema LPR* es un dispositivo que registra el paso de un vehículo, lee su número de matrícula y lo envía a un sistema de procesamiento de datos ASCII.
Actualmente, existen muchos sistemas LPR* con diferentes niveles de calidad de reconocimiento, rendimiento y una variedad de funciones adicionales. Los productos con alto rendimiento y precisión de reconocimiento suelen ser muy caros. Su elevado coste no permite una implementación masiva. Consideremos los principios generales que subyacen al reconocimiento de matrículas para comprender las razones del alto coste de dichos sistemas.
Algoritmos y tecnologías para el reconocimiento de matrículas
Sin duda, la base de cualquier sistema LPR* son los algoritmos de reconocimiento utilizados. Las calificaciones de los desarrolladores en el campo de las matemáticas superiores modernas, el procesamiento de imágenes, las tecnologías de programación y optimización de programas, así como la presencia de una experiencia laboral significativa: todos estos factores determinan las características del sistema LPR, tales como:
- Probabilidad de reconocimiento.
- Velocidad de procesamiento.
- Capacidad de reconocer diferentes tipos de matrículas.
- Capacidad de trabajar con imágenes de diferente calidad.
Fig. 1. |
El reconocimiento de las matrículas estatales no es una tarea trivial en el ámbito de la visión técnica y la inteligencia artificial. Los algoritmos de localización y reconocimiento de matrículas utilizados son, por regla general, un secreto comercial y, por supuesto, no se publican. Sólo unas pocas empresas mencionan sus tipos y publican la secuencia de acciones.
Consideremos el funcionamiento del sistema LPR* usando el ejemplo de “TeleWizard*AUTO”, desarrollado por JSC Nordavind. A continuación se detallan las etapas clave secuenciales del reconocimiento de matrículas:
- Llevar la imagen original a una forma que no dependa de las condiciones de registro de la imagen (grado de iluminación, distribución desigual del brillo de las fuentes de luz, desenfoque, ruido, etc.).
- Identificación de áreas candidatas en la imagen resultante que potencialmente contenga una matrícula con un número.
- Realizar un análisis detallado de las áreas candidatas basado en una representación formal de las características de escala de la matrícula y reducir el espacio para búsquedas posteriores.
- Reducción de la imagen gráfica de la matrícula a un tamaño estándar con corrección de la calidad de la imagen.
- Determinación preliminar del tipo de matrícula (en relación con las normas vigentes).
- Extracción de caracteres individuales y su reconocimiento (análisis de caracteres por características clave, independientemente de la escala, fuente utilizada, distorsiones geométricas y roturas).
- Refinamiento de los resultados del reconocimiento basado en información sobre el tipo de matrícula y en base a resultados de fotogramas anteriores.
El resultado del algoritmo es información sobre el paso del vehículo, que contiene una línea con el número
reconocido, una foto fija con la mejor imagen del vehículo, información sobre el tiempo de paso del vehículo, etc.
De la secuencia de pasos presentada queda claro que los datos iniciales para el reconocimiento de la matrícula no se limitan
sólo a la imagen visual. Existe una gran cantidad de tipos de matrículas en el mundo, diferenciándose:
- las fuentes utilizadas (signos con símbolos de varios tamaños, latinas, cirílicas y otras fuentes);
- el color del fondo y de los símbolos (símbolos negros sobre un fondo claro o símbolos blancos sobre un fondo oscuro);
- las líneas numéricas en el número (una línea, dos* y tres líneas);
- la presencia o ausencia de un código de designación de región o una marca especial
- etc.
Tener en cuenta estas diferencias en las matrículas da una importante «ventaja» a aquellos desarrolladores de sistemas LPR* que utilizan esta información adicional en la lógica de sus algoritmos de reconocimiento. La información sobre la estructura de un carácter y su sintaxis puede aumentar significativamente la probabilidad de un reconocimiento correcto y, al mismo tiempo, reducir los requisitos de calidad de los algoritmos para extraer y reconocer caracteres individuales.
Tecnología de reconocimiento óptico de caracteres
La precisión de la tecnología de reconocimiento óptico de caracteres (OCR) contribuye significativamente a la calidad del sistema LPR* en su conjunto. Para comprender la complejidad del problema que se está resolviendo en esta etapa, considere el siguiente ejemplo sencillo. Digamos que en el sistema LPR* que se está desarrollando se requiere garantizar que la probabilidad de reconocimiento correcto de una matrícula en una imagen estática sea del 95%. Determinemos cuál debe ser la probabilidad de reconocer un solo carácter de una matrícula.
Dejemos que tres algoritmos precedan al reconocimiento directo de caracteres:
- Un algoritmo que localiza una matrícula en una imagen. Probabilidad
- Algoritmo de preprocesamiento, normalizando el contraste y el brillo, lo que corrige la imagen. Probabilidad
- Un algoritmo de extracción de caracteres que es responsable de encontrar y resaltar caracteres individuales en un letrero y pasarlos al algoritmo de reconocimiento de caracteres. Probabilidad
La probabilidad total de reconocimiento correcto, en para lograr el objetivo intervienen n algoritmos, determinados por la fórmula:
O, para nuestras condiciones:
Desde aquí no es difícil encontrar que la probabilidad total de reconocimiento de caracteres no debe ser menor que :
Por ejemplo, las principales placas de matrícula estatales rusas del nuevo tipo (con un código de región de tres dígitos) tienen 9 caracteres. Si la precisión general del reconocimiento óptico de matrículas debe ser al menos del 97,7%, entonces la precisión del reconocimiento de caracteres individuales debe ser al menos:
Es decir, se supone que de los 1000 caracteres suministrados a la entrada del módulo OCR*, ¡solo 3 pueden no ser reconocidos o ser reconocidos
incorrectamente!
Hoy en día se conocen bastantes métodos de OCR. Como ejemplo, considere el método estructural para reconocer estructuras esqueléticas
Imágenes utilizadas en una de las soluciones de JSC Nordavind. En los métodos estructurales, un objeto se describe como un gráfico, cuyos nodos son los elementos del objeto de entrada y los arcos son las relaciones espaciales entre ellos. Los métodos que implementan este enfoque suelen funcionar con imágenes vectoriales. Los elementos estructurales son las líneas que componen el símbolo.
Fig. 2.Variedad de tipos de matrículas |
En primer lugar, el personaje reconocido se somete al procedimiento de obtención de un esqueleto, para lo cual se puede utilizar cualquiera de los algoritmos conocidos descritos en la literatura pertinente. A continuación, para cada punto singular de la representación esquelética resultante del símbolo, se calcula un conjunto de características topológicas, las principales de las cuales son:
- Coordenadas normalizadas del punto singular (vértice del gráfico ).
- Longitud del borde hasta el siguiente vértice como porcentaje de la longitud de todo el gráfico.
- Dirección normalizada desde un punto dado hasta el siguiente punto singular.
- Dirección normalizada de entrada a un punto, salida de un punto.
- La curvatura del arco, más precisamente la curvatura «izquierda» y «derecha» del arco que conecta un punto singular con el siguiente vértice (la curvatura se calcula como la relación entre la distancia máxima desde los puntos del arco a la línea recta conectando los vértices con la longitud del segmento que conecta los mismos vértices).
Fig. 3. Ejemplo de características topológicas |
La Figura 3 muestra aproximadamente algunas de las características topológicas. La gráfica tiene cinco puntos singulares: a0, a1, a2, a3, a4. Al recorrer el gráfico a lo largo de la ruta a0,a1,a2… en el vértice a1 se muestran convencionalmente los siguientes signos: vector R1 – dirección de entrada al punto, vector R2 – dirección de salida del punto, vector R3 – dirección global al siguiente punto singular. El vector bidireccional h muestra la magnitud de la desviación «izquierda» del arco (a1, a2) de la línea recta es cero.
Para algunos códigos, el número de puntos singulares y, en consecuencia, el número de características topológicas es demasiado pequeño. Así, para un código correspondiente al símbolo “0”, no hay ninguna característica topológica, ya que no hay un solo punto singular. Por lo tanto, se pueden calcular y utilizar las siguientes características adicionales:
- Dimensiones y posiciones de los componentes y “agujeros”.
- “Negro” y Ancho “blanco” en la mitad superior del carácter.
- Curvas rectas modificadas.
Arroz. 4. Un intento de mejorar la imagen del símbolo. a) la imagen original del símbolo; b) el símbolo con líneas pegadas |
Las deflexiones se calculan como distancias desde los puntos de representación esquelética hasta el casco convexo de la representación construida.
Además, se recuerda la posición de los puntos de máxima deflexión. Para algunos códigos topológicos, el número de características topológicas puede ser bastante grande, lo que puede requerir un conjunto demasiado grande de estándares para el entrenamiento, por lo que en algunos casos solo se utiliza una parte de las características en el reconocimiento.
Un símbolo se determina después de comparar su descripción con códigos de los datos de la base de datos, y se selecciona el código topológico más cercano.
Si el personaje sigue sin ser reconocido después de pasar por el ciclo de reconocimiento, se intenta mejorar la imagen (Fig. 4) mediante las siguientes operaciones:
- Pegado de los extremos de las líneas en direcciones.
- Pegado de los extremos de las líneas en direcciones.
- Pegando puntos del esqueleto, situados a una distancia mínima entre sí.
- Descartando la línea más corta.
El método considerado no es óptimo. Sus desventajas incluyen una alta sensibilidad a los defectos de la imagen que alteran los elementos constituyentes. La vectorización también puede agregar defectos adicionales. Además, aún no se han creado procedimientos de capacitación automatizados efectivos para estos métodos (a diferencia de los métodos de plantillas y funciones), por lo que las descripciones estructurales generalmente deben crearse manualmente.
En los sistemas LPR* reales, el OCR complejo es A menudo se utilizan algoritmos que son una síntesis de varios métodos. De la descripción presentada queda claro que el funcionamiento efectivo del algoritmo OCR depende significativamente de la calidad de la imagen suministrada a la entrada.
¿Qué se entiende por buena calidad de imagen?
La tecnología de adquisición de imágenes determina la calidad de imagen promedio en la que tendrá que trabajar el algoritmo de reconocimiento. Obviamente, cuanto mayor sea la calidad de la imagen, mejores serán las condiciones bajo las cuales funciona el algoritmo de reconocimiento de matrículas y mayor precisión podrá lograr el sistema LPR.
Para obtener buenos resultados del algoritmo de reconocimiento de matrículas, las imágenes procesadas deben contener
sus placas:- Con una resolución espacial aceptablemente buena.
- Con una claridad aceptablemente alta.
- Con un contraste aceptablemente alto.
- En condiciones de iluminación aceptablemente buenas.
- En una posición aceptablemente buena y en el ángulo correcto.
Por supuesto, “aceptable” es una definición bastante arbitraria, aunque tiene un significado muy preciso. Algunas imágenes de problemas
típicos se muestran en la Figura 5.Fig. 5.Algunas imágenes problemáticas típicas Soluciones típicas
Quizás una de las aplicaciones más extendidas y populares de los sistemas LPR* sea el control de acceso al territorio de una instalación y al estacionamiento. Dentro de estas aplicaciones, ya podemos identificar el tipo principal de sistemas de reconocimiento de matrículas con una configuración de hardware y equipamiento del sistema típicos.
Un ejemplo de sistemas de reconocimiento de matrículas puede ser un sistema de reconocimiento de matrículas de control de acceso ( Vale la pena señalar que
en la mayoría de los casos, el sistema de reconocimiento de matrículas es solo una parte de un sistema de control de acceso integrado).Fig. 6.
El coche
llega
a la entradaFig. 7.
Crear una
imagen
digitalizada de un
automóvilFig. 8.
Leer
una matrícula
a partir de una imagen
digitalizada
de un vehículoFig. 9.
Permitir
acceder
y guardar
datos en la base de datosUn ejemplo de sistemas de reconocimiento de matrículas es un sistema de reconocimiento de matrículas de control de acceso (vale la pena señalar que
en la mayoría de los casos, un sistema de reconocimiento de matrículas es sólo una parte de un sistema de control de acceso integrado).Un coche se acerca a la puerta de un área protegida a la que quiere entrar. En el puesto de control hay una barrera y un semáforo que se ilumina en rojo, indicando que el paso está prohibido. Además, en la entrada hay instalada una cámara de vigilancia CCTV. La barrera, el semáforo y la cámara están conectados a una computadora de control con un sistema LPR* instalado que coordina las operaciones del sistema de control de acceso.
Si el sistema detecta la aproximación de un vehículo, el módulo LPR* intenta “leer” la matrícula dentro de la zona
control.Tras la lectura del número, el módulo LPR* transmite el número reconocido para su posterior toma de decisión. A continuación, el sistema de control de acceso y control de acceso envía el número al módulo de base de datos. El módulo de base de datos compara el número recibido con las listas de derechos de acceso y devuelve el indicador «acceso permitido» o «acceso denegado». Dependiendo del tipo de bandera, la aplicación de control de acceso abre la barrera y enciende o no la luz verde.
Además, la aplicación de control de acceso puede enviar información adicional como la fecha u hora de acceso a la barrera. Módulo de base de datos que se almacenará en el registro de eventos. Después de que el automóvil pasa (o sale), el sistema regresa a su
posición original y espera al siguiente vehículo.Conclusión
La La descripción general presentada de los principios del reconocimiento automático de matrículas deja claro cuán amplia es la gama de problemas que puede encontrar el LPR
I. Svirin
k. el llamado director general de JSC «Nordavind»,
A. Khanin
especialista jefe de Nordavind JSCFuente: revista « ; Algoritmo de seguridad» #3, 2010