Roberto Montejano.
Roberto Montejano KAM&BDM Casmar Electrónica

Aplicaciones de inteligencia artificial en soluciones basadas en vídeo

Inteligencia artificial en vídeo.

La disponibilidad de enormes cantidades de datos (Big Data), sobre todo en imagen, vídeo y texto, proporciona la “materia prima” para entrenar modelos complejos de redes neuronales, más conocidos como modelos de aprendizaje profundo o Deep Learning.

Los grandes avances tecnológicos en los últimos años nos han permitido disponer de grandes capacidades de computación a precios asequibles. El desarrollo de las diferentes opciones para implementar el aprendizaje automático a nivel hardware por los diferentes fabricantes, apostando por enfoques distintos sobre cómo construir la arquitectura más adecuada para cada aplicación de inteligencia artificial –como, por ejemplo, GPU, TPU, NPU o FPGA–, con sus consecuentes ventajas e inconvenientes, ha propiciado la disponibilidad de poderosas herramientas para desarrollar soluciones para entrenar modelos complejos de redes neuronales.

Afortunadamente, la aplicación de esta tecnología al procesado de vídeo ha repercutido directamente en la creación de potentes algoritmos basados en redes neuronales artificiales capaces de procesar ingentes cantidades de datos proporcionados por las imágenes, así como entrenar modelos con billones de parámetros. Podemos afirmar con rotundidad que la inteligencia artificial está aportando avances inimaginables hace tan solo pocos años en aplicaciones cotidianas para seguridad, más concretamente en aquellas donde el vídeo está presente.

Sistemas DAI para tráfico

El Deep Learning en sistemas DAI (Detección Automática de Incidentes), nos proporciona una solución fiable para la detección de incidentes y anomalías en el tráfico, no solo en las típicas aplicaciones en túneles, sino también en carreteras e intersecciones.

Los sistemas DAI que trabajan con Deep Learning están basados en un peculiar y realista método matemático de seguimiento de objetos en movimiento 3D (en tres dimensiones), reduciendo drásticamente las falsas alarmas y simplificando al máximo la calibración de los algoritmos de tráfico deseados.

Con el uso de la inteligencia artificial y el aprendizaje profundo, las falsas alarmas se reducen aún más. De hecho, el software es capaz de identificar los tipos de objeto que se mueven por la escena, reduciendo los problemas típicos de un sistema DAI estándar como las oclusiones que dificultan el proceso de análisis.

Los sistemas DAI que trabajan con ‘Deep Learning’ están basados en un peculiar método matemático de seguimiento de objetos en movimiento 3D

Además, los problemas causados por baja iluminación y malas condiciones climatológicas, donde usualmente se usan cámaras térmicas para mantener los rangos de detección, pueden ser drásticamente reducidos, permitiendo incluso el uso de cámaras CCTV en rango visible en exteriores, todo ello sin pérdida en el rendimiento en la capacidad de análisis. Asimismo, tendremos mucha más flexibilidad en la ubicación de la cámara gracias a la capacidad del software de distinguir objetos, incluso si están muy cerca uno del otro.

Inteligencia artificial en vídeo.

Podemos asegurar rotundamente que, si las condiciones ambientales no son suficientes para ejecutar el análisis de tráfico adecuadamente sin el uso de otras tecnologías como la térmica, el software basado en Deep Learning es la opción perfecta para mantener altos rendimientos con el uso de cámaras estándar en rango visible.

Sistemas OCR

El uso de redes neuronales y de visión artificial es una potentísima herramienta en los sistemas de reconocimiento óptico de caracteres. Eleva la fiabilidad de lectura hasta un 98 por ciento, incluso a muy altas velocidades en modo Free Flow.

Estos sistemas de reconocimiento automático de matrículas nos proporcionan detección y reconocimiento de las placas de vehículos y ciclomotores, con una tolerancia a la perspectiva inalcanzable por los sistemas OCR (Optical Character Recognition) clásicos. Permiten leer hasta ocho matrículas en una sola imagen.

Los sistemas OCR basados en redes neuronales artificiales permiten implementar analíticas de tráfico con una elevada tasa de fiabilidad, tales como:

  • Lectura de matrículas: tolerante a perspectiva, alta y baja velocidad. Incluso embarcada en vehículos policiales.
  • Cálculo de velocidad (3D).
  • Paneles indicadores de velocidad, foto stop, giro indebido y estudios estadísticos de velocidad.
  • Detección de maniobras prohibidas
  • Clasificación de vehículos (3D): marca y color.

Los sistemas de reconocimiento de contenedores son una aplicación directa en el sector logístico gracias a la identificación en movimiento de estos, ya sea en puertos, aeropuertos, trasporte ferroviario o plataformas logísticas de cualquier tipo. Usando el ID para el seguimiento y control de mercancías en la cadena de transporte, vinculando, por ejemplo, la matrícula del vehículo al ID del contenedor.

Un OCR cuya tasa de fiabilidad es tan alta nos sitúa en un contexto que permite su aplicación en mercados cuya aplicación es obvia y donde la lectura de caracteres aporta beneficios, tanto en la fiabilidad y automatización de los procesos como en la minimización de los tiempos de espera.

Otra aplicación típica es la lectura de placas de mercancías peligrosas, que permite tener la información puntual y precisa sobre el tipo de mercancía transportada y vinculada al vehículo que la traslada, ya sea para su registro y control o para actuar adecuadamente ante un accidente. Se trata de una aplicación típica en túneles, poblaciones, aeropuertos y zonas sensibles.

¡Sigue Leyendo!

Aquí te hemos mostrado tan solo un resumen de este artículo.

¿Quieres leer el artículo completo?

Leer Completo
Contenido seleccionado de la revista digital