Reconocimiento de imágenes

4min

Una de las más interesantes utilidades de la Inteligencia Artificial es el reconocimiento de imágenes, mediante el cual se pueden clasificar imágenes de manera automatizada, así como obtener información que resulte de utilidad.

Las aplicaciones del reconocimiento de imágenes pueden ser diversas. Muchas de ellas las encontramos en nuestro día a día.

  • Google Images es capaz de buscar imágenes en Internet similares a cualquiera que sea proporcionada.
  • Facebook es capaz de saber qué personas aparecen en una fotografía.
  • Los dispositivos son capaces de desbloquear el sistema cuando reconocen la cara del dueño, o evitar que se bloquee la pantalla si perciben que esta persona está leyendo la pantalla.
  • Google maps usa el reconocimiento de imágenes, entre otras cosas, para difuminar la cara de las personas o las matrículas de los coches de «street view», con el objetivo de evitar mostrar información personal.
  • Muchos coches ya son capaces de reconocer si nos estamos desviando de la trayectoria adecuada en la conducción para advertirnos o simplemente rectificar la dirección.

Son solo algunas aplicaciones de nuestro día a día, aunque los casos de uso en general son inmensos. Por ejemplo, un software de elearning podría ser capaz de saber si el estudiante está prestando atención a la exposición del profesor o si está haciendo cualquier otra cosa. Una marquesina en el metro podría mostrar una u otra publicidad dependiendo del tipo de persona que está pasando por el corredor. Parecen utilidades de ciencia ficción pero quizás formarán parte de nuestras vidas en un futuro más cercano de lo que pensamos.

Índice

Cómo funciona el reconocimiento de imágenes

En todo caso, hoy no es necesario disponer de una infraestructura compleja para crear sistemas capaces de reconocer imágenes y extraer información de ellas. Para ello disponemos de de lenguajes y librerías enfocadas en Machine Learning que funcionan en cualquier tipo de ordenador personal o servidor. Python o el lenguaje R son dos aliados habituales para construir este tipo de sistemas.

El funcionamiento del Machine Learning se basa en ofrecer a la máquina un conjunto, lo más amplio posible, de muestras que pueda usar para el aprendizaje. A partir de sus librerías es posible entrenar el sistema y realizar tests de reconocimiento. Una vez puesto a punto el sistema seremos capaces de ejercitarlo con cualquier imagen nueva. Si hemos dispuesto de una buena cantidad de material de base, los algoritmos actuales garantizan muy buenos resultados de acierto.

Plataformas de desarrollo para reconocimiento de Imágenes con Machine Learning

Actualmente gracias a las capacidades del cloud es posible obtener toda la capacidad de cómputo, memoria y almacenamiento necesario para construir sistemas de Machine Learning, sin tener que invertir en infraestructura y pagando solamente por el uso.

Dos plataformas muy apropiadas para el desarrollo de cualquier aplicación de inteligencia artificial son los JupyterLab y RStudio, que nos ofrecen un entorno integrado para el desarrollo con Python y otros lenguajes de programación como R. Estas plataformas son de código abierto e integran todas las necesidades para la creación del sistema de reconocimiento de imágenes, desde la edición del código, el almacenamiento y manipulación de los archivos de las imágenes, hasta la ejecución de los programas de reconocimiento.

Gracias al cloud de Arsys instalar y configurar Jupyter Notebooks o RStudio es tan sencillo como crear una máquina virtual y seleccionar la aplicación que deseamos en el formulario de alta. Para más información os recomendamos la lectura de artículos publicados previamente en nuestro blog, en los que explicamos cómo trabajar con estas herramientas y cómo crear nuestros primeros ejemplos prácticos de Machine Learning.

Fernando Fuentes

Productos relacionados: