• Blog
  • IA
  • ¿Qué es, cómo funciona y dónde se aplica la visión artificial?

¿Qué es, cómo funciona y dónde se aplica la visión artificial?

7min

Los seres vivos percibimos e interactuamos con nuestro entorno a partir de nuestros sentidos, entre ellos la visión. Desde hace décadas los científicos han buscado que los ordenadores y otros dispositivos electrónicos inteligentes emulen esa capacidad a través de la visión artificial. Aunque no es nueva, la visión artificial es una tecnología en plena evolución, debido al auge de la IA.

Índice

 ¿Qué es la visión artificial?

Podríamos definir la visión artificial como la disciplina científica que incluye diferentes métodos para adquirir, procesar, analizar y comprender las imágenes del mundo real con el fin de producir información numérica o simbólica que pueda ser gestionada por un sistema informático.  En síntesis, si la Inteligencia Artificial permite que los dispositivos de cómputo generen su propio pensamiento, la visión artificial consigue que los dispositivos obtengan información a la que acceden de manera visual para para que puedan utilizarla.  generen una acción en consecuencia

¿Cómo funciona la visión artificial?

Para emular la vista humana, los dispositivos necesitan adquirir, procesar, analizar y comprender imágenes.

Componentes de captación de datos

Deben estar dotados de subsistemas como: cámaras con luz y sensores de visión (capturador de fotogramas), procesadores de imágenes, conversor analógico a digital y en algunos casos otros sistemas avanzados de automatización y movimiento. 

Tecnología empleada

A nivel intangible, los sistemas de visión artificial basan su funcionamiento en un tipo de aprendizaje automático llamado aprendizaje profundo (Deep Learning) y una aplicación de redes neuronales conocida como red neuronal convolucional (o CNN por sus siglas en inglés). 

A través del aprendizaje profundo el dispositivo, mediante entrenamiento, aprenderá a reconocer elementos visuales; lo hará por su cuenta al, por ejemplo, visualizar una pieza una y otra vez, pudiendo llegar a diferenciar un detalle de otro. 

Luego, a través de las redes neuronales convolucionales, dividirá las imágenes analizadas apenas en píxeles a los que les asignará una etiqueta vía metadatos. 

A nivel matemático, las funciones convolucionales operan a través de dos funciones que generan una tercera, y de manera iterativa, permitirá generar una predicción sobre lo que la máquina está captando. 

Este es el mecanismo a través del cual el dispositivo dotado del algoritmo de aprendizaje profundo se entrenará para reconocer bordes, superficies, tonos y comprender las imágenes. 

Un ordenador dotado de visión artificial puede, por ejemplo, etiquetar objetos, tabularlos, clasificarlos y distinguir una pieza defectuosa que el ojo humano a simple vista no podría reconocer. 

El proceso

Aunque la visión artificial es algo que podemos utilizar para operaciones sencillas, como detectar intrusos en unas instalaciones o contar vehículos o personas de forma automática, una secuenciación sencilla de su aplicación en un entorno industrial podría ser:

  1. El dispositivo se enciende, apunta e ilumina el objeto o superficie a enfocar para lograr la visualización correcta y generar una imagen digital .
  2. Sobre esa imagen digital, el procesador ejecuta el software y los algoritmos de aprendizaje profundo para etiquetar, clasificar o procesar la imagen captada.
  3. El sistema utiliza la información captada para generar una acción, como dar una  instrucción a un robot y generar un informe.

Seguro que se te ocurren decenas de aplicaciones actuales de la visión artificial porque no es una disciplina nueva. Por ejemplo, los sistemas de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés) que reconocen el texto impreso en un documento y lo convierten en digital.

 ¿Dónde se aplica la visión artificial?

Las implementaciones de visión artificial han aportado excelentes resultados en algunas industrias. Estos son algunos de esos casos:

Empresas de manufactura

La actividad manufacturera es uno de los campos donde la visión artificial industrial encuentra una amplia variedad de usos, como herramienta indispensable en los procesos de automatización. 

Los dispositivos dotados con visión se conjugan con los sensores de internet de las cosas y otras aplicaciones IA para: 

  • Monitorear estaciones de trabajo automatizadas
  • Conteos físicos y control de inventarios
  • Determinación de parámetros de calidad, desperfectos, residuos, niveles de contaminantes
  • Impresión 3D
  • CNC- réplica y producción de piezas complejas y altamente precisas 

Sector médico

La visión inteligente está dotando a aparatos como tomógrafos o equipos de resonancia magnética de una mejor y mayor capacidad para procesamiento de imágenes y su vinculación con bases de datos para generación de informes médicos.

Así, las tecnologías de visión inteligente están transformando las aplicaciones de imagenología médica y optimizando los flujos de trabajo para ayudar a mejorar la atención al paciente con diagnósticos más rápidos y precisos.

La conducción autónoma

Otro campo donde la visión artificial está abriendo caminos es en el campo de la industria automotriz y las implementaciones de conducción asistida o autónoma.  Los sensores inteligentes con los que están dotados este tipo de vehículos reconocen y hacen seguimiento de objetos en tiempo real para recopilar datos en milésimas de segundo de todo lo que sucede alrededor de la unidad y activar cualquier mecanismo o acción en consecuencia. 

Logística y comercio

En el comercio minorista, las máquinas auto-pago están empleando la visión artificial para mejorar la experiencia al cliente e implementar aquel modelo de atención sin cajas registradoras. En el sector logístico, se utiliza para el control y seguimiento de las mercancías.

Sector gubernamental o público

Las ciudades inteligentes emplean la visión artificial para monitorizar la seguridad ciudadana y el cumplimiento de las regulaciones del tráfico. Del mismo modo,  permite controlar, por ejemplo, el tiempo del cambio de luz en los semáforos o apoyar en labores de aduana. 

Implementaciones de la visión artificial a nivel personal

Existen dispositivos dotados de visión artificial que se emplean como tecnología de apoyo para personas invidentes, ya que pueden reconocer cualquier tipo de texto y reproducirlo en voz, a través de algoritmos de reconocimiento óptico de caracteres.

De manera similar, podemos citar a Google Translate, a través del cual los usuarios pueden apuntar su dispositivo inteligente a cualquier cartel en un idioma extranjero y obtener de inmediato la traducción en su lengua nativa. 

Como habrás podido apreciar,  la visión artificial es una tecnología poderosa que tiene el potencial de apoyar y mejorar los procesos en muchas industrias. A medida que continúa desarrollándose, gracias a los avances de la IA, podemos esperar aún más aplicaciones comerciales en el futuro. Esta tecnología fomenta el poder de la automatización, posibilita que aún más aplicaciones se conecten y trabajen en conjunto para la mejora de procesos y permite que la comunicación entre máquinas y humanos sea más productiva.

Fernando Fuentes

Productos relacionados: