viernes, 15 de noviembre de 2013

5.2 Visión por computadora

La visión por computadora es una rama de la inteligencia artificial que tiene por objetivo modelar matemáticamente los procesos de percepción visual en los seres vivos y generar programas que permitan simular estas capacidades visuales por computadora.

Tienen como fin último extraer propiedades del mundo a partir de un conjunto de imágenes. El guiado de un vehículo autónomo, la evaluación automática de la calidad de una pieza de cerámica o la inmersión automática de un personaje gráfico en una película, son algunos ejemplos de aplicaciones actuales de la visión por computadora.
Sus antecedentes se remontan a los años veinte, cuando se mejoró la calidad de las imágenes digitalizadas de los periódicos, enviadas por cable submarino entre Londres y Nueva York. Actualmente existen vehículos autónomos que han viajado de costa a costa en Estados Unidos y sólo han sido asistidos por un operador humano, el 3% del tiempo.

"El propósito de la visión artificial es programar un computador para que "entienda" una escena o las características de una imagen."

Los objetivos típicos de la visión artificial incluyen:
  • La detección, segmentación, localización y reconocimiento de ciertos objetos en imágenes (por ejemplo, caras humanas).
  • La evaluación de los resultados (por ejemplo, segmentación, registro).
  • Registro de diferentes imágenes de una misma escena u objeto, es decir, hacer concordar un mismo objeto en diversas imágenes.
  • Seguimiento de un objeto en una secuencia de imágenes.
  • Mapeo de una escena para generar un modelo tridimensional de la escena; este modelo podría ser usado por un robot para navegar por la escena.
  • Estimación de las posturas tridimensionales de humanos.
  • Búsqueda de imágenes digitales por su contenido.
Estos objetivos se consiguen por medio de reconocimiento de patrones, aprendizaje estadístico, geometría de proyección, procesamiento de imágenes, teoría de grafos y otros campos. La visión artificial cognitiva está muy relacionada con la psicología cognitiva y la computación biológica.

El proceso de visión por computadora puede subdividirse en seis áreas principales:

1. Sensado: Es el proceso que nos lleva a la obtención de una imagen visual.

2. Preprocesamiento:  Técnicas de reducción de ruido y enriquecimiento de detalles en la imagen.

3. Segmentación: Es el proceso que particiona una imagen en objetos de interés.

4. Descripción: Trata con el cómputo de características útiles para diferenciar un tipo de objeto de otro.

5. Reconocimiento: Es el proceso que identifica esos objetos.

6. Interpretación: Asigna un significado a un conjunto de objetos reconocidos.



Esquema general de visión por computadora.



Filtros para eliminación de imágenes

A las imágenes que no son interesantes para la computadora se le define como ruido, existen una gran cantidad de algoritmos para la restauración y mejoramiento de imágenes. Las técnicas de filtraje son transformaciones de la imagen pixel a pixel, que no dependen solamente del nivel de gris de un determinado pixel, sino también del valor de los niveles de gris de los pixeles vecinos de la imagen original. El proceso del filtraje se realiza utilizando matrices denominadas mascaras, que son aplicadas sobre la imagen. La imagen resultante de la aplicación de un filtro es una nueva imagen. Los filtros sirven para visualizar o realzar detalles de la imagen, o inclusive minimizar efectos de ruido.

Existen diferentes formas de filtrar las imágenes, enseguida se mencionara algunas de ellos:

  • Filtro gaussiano
  • Filtro mediana (rango de vecindades)
  • Filtro de suavizado direccional (preservación de bordes)
  • Filtro de suavizado conservador
  • Realce de contraste
  • Filtro por paso bajo
  • Filtro de paso alto
  • Filter SUSAN (Smallest Univalue Segment Assimilating Nucleus)

Conclusion:

Como hemos visto, a la visión artificial le compete estudiar la estructura física tridimensional del mundo para el análisis automático de imágenes. Sin embargo, es necesaria la calidad en el uso de imágenes. Primero, analicemos una simple imagen es de dos- dimensiones y, por lo tanto, perdemos inevitable la información en el proceso de la proyección, es decir en pasar de un mundo tridimensional a una imagen de dos dimensiones, es importante conocer como es que se lleva a cabo este proceso, ya que en una persona, se hace naturalmente y no percibimos el mecanismo de visión, pero en una computadora es necesario percibirlo y entenderlo para poder llevarlo a cabo.

Referencias:



No hay comentarios:

Publicar un comentario