SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Downloaden Sie, um offline zu lesen
VISION ARTIFICIAL
Luis David Arias & Mateo Restrepo
Diciembre 2015
Universidad Tecnológica de Pereira
Facultad De Ingenierías
Ing. De Sistemas Y Computación
Técnicas De La Comunicación
2
Prólogo
La visión es algo maravilloso, igual que los otros sentidos, nos permite percibir todos los
colores, formas y relieves que se nos presenten; todo gracias a que poseemos dos ojos con la
capacidad de recibir luz, calcular distancias y enviar impulsos eléctricos a nuestro cerebro
para comprender algo que entendemos como “imagen”. ¿Pero qué sucede con las personas
que no poseen este sentido, o que lo perdieron a través del tiempo? ¿Cuál es la forma de
percibir el mundo para una persona con discapacidad visual? Entre los métodos de
comunicación de una persona invidente están el hablar y el escuchar, pero cuando hablamos
de comunicar información que necesariamente debe ser visual ¿Qué métodos se pueden
utilizar?, Aquí es donde entra la visión artificial, estuvimos analizando los métodos que
presenta esta nueva tecnología, y parecen muy convincentes. En la actualidad existen muchos
programas para esta clase de problemas, puede ser algo tan simple como usar un teclado de
lenguaje braille o un lector de caracteres, pero la visión artificial nos ofrece algo más que
eso, nos ofrece la capacidad de interpretar o reducir imágenes que ningún otro lenguaje ha
podido hacerlo. Espero que este recorrido los motive a ustedes, los futuros ingenieros,
inventores del mañana, para usar esta tecnología, la cual está ahí esperando evolucionar para
cambiar la vida de las personas que más lo necesitan.
CONTENIDO
INTRODUCCIÓN............................................................................................................................. 6
CAPITULO I..................................................................................................................................... 8
EMPEZANDO A TRABAJAR CON VISION ARTIFICIAL ...................................................... 8
1. Sistema de visión artificial........................................................................................................ 8
1.1 Núcleo del sistema de visión artificial...................................................................................... 10
1.1.A Segmentación:........................................................................................................................ 10
1.1.B Representación y descripción .............................................................................................. 10
1.1.C Clasificación........................................................................................................................... 10
1.2 Interpretación............................................................................................................................ 11
CAPITULO II.................................................................................................................................. 12
INTERFERENCIAS DE TRABAJO ............................................................................................ 12
2. Interferencias técnicas y de optimización ............................................................................. 12
2.1 RUIDOS TÉCNICOS.............................................................................................................. 12
2.1.A Salt and pepper...................................................................................................................... 12
2.1.B Ruido uniforme...................................................................................................................... 13
2.1.C Ruido Gaussiano.................................................................................................................... 13
2.2 Interferencias debidas al contexto ........................................................................................... 14
2.2.A Punto de vista......................................................................................................................... 14
2.2.B Oclusión.................................................................................................................................. 14
2.2.C Escala...................................................................................................................................... 15
2.2.D Deformación........................................................................................................................... 15
2.2.E Fondo desordenado................................................................................................................ 16
2.2.F Variaciones dentro de una misma clase............................................................................... 16
CAPITULO III................................................................................................................................ 17
APLICACIONES ACTUALES DE LA VISION ARTIFICIAL ................................................ 17
3.1 Aplicaciones industriales de la visión artificial................................................................. 17
3.1.1 Metrología óptica 2D y 3D.............................................................................................. 17
3.1.2 Orientación y posicionamiento de objetos..................................................................... 18
3.2 Aplicaciones biomédicas de la visión artificial.................................................................. 18
3.2.1 La visión artificial en la biología.................................................................................... 18
3.2.2 La visión artificial en la medicina.................................................................................. 19
4
3.3 Aplicaciones de biométrica para seguridad...................................................................... 20
3.3.1 Huellas dactilares ............................................................................................................ 20
3.2.2 Detección de caras........................................................................................................... 21
CAPITULO IV ................................................................................................................................ 23
EL OJO BIONICO ......................................................................................................................... 23
CONCLUSIONES........................................................................................................................... 25
BIBLIOGRAFIA............................................................................................................................. 26
5
INDICE DE FIGURAS
Ilustración 1. Procesos de la visión artificial....................................................................................... 8
Ilustración 2. Sistema de visión artificial............................................................................................ 9
Ilustración 3. Salt and pepper............................................................................................................ 12
Ilustración 4. Ruido Uniforme .......................................................................................................... 13
Ilustración 5. Ruido Gaussiano ......................................................................................................... 13
Ilustración 6. Punto de vista.............................................................................................................. 14
Ilustración 7.. Oclusión ..................................................................................................................... 14
Ilustración 8 Escala ........................................................................................................................... 15
Ilustración 9 Deformación................................................................................................................. 15
Ilustración 10 Fondo Desordenado ................................................................................................... 16
Ilustración 11 Variaciones dentro de una misma clase ..................................................................... 16
Ilustración 12. Metrología óptica 2D y 3D ....................................................................................... 17
Ilustración 13. Radiografía................................................................................................................ 19
Ilustración 14. Huella Dactilar .......................................................................................................... 20
Ilustración 15 Detección de Caras..................................................................................................... 21
Ilustración 16 Argus II ...................................................................................................................... 23
Ilustración 17 Vision con Argus II.................................................................................................... 24
6
INTRODUCCIÓN
“Utilizarías los ojos como nunca hasta entonces. Todo lo que siente se convertiría en algo
querido para ti. Tus ojos tocarían y abrazarían cada objeto que entrase en el radio de tu visión.
Y luego, por fin, verías y un nuevo mundo de belleza se abriría ante ti”- Helen Keller.
Lo que es claro, es que la visión artificial cambiará muchas vidas, pero primero, necesita ser
mejorada por nosotros, por eso este documento es un abrebocas a lo que podríamos llegar a
hacer con esta tecnología, no vamos a explicarles cómo hacerlo, pero si como lo han hecho
otros investigadores como usted y yo, que han empezado a realizar, pero que no han podido
completar, ahí están, esperando que lleguemos a construir el mañana y lo que será de esas
personas que lo conformaran.
En el mundo hay 314 millones de personas con discapacidad visual y Colombia posee un
total de 1.143.992 casos de personas con este problema, representando el 43.5% del total de
discapacitados del país.1
Parece ser un porcentaje alto para la gran cantidad de discapacitados
en Colombia, y que el estado invierte más en hacer estas estadísticas que destinar fondos a la
investigación.
Antes de poder entrar en el fabuloso mundo de la visión artificial, es importante conocer
cómo funciona la visión humana; el ojo humano es como una cámara fotográfica (de hecho
se tomó como referencia para ser inventada) está compuesto por un globo ocular el cual es
protegido por las cejas, las pestañas, los parpados y las glándulas lacrimales las cuales
mantienen húmeda la superficie; Este globo está compuesto por el iris que puede ser de varios
colores y la pupila que se abre y se cierra (como el diafragma de una cámara fotográfica) para
regular la cantidad de luz que entrará; Cuando la luz entra por la pupila, primero debe pasar
por una capa transparente y elástica llamado cristalino (como el lente de una cámara) la cual
refractara los rayos de luz hacia la membrana más interna del ojo, la retina, esta membrana
es la continuación del nervio óptico, la cual transmitirá la información al cerebro en forma
de impulsos eléctricos, gracias a unas células foto receptoras llamadas bastones y conos, los
bastones perciben la intensidad de la luz, y los fotones, perciben los colores (específicamente
rojo, verde y azul); Desde aquí empezamos a notar de que la manera en que trabaja la
información una cámara fotográfica es muy parecida a la del ojo humano, el lente, el
diafragma, el sensor, los colores RGB, la tecnología de estos instrumentos ha avanzado
demasiado, pero ¿Acaso una cámara fotográfica sabe que está fotografiando?, algunas
personas creerán que si por el simple hecho de encontrar alguna función en su cámara digital
que diga “Detección de rostros” o “Enfoque Automático”, estas funciones podrían tomarse
como ejemplo de lo que es la visión artificial, pero el asunto va más allá que detectar un
1 Colombia tiene 1,14 millones de personas con problemas visuales, ElPais.com.co
7
simple cambio de pixeles (no digo que todas las cámaras funcionen de esta manera), la verdad
es que aún falta mucho más por descubrir de este campo.
La visión artificial también conocida como visión por computador es una disciplina
científica, que utiliza diferentes métodos para adquirir, procesar, realizar un análisis y
comprender las imágenes del mundo real, generando información numérica o simbólica que
puedan ser entendidas por un computador.2
Así como los seres humanos usamos nuestros
ojos para tener una percepción del mundo real esto mismo trata de realizar la visión artificial
producir el mismo efecto para que las computadoras puedan percibir y entender una imagen
o una secuencia de imágenes. Esta comprensión se produce gracias a diferentes campos como
la geometría, la estadística, la física entre otras disciplinas que se aplican. La adquisición de
los datos se consigue por diferentes medios como secuencias de imágenes, vistas desde
diferentes cámaras de video o datos multidimensionales desde un escáner médico. La visión
artificial también la podemos ver como una rama de la inteligencia artificial la cual busca
modelar matemáticamente el proceso de percepción visual que poseemos los seres humanos
y se encarga de generar software que permite simular estas capacidades visuales desde una
computadora.
Otro ejemplo de visión artificial un poco más avanzado se presenta cuando subimos la típica
foto con los amigos a Facebook, y de repente vas a etiquetar a alguien y resulta que esta red
social ya sabía quién era esa persona, o cuando te piden las huellas dactilares para registrarte
en algún sitio, son algunas de las aplicaciones que veremos más adelante, por ahora,
disfrutemos de este recorrido de aprendizaje.
2
Definición Visión Artificial, Wikipedia
8
CAPITULO I
EMPEZANDO A TRABAJAR CON VISION ARTIFICIAL
1. Sistema de visión artificial
Ya teniendo definido lo que es visión artificial tenemos que entender cuáles son los
pasos necesarios para trabajar con esta tecnología, porque no es solo convertir una
imagen a matrices inteligentes, sino que la imagen debe pasar por un proceso de
limpieza, para luego detectar sus componentes e interpretarlos (ver Ilustración 1).
Ilustración 1. Procesos de la visión artificial
Debemos tener en cuenta que cuando trabajamos con imágenes tomadas del exterior,
estas representan un mundo real, y no ideal, por lo cual vamos a encontrar muchas
interferencias que debemos solucionar mediante otros métodos, la idea es que cuando
se vaya a procesar la imagen para su reconocimiento, esta tenga una excelente calidad,
de lo contrario podrían encontrarse muchas fallas.
En el siguiente proceso, como lo dice la Ilustración 1, debemos aplicar unas técnicas
del procesamiento de imágenes para identificar los elementos que necesitamos y
llevarlos hasta su interpretación, por ejemplo: “Necesitamos que nuestra cámara de
seguridad del museo, detecte cuando alguien intenta robar alguna de las obras”, una
solución a esto se implementaría detectando los 3 estados de la escena: el estado
normal de la obra, la interferencia del sujeto, y finalmente la irregularidad de la
continuidad en la escena (la obra ya no se encuentra).
Por último, tenemos la interpretación de los datos, expresados en un lenguaje que ya
comprende el computador para poder reaccionar a la información, tomando el
9
ejemplo anterior: “Nuestro sistema detectó que la obra identificada ya no se
encuentra”, lo más común es que se dispare una alarma, se cierren las salidas y se les
comunique al personal de seguridad para que emprendan la búsqueda del ladrón, todo
esto digno de una película de agentes.
Un sistema de visión artificial podría definirse de muchas maneras, en este capítulo
explicaremos un sistema simple que cumple con los procesos básicos mencionados
anteriormente (ver Ilustración 2).
Ilustración 2. Sistema de visión artificial
Como podemos apreciar, la entrada de nuestro sistema será una imagen a la cual se le
procesaran las interferencias encontradas, este procesamiento es a bajo nivel pero
muy sencillo, seguido de esto, obtendremos una nueva imagen un poco más limpia y
trabajable; En el núcleo del sistema de visión artificial se utilizan operaciones
aritméticas, lógicas y un poco de algebra lineal para poder cumplir con su propósito,
este procesamiento es a nivel medio; ya teniendo todos los atributos definidos, solo
faltaría interpretarlos, utilizando un procesamiento a alto nivel, el sistema reconocerá
los componentes de la imagen y dará una respuesta al usuario final (como el caso de
la alarma).
Todos estos sistemas se basan en una serie de algoritmos y técnicas que hacen uso de
uso de una variada de disciplinas matemáticas, entre ellas el álgebra lineal, con esta
10
disciplina, se pueden comprender las proyecciones del mundo real tridimensional en
imágenes bidimensionales, o inversamente, se puede utilizar la referencia
bidimensional para determinar la posición de un objeto 3D.
En algunos casos, las detecciones se consiguen mediante modelos de apariencia que
utilizan los histogramas de color3
de las imágenes, con modelos previamente
almacenados.
Los algoritmos dentro del núcleo del sistema de visión artificial varían según el
destino del software, ya que los algoritmos pueden enfocarse en la detección de
ciertos objetos, obtener la ubicación exacta según la perspectiva o proyectar un
escenario tridimensional según la reunión de otras imágenes.
1.1 Núcleo del sistema de visión artificial
Uno de los conceptos más complejos de entender se encuentran en esta fase de
la visión artificial, ¿Cómo sabemos que lógica utilizar después de limpiar una
imagen? No te vamos a decir el cómo hacerlo, pero si unos cuantos procesos que
debes tener en cuenta para formar tu núcleo de procesamiento.
1.1.A Segmentación:
En esta fase se debe dividir la imagen en partes u objetos que la constituyen,
tenemos que diferenciar lo que es un fondo y el objeto que necesitamos
analizar, para eso se utiliza la información previamente almacenada de los
histogramas de colores que se explicaron anteriormente; pero no solo se trata
de la distribución del color, también se puede segmentar la imagen según el
movimiento, regiones que sabemos que es el fondo, umbralización4
.
1.1.B Representación y descripción
En esta fase se etiquetan los objetos teniendo en cuenta la información
suministrada por la inspección de dicho objeto, la cual puede ser cuantitativa
o cualitativa, en la inspección cualitativa tenemos en cuenta las medidas del
objeto y sus ángulos de orientación, mientras que en la inspección cualitativa,
nos basamos en su color y textura.
1.1.C Clasificación
Esta fase consiste en reconocer los objetos de la escena a partir de las
características extraídas, estas características pueden estar representadas en
vectores o estructuras de datos definidas, además se debe identificar como
3
Histograma de color: En los campos de procesamiento de imagen y fotografía, un histograma de color es
una representación anterior de la distribución de color en una imagen.
https://es.wikipedia.org/wiki/Histograma_de_color
4
La umbralización tiene como objetivo convertir una imagen de escala de grises a una nueva con solo dos
niveles (blanco y negro, true and false, 0 y 1)
11
están relacionados en la imagen (Ej, el vaso está sobre la mesa, el cuadro se
encuentra en la pared), mediante algunos métodos como redes neuronales,
sistemas expertos, fuzzy logic, entre otros.
1.2 Interpretación
Este proceso depende del propósito del sistema de visión artificial, en esta
toma de decisiones normalmente se controlan aparatos mecánicos que
efectúan la manipulación de productos después de ser clasificados.
Teniendo claro cuáles son los procesos que conforman un sistema de visión artificial, estamos
listos para empezar a construir uno, cabe resaltar que el lenguaje de programación para
desarrollar estos sistemas es independiente de la lógica que vayamos a aplicar (como todos
los programas) uno de los lenguajes más utilizados para este tipo de software es MATLAB5
,
pero es decisión del desarrollador elegir el framework más adecuado y cómodo para su
trabajo.
En el siguiente capítulo nos enfocaremos en los problemas que se pueden presentar al trabajar
con imágenes tomadas del mundo real.
5
MATLAB descarga http://www.mathworks.com/products/matlab/
CAPITULO II
INTERFERENCIAS DE TRABAJO
2. Interferencias técnicas y de optimización
En el momento de aplicar los conceptos teóricos de la visión artificial encontrar
diferentes interferencias y problemas relacionados con el mundo que nos rodea. Esto
se presenta por el hecho de que nuestro mundo no es perfecto y los elementos que se
usan para la captura de imágenes tampoco lo son. Teniendo en cuenta estos problemas
se encuentran los siguientes tipos de ruidos:
2.1 RUIDOS TÉCNICOS
Esta clase de ruidos son ocasionados por el procesamiento digital de nuestros
dispositivos de captura, ya que estos no son tan avanzados como el ojo humano,
basta con tomar una fotografía de noche con nuestros teléfonos para encontrar
esta clase de ruidos.
2.1.A Salt and pepper
Es un ruido impulsivo que hace que los pixeles tiendan a un máximo
(blanco) y a un mínimo (negro). El efecto de este hace que tengamos
diversos puntos blancos y negros esparcidos a través de la imagen. Por
eso se denomina Salt and Pepper (Sal y pimienta), se denomina de esta
manera porque parece que la imagen hubiera sido roseada con estos
compuestos. Para solucionar este ruido podemos utilizar un 6
filtro de
promedio espacial pese a que se pierde definición en la imagen
podemos solventar este ruido.
Ilustración 3. Salt and pepper
6
Filtro de promedio espacial: Las operaciones de filtrado se llevan a cabo directamente sobre los píxeles de la imagen. En este proceso
se relaciona, para todos y cada uno de los puntos de la imagen, un conjunto de píxeles próximos al píxel objetivo con la finalidad de
obtener una información útil, dependiente del tipo de filtro aplicado, que permita actuar sobre el píxel concreto en que se está
llevando a cabo el proceso de filtrado para, de este modo, obtener mejoras sobre la imagen y/o datos que podrían ser utilizados en
futuras acciones o procesos de trabajo sobre ella.
13
2.1.B Ruido uniforme
Es un ruido que afecta la imagen teniendo blanco y negro de manera
uniforme sobre ella. El efecto que presenciamos a simple vista de este
es que percibimos interferencias en la imagen, como si esta se
encontrara codificada. Observamos una pantalla por encima de la
imagen llena de pixeles con valores aleatorios y expandidos
uniformemente, este ruido puede aparecer cuando se realiza el proceso
de cuantificación de una imagen.
Ilustración 4. Ruido Uniforme
2.1.C Ruido Gaussiano
Es un ruido que se deriva de los equipos de captura. El efecto en la
imagen parecerá al uniforme solo que los valores no son tan fuertes,
tienden más a ser grises que negros y blancos. Para solucionar este
problema podemos utilizar un filtro de promedio espacial con
coeficientes Gaussianos.
Ilustración 5. Ruido Gaussiano
14
2.2 Interferencias debidas al contexto
Este tipo de interferencias están más basadas en problemas del mundo real que en
problemas técnicos, pues ya dependen del dispositivo con el que se tomó la foto, y
al escenario que se está fotografiando.
2.2.A Punto de vista
Según como se encuentra la imagen orientada al observador. Un ejemplo claro
de esto es: Un animal no se ve igual de frente que de espaldas, aunque éste
sigue siendo un animal.
Iluminación: La cantidad de luz que recibe el objeto. Un objeto deberá ser
distinguible independientemente de si tiene alguna cara oscura debido a la
iluminación.
Ilustración 6. Punto de vista
2.2.B Oclusión
Un objeto puede estar en segundo plano, es decir, que otro objeto tape
parcialmente nuestro objetivo a la hora de extraerlo o analizarlo. Deberemos
ser capaces de saber interpretar que un objeto diferente está entre nuestro
objeto a extraer y el observador.
Ilustración 7.. Oclusión
15
2.2.C Escala
Factor que determina el tamaño de la imagen respecto al real. Un edificio no
parecerá tener el mismo tamaño dependiendo de la imagen capturada ya sea
por distancia, ángulo. Deberemos ser capaces de interpretar que un objeto
puede ser el mismo pese a que el tamaño en las fotografías pueda ser diferente.
Ilustración 8 Escala
2.2.D Deformación
Un objeto puede estar deformado debido a múltiples factores o simplemente
debido a errores de captura, o posicionamiento y ángulo de la captura.
Deberemos interpretar que el objeto pertenece a una categoría pese a sus
deformaciones.
Ilustración 9 Deformación
16
2.2.E Fondo desordenado
Un objeto puede estar en un contexto desordenado y caótico. Como por
ejemplo un mosaico. Deberemos saber distinguir el objeto entre el caos que le
envuelve.
Ilustración 10 Fondo Desordenado
2.2.F Variaciones dentro de una misma clase
Cierto tipo de objeto puede ser muy diferente a otro de su misma categoría,
Tenemos el ejemplo de cuando observamos una silla, que hay multitud de
sillas diferentes pero a todas les unen los mismos rasgos característicos: 4
patas, una placa donde sentarse, un reposo para la espalda.
Ilustración 11 Variaciones dentro de una misma clase
Depende de la manera que solucionemos estos problemas, que tipo de algoritmos o procesos
se apliquen, nuestro programa puede ser más o menos eficiente y fiable.
17
CAPITULO III
APLICACIONES ACTUALES DE LA VISION ARTIFICIAL
3.1 Aplicaciones industriales de la visión artificial
En la industria, como campo general de desarrollo, el reconocimiento de imágenes
está íntimamente ligado a un sistema de procesamiento que ofrezca una alta calidad
y seguridad en su utilización practica como es la Inteligencia Artificial.
Aunque la Inteligencia Artificial aun es un frente cambiante y en continuo desarrollo,
las bases de la visión artificial como parte de un sistema de IA han sido fuertemente
apoyadas por este sector, por el aprovechamiento de recursos que ello supone.
A continuación se exponen ejemplos de la visión artificial aplicadas en la industria, a
nivel de herramientas de trabajo y de productos finales de venta al usuario.
La inspección de productos industriales, el guiado de robots o el control del tráfico
son sólo algunas de las aplicaciones de los sistemas de visión artificial pero existen
otros más innovadores y de los que se tiene menos conocimiento.
3.1.1 Metrología óptica 2D y 3D
Diseño de sistemas industriales de visión artificial para control metrológico
en 2 y 3 dimensiones con el fin de detectar desviaciones respecto a las medidas
reales.
En el área de la metrología,
los sistemas de visión
artificial tratan de obtener
las magnitudes físicas del
objeto y verificar
posteriormente que se
corresponden con el patrón
exigido. Para ello se
desarrolla un software
capaz de detectar estos
aspectos y establecer si se
cumplen o no los
diferentes requisitos. Entre
las principales ventajas de
este sistema se encuentra
que no es necesario el contacto
con el objeto y la posibilidad de
realizar el control en el cien por cien de las piezas fabricadas. La visión
artificial permite verificar dimensiones de piezas industriales con precisión.
Ilustración 12. Metrología óptica 2D y
3D
18
La visión artificial puede alcanzar una precisión por debajo de la centésima de
milímetro, lo que le hace ser un sistema atractivo para su implantación en
industrias como la del automóvil.
Eusebio de la Fuente, del Departamento de Ingeniería de Sistemas y
Automática de la Universidad de Valladolid, asegura que la visión artificial
posibilita el control de distancias, el número de estrías, radios o ángulos de
una pieza industrial con gran precisión, ya que la medición se basa en sus
características geométricas como son las rectas o los círculos.
3.1.2 Orientación y posicionamiento de objetos
Diseño e implementación de sistemas de visión artificial para verificar la
posición y orientación de elementos dentro de cintas de transportes para su
manipulación posterior. Diseño de sistemas "pick and place" para
manipulación automatizada de productos en líneas de producción.
Recuento de productos en procesos complejos y de alta velocidad
Diseño e implementación de sistemas de visión artificial para conteo de
productos en transportes, estáticos... por ejemplo para empaquetado de
productos automatizado.
Control de calidad en procesos de producción
Detección de defectos en productos; aspecto, tamaño, longitud
Diseño e implementación de sistemas de visión artificial para control
dimensional (tamaño, longitud) y estético (defectos físicos) aplicado al control
de calidad de productos manufacturados en general tanto a nivel industrial
(piezas de automóviles, salpicaderos, lunas de coche, ladrillos, baldosas)
como de consumo.
3.2 Aplicaciones biomédicas de la visión artificial
3.2.1 La visión artificial en la biología
En el campo de la biología hay que distinguir entre dos tipos de aplicaciones
de visión artificial, aplicaciones microscópicas y macroscópicas.
Para aplicaciones microscópicas la estrategia a seguir es, mediante técnicas de
segmentación orientadas a regiones, la identificación de diferentes
propiedades de las células (color, forma, tamaño, etc) o bien, para contar el
número de microorganismos o células presentes en una muestra de la que se
ha obtenido una imagen.
En cuanto a las aplicaciones macroscópicas de lo que se trata es de la
identificación de determinados tipos de texturas en vegetales, o características
19
de diferentes áreas naturales por rasgos característicos, como color, grado de
floración o crecimiento de especies por diferencia de imágenes por ejemplo.
En concreto este último método también se emplea en la geología para detectar
movimientos de regiones.
3.2.2 La visión artificial en la medicina
En el campo de la medicina se dan un gran número de aplicaciones en las que
aparece la utilización de imágenes para la realización de diagnósticos de
diferentes enfermedades, como por ejemplo radiografías, resonancias
magnéticas, tomografías, etc.
Por tanto y gracias a la extensión de este campo hay un gran número de
aplicaciones: detección de tumores, arteroesclerosis, etc. Se pueden consultar
las últimas novedades en este tipo de aplicaciones en la revista IEEE Trans.
Medical Imaging.
A continuación se puede observar el proceso al que se somete una radiografia
(imagen original a), la selección de diferentes componentes de color, y otros
parámetros que se configuran para facilitar el análisis de la misma.
Ilustración 13. Radiografía
20
3.3 Aplicaciones de biométrica para seguridad
Otras aplicaciones no médicas de la visión artificial aplicada a la biomedicina es por
ejemplo la utilización de imágenes de huellas dactilares, caras o imágenes de retinas.
Para aplicar la biometría a la identificación de individuos deben cumplirse una serie
de requisitos: Permanencia. El rasgo a medir no debe cambiar en el tiempo (salvo
enfermedad).
Unicidad. El patrón debe tener una probabilidad muy baja de coincidir con el de otro
sujeto.
Universalidad. Toda persona debe tener dicha característica a observar.
3.3.1 Huellas dactilares
Para la identificación por medio de huellas
dactilares la estrategia a seguir es la observación de
puntos singulares, para que cumplan los requisitos
explicados en el apartado anterior.
Los puntos con mayor concentración de puntos
singulares (80%) se encuentran cuando se termina
una línea y donde se bifurca una línea. A estos
puntos se les llama minucias. Después a cada
minucia se le atribuye una posición y una
orientación. El proceso de obtención de las
minucias recibe el nombre de filtrado.
Una vez filtrada una huella para buscar
coincidencias con las huellas almacenadas en la
base de datos se realiza el emparejado.
Las huellas tienen una primera clasificación según
el patrón general que sigue, así, existe la
clasificación de Henry, que distingue 5 tipos de
huellas (right loop, left loop, whorl, arch y tented arch). Una vez clasificada la huella
dentro de uno de ellos se procede a buscar dentro del grupo apropiado la huella que
más se parece a la que deseamos identificar. Para esta parte también existe un gran
número de algoritmos, que no vamos a explicar. Es importante destacar que para este
proceso una comparación exhaustiva de las huellas almacenadas con la huella a
identificar es un proceso muy costoso, por lo que se recurre a algoritmos no tan
efectivos como el de “fuerza bruta” pero mucho más rápidos. Entre estos últimos las
mejores soluciones son las proporcionadas por redes neuronales, la transformada de
Hough o en algoritmos genéticos.
Ilustración 14. Huella Dactilar
21
3.2.2 Detección de caras
Existen infinidad de aplicaciones de detección de rostros, tanto para seguridad
como para otro tipo de aplicaciones, como por ejemplo en cámaras de fotos,
para que el enfoque automático sepa donde tiene que enfocar.
¿Cómo funciona el reconocimiento facial?
Como existe una gran cantidad de aplicaciones, el funcionamiento varía de
unas a otras, pero independientemente de los patrones empleados por cada
programa hay una serie de pasos comunes.
Una vez obtenida una imagen (ya sea empleando cámaras dedicadas a
aplicaciones de seguridad o webcams domésticas) el primer paso consiste en
la extracción de la cara de la imagen. Para ello se obtienen puntos singulares
con los que centrar la imagen, los ojos por ejemplo. De esta imagen centrada
se normaliza a un tamaño y profundidad específicos para después extraer
rasgos de ella (estos primeros pasos son comunes a la mayor parte de
aplicaciones de visión artificial):
Ilustración 15 Detección de Caras
A continuación se divide la imagen en bloques menores y se almacena en una
matriz:
22
Finalmente se procesan los datos de las nuevas imágenes y se
generan sus “Eigenfaces”, conjunto de vectores propios,
mediante un proceso matemático llamado ACP. Es decir
separamos la información de la cara en una serie de autovectores,
derivados del análisis estadístico de un gran número de rostros.
A la derecha podemos ver en la imagen el ejemplo de un
Eigenface.
Después comparándolos con los originales se obtiene el
porcentaje de coincidencia con el original.
Estas aplicaciones han sido un gran avance tecnológico, y demuestra que la visión artificial
es un campo muy amplio para trabajar, pero aún falta la aplicación que le da sentido a este
documento y a la cual de dedicamos un capítulo entero; El ojo biónico.
CAPITULO IV
EL OJO BIONICO
Quizás nuestros padres recordaran al hombre nuclear, también conocido como “The Six
Million Dollar Man”, un hombre que sufre un terrible accidente durante un vuelo, perdiendo
sus extremidades y su ojo izquierdo, una agencia gubernamental que trabajaba en un
programa secreto llamado Biónica toma a este hombre como sujeto de prueba y reemplaza
sus miembros perdidos por partes cibernéticas que tienen un costo de seis millones de dólares.
Esta historia no fue nada más que pura ciencia ficción de hace 30 años, pero aunque parezca
mentira, la mayoría de avances tecnológicos surgen gracias a estas ideas, y así paso con el
ojo biónico, que en este caso se llama Argus II7
, un sistema de prótesis de retina desarrollado
por la empresa californiana Second Sight.
El Argus II tiene por objeto proporcionar la estimulación eléctrica de la retina para inducir la
percepción visual en personas invidentes. Una microcámara alojada en las gafas del paciente
captura una escena y ésta se envía a un pequeño ordenador que el paciente lleva encima (la
unidad de procesamiento de vídeo o VPU, por sus siglas en inglés) donde se procesa y
transforma en instrucciones que se envían de vuelta a las gafas mediante un cable. Estas
instrucciones se transmiten de forma inalámbrica a la antena del implante de retina. Las
señales se envían al conjunto de electrodos, que emite pequeños impulsos de electricidad.
Estos impulsos pasan por alto los fotorreceptores dañados y estimulan las células que quedan
en la retina y que transmiten la información visual a través del nervio óptico al cerebro, para
crear la percepción de patrones de luz. Los pacientes aprenden a interpretar estos patrones
visuales con su implante de retina.
Ilustración 16 Argus II
7
Link de Second Sight http://www.secondsight.com/?lang=es
24
La imagen que se recibe con el implante está fragmentada, y lo que tiene que hacer el cerebro
es reconstruir la imagen, el reto en este proceso es saber que fragmento de la información
tomar, y en qué momento.
Ilustración 17 Vision con Argus II
Este dispositivo ha sido implantado en 30 pacientes quienes estaban completamente ciegos
antes de aplicarles la cirugía del implante, los resultados han sido excepcionales.
La visión de los pacientes se ve mejorada en el aspecto de la percepción luminosa ya que a
partir de esta se pueden identificar diversos objetos que se presentan en el campo de visión,
normalmente se les implanta a personas con retinitis pigmentaria, una enfermedad que se
caracteriza por la degeneración progresiva de la retina, lo que supone la pérdida gradual de
conos y bastones, ya explicados anteriormente.
A pesar de que este proyecto está más orientado a la biónica que a la ingeniería del software,
cabe resaltar que sin un buen sistema que reconozca las imágenes que transmite la cámara,
las interprete y envié señales de manera correcta al cerebro, este proyecto no tendría éxito;
así que aquí es donde entramos nosotros los desarrolladores, para ofrecer otras técnicas que
puedan evolucionar este grandioso invento.
CONCLUSIONES
La idea de visión artificial ha suscitado mucha imaginación y muchas preguntas al respecto,
ya que sus palabras sugieren algo nuevo y extraño. Se trata de una nueva herramienta que
busca dar solución a problemas de visión, y también de dar soluciones a procesos
industriales, a diagnosticar enfermedades en ramas como la medicina, innovación para el
desarrollo de sistemas de seguridad, entre otras aplicaciones que tiene. La evolución de esta
tecnología depende de nosotros, es un campo no muy explorado y que está esperando ahí
para cambiar la vida de muchas personas.
Con el desarrollo de este nuevo campo de la inteligencia artificial, se busca dar soluciones
a problemas que años atrás eran intratables, con el avance que este campo está presentando
día a día muy seguramente se les encuentre una pronta solución.
Para trabajar con visión artificial, es necesario tener unas buenas bases de algebra lineal y
tener claro que las aplicaciones que se desarrollen bajo este método deben ser pensadas en
un mundo real y no ideal.
BIBLIOGRAFIA
Es.wikipedia.org, (2015). Visión artificial. [online] Available at:
https://es.wikipedia.org/wiki/Visi%C3%B3n_artificial [Accessed 5 Dec. 2015].
YouTube, (2015). Ojo Biónico es una Realidad y Ayuda a Recuperar Vista a Invidentes. [online]
Available at: https://www.youtube.com/watch?v=uaO4JK8Ceq0 [Accessed 5 Dec. 2015].
Bernardo, A. and Bernardo, A. (2013). El primer ojo biónico del mundo, Argus II, comienza a usarse
en Estados Unidos. [online] Think Big. Available at: http://blogthinkbig.com/el-primer-ojo-bionico-
del-mundo/ [Accessed 5 Dec. 2015].
Secondsight.com, (2015). Second Sight Home Page. [online] Available at:
http://www.secondsight.com/ [Accessed 5 Dec. 2015].
YouTube, (2015). Visión artificial Argus II - Dr. Jeroni Nadal. [online] Available at:
https://www.youtube.com/watch?v=fIIOWJpU3Nw [Accessed 5 Dec. 2015].
YouTube, (2015). 01 - Curso De Visión Por Computador - Introducción. [online] Available at:
https://www.youtube.com/watch?v=3iUEWenA-VM [Accessed 5 Dec. 2015].
YouTube, (2015). La visión artificial. [online] Available at:
https://www.youtube.com/watch?v=h38G3ZM7zc8 [Accessed 5 Dec. 2015].
Sabia.tic.udc.es, (2015). Visión artificial e interacción sin mandos. [online] Available at:
http://sabia.tic.udc.es/gc/Contenidos%20adicionales/trabajos/3D/VisionArtificial/index.html
[Accessed 5 Dec. 2015].
Informe vision artificial

Weitere ähnliche Inhalte

Was ist angesagt?

Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...
Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...
Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...Telefónica
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidosTensor
 
Herramientas y Técnicas de Auditoria de Sistema For Ucc
Herramientas y Técnicas de Auditoria de Sistema For UccHerramientas y Técnicas de Auditoria de Sistema For Ucc
Herramientas y Técnicas de Auditoria de Sistema For Uccoamz
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptxRam Vazquez
 
Funciones y responsabilidades del auditor informatico
Funciones y  responsabilidades del auditor informatico Funciones y  responsabilidades del auditor informatico
Funciones y responsabilidades del auditor informatico DanielaEstefana2
 
Modelos de Inteligencia Artificial
Modelos de Inteligencia ArtificialModelos de Inteligencia Artificial
Modelos de Inteligencia ArtificialHugo Banda
 
Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...
Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...
Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...Sebastian G. Botasi
 
Fundamentos de la inteligencia artificial
Fundamentos de la inteligencia artificialFundamentos de la inteligencia artificial
Fundamentos de la inteligencia artificialAbner Gerardo
 
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICOKTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICOKOTENA BCS
 
5.2 Redes neuronales (RN) [presentación].
5.2 Redes neuronales (RN) [presentación].5.2 Redes neuronales (RN) [presentación].
5.2 Redes neuronales (RN) [presentación].Humberto Chalate Jorge
 

Was ist angesagt? (20)

Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...
Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...
Índice del libro "Malware moderno: Técnicas avanzadas y su influencia en la i...
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
Herramientas y Técnicas de Auditoria de Sistema For Ucc
Herramientas y Técnicas de Auditoria de Sistema For UccHerramientas y Técnicas de Auditoria de Sistema For Ucc
Herramientas y Técnicas de Auditoria de Sistema For Ucc
 
Introducción a R - con minería de datos
Introducción a R - con minería de datosIntroducción a R - con minería de datos
Introducción a R - con minería de datos
 
Trabajo ftp
Trabajo ftpTrabajo ftp
Trabajo ftp
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx
 
Funciones y responsabilidades del auditor informatico
Funciones y  responsabilidades del auditor informatico Funciones y  responsabilidades del auditor informatico
Funciones y responsabilidades del auditor informatico
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Modelos de Inteligencia Artificial
Modelos de Inteligencia ArtificialModelos de Inteligencia Artificial
Modelos de Inteligencia Artificial
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
 
Metodologia de wilson
Metodologia de wilsonMetodologia de wilson
Metodologia de wilson
 
Big data presentación
Big data presentaciónBig data presentación
Big data presentación
 
Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...
Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...
Interfaces Avanzadas: Superficies Multitáctiles, nuevos mecanismos de interac...
 
Fundamentos de la inteligencia artificial
Fundamentos de la inteligencia artificialFundamentos de la inteligencia artificial
Fundamentos de la inteligencia artificial
 
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICOKTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
 
Simulación
SimulaciónSimulación
Simulación
 
5.2 Redes neuronales (RN) [presentación].
5.2 Redes neuronales (RN) [presentación].5.2 Redes neuronales (RN) [presentación].
5.2 Redes neuronales (RN) [presentación].
 
Computación Grid
Computación GridComputación Grid
Computación Grid
 
Protocolos FTP y SFTP
Protocolos FTP y SFTPProtocolos FTP y SFTP
Protocolos FTP y SFTP
 

Andere mochten auch

Andere mochten auch (20)

Visión artificial
Visión artificialVisión artificial
Visión artificial
 
Visión artificial
Visión artificialVisión artificial
Visión artificial
 
Padem 2008 Conchali
Padem 2008  Conchali Padem 2008  Conchali
Padem 2008 Conchali
 
Paid Content: Bezahlloesungen (SCHICKLER Unternehmensberatung)
Paid Content: Bezahlloesungen (SCHICKLER Unternehmensberatung)Paid Content: Bezahlloesungen (SCHICKLER Unternehmensberatung)
Paid Content: Bezahlloesungen (SCHICKLER Unternehmensberatung)
 
410 burnout interventionen
410 burnout interventionen410 burnout interventionen
410 burnout interventionen
 
Vorstellung des vorstandes
Vorstellung des vorstandesVorstellung des vorstandes
Vorstellung des vorstandes
 
Salvemos a México del Güey
Salvemos a México del GüeySalvemos a México del Güey
Salvemos a México del Güey
 
Régimen contributivo y subsidiado
Régimen contributivo y subsidiadoRégimen contributivo y subsidiado
Régimen contributivo y subsidiado
 
2015 epcon stadt_als_energiequelle_v11
2015 epcon stadt_als_energiequelle_v112015 epcon stadt_als_energiequelle_v11
2015 epcon stadt_als_energiequelle_v11
 
Ashley burgos (la era precámbrica)
Ashley burgos (la era precámbrica)Ashley burgos (la era precámbrica)
Ashley burgos (la era precámbrica)
 
ITsax.de OpenNetwork: O4i
ITsax.de OpenNetwork: O4iITsax.de OpenNetwork: O4i
ITsax.de OpenNetwork: O4i
 
Diseño de proyectos educativos
Diseño de proyectos educativosDiseño de proyectos educativos
Diseño de proyectos educativos
 
306 bessere entscheidung
306 bessere entscheidung306 bessere entscheidung
306 bessere entscheidung
 
Los animales ....
Los animales ....Los animales ....
Los animales ....
 
GRNADES IMAGENES
GRNADES IMAGENESGRNADES IMAGENES
GRNADES IMAGENES
 
El Cuerpo Humano Translucido
El Cuerpo Humano TranslucidoEl Cuerpo Humano Translucido
El Cuerpo Humano Translucido
 
Gen Y (2.0)
Gen Y (2.0)Gen Y (2.0)
Gen Y (2.0)
 
Zugewinnausgleich intensiv 1
Zugewinnausgleich intensiv 1Zugewinnausgleich intensiv 1
Zugewinnausgleich intensiv 1
 
El Girasol (nº12)
El Girasol (nº12)El Girasol (nº12)
El Girasol (nº12)
 
Eröffnungspräsentation vom #LATC2017
Eröffnungspräsentation vom #LATC2017Eröffnungspräsentation vom #LATC2017
Eröffnungspräsentation vom #LATC2017
 

Ähnlich wie Informe vision artificial

trabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docx
trabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docxtrabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docx
trabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docxNICOLASFELIPESOLARTE
 
Marketing and branding strategies for major brands in Instagram
Marketing and branding strategies for major brands in InstagramMarketing and branding strategies for major brands in Instagram
Marketing and branding strategies for major brands in InstagramAndrés Soto
 
Diaz luisa guia 1
Diaz luisa  guia 1Diaz luisa  guia 1
Diaz luisa guia 1Luisa Diaz
 
Plan de marketing digital.pdf
Plan  de marketing digital.pdfPlan  de marketing digital.pdf
Plan de marketing digital.pdfLisbeth Rosero
 
La generación interactiva en andalucía
La generación interactiva en andalucíaLa generación interactiva en andalucía
La generación interactiva en andalucíaxurxocerdeira
 
Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...
Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...
Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...richard gonzalez
 
Curso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas TecnologíasCurso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas TecnologíasJose Luis Contreras
 
Curso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas TecnologíasCurso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas TecnologíasGuadalinfo Villardompardo
 
Informe Adecco futuro del trabajo en España 2016
Informe Adecco futuro del trabajo en España 2016Informe Adecco futuro del trabajo en España 2016
Informe Adecco futuro del trabajo en España 2016Ximo Salas
 
La evolucion de internet reducido
La evolucion de internet reducidoLa evolucion de internet reducido
La evolucion de internet reducidocpjk
 
Sistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECHSistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECHJulio César Álvarez Reyes
 
Tutorial lego mindstorm
Tutorial lego mindstormTutorial lego mindstorm
Tutorial lego mindstormsamuel luque
 
Tutorial lego-mindstorm-1
Tutorial lego-mindstorm-1Tutorial lego-mindstorm-1
Tutorial lego-mindstorm-1wendy castillo
 

Ähnlich wie Informe vision artificial (20)

trabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docx
trabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docxtrabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docx
trabajo escrito de Autodesk Infarworks - Garcia Arana y Solarte Gaitan.docx
 
brazo robótico
brazo robóticobrazo robótico
brazo robótico
 
Marketing and branding strategies for major brands in Instagram
Marketing and branding strategies for major brands in InstagramMarketing and branding strategies for major brands in Instagram
Marketing and branding strategies for major brands in Instagram
 
OpenGisSCADA
OpenGisSCADAOpenGisSCADA
OpenGisSCADA
 
Pdf online
Pdf onlinePdf online
Pdf online
 
Diaz luisa guia 1
Diaz luisa  guia 1Diaz luisa  guia 1
Diaz luisa guia 1
 
Plan de marketing digital.pdf
Plan  de marketing digital.pdfPlan  de marketing digital.pdf
Plan de marketing digital.pdf
 
La generación interactiva en andalucía
La generación interactiva en andalucíaLa generación interactiva en andalucía
La generación interactiva en andalucía
 
Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...
Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...
Diseño e Implementación de un Sistema Multitouch Basado en Iluminación Difusa...
 
39209510 pronosticos
39209510 pronosticos39209510 pronosticos
39209510 pronosticos
 
Curso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas TecnologíasCurso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas Tecnologías
 
Curso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas TecnologíasCurso de Introducción a las Nuevas Tecnologías
Curso de Introducción a las Nuevas Tecnologías
 
Informe Adecco futuro del trabajo en España 2016
Informe Adecco futuro del trabajo en España 2016Informe Adecco futuro del trabajo en España 2016
Informe Adecco futuro del trabajo en España 2016
 
Informe generacioninteractivaargentina
Informe generacioninteractivaargentinaInforme generacioninteractivaargentina
Informe generacioninteractivaargentina
 
La evolucion de internet reducido
La evolucion de internet reducidoLa evolucion de internet reducido
La evolucion de internet reducido
 
Sistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECHSistema de soporte de decisiones para la gestión académica de la ULADECH
Sistema de soporte de decisiones para la gestión académica de la ULADECH
 
Io t proyecto final
Io t proyecto finalIo t proyecto final
Io t proyecto final
 
Modulo herramientas
Modulo herramientasModulo herramientas
Modulo herramientas
 
Tutorial lego mindstorm
Tutorial lego mindstormTutorial lego mindstorm
Tutorial lego mindstorm
 
Tutorial lego-mindstorm-1
Tutorial lego-mindstorm-1Tutorial lego-mindstorm-1
Tutorial lego-mindstorm-1
 

Kürzlich hochgeladen

NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfUPTAIDELTACHIRA
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptNancyMoreiraMora1
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primariaWilian24
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024IES Vicent Andres Estelles
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfGruberACaraballo
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfapunteshistoriamarmo
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...jlorentemartos
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024IES Vicent Andres Estelles
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdfValeriaCorrea29
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxroberthirigoinvasque
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptxRigoTito
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalJonathanCovena1
 

Kürzlich hochgeladen (20)

NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 

Informe vision artificial

  • 1. VISION ARTIFICIAL Luis David Arias & Mateo Restrepo Diciembre 2015 Universidad Tecnológica de Pereira Facultad De Ingenierías Ing. De Sistemas Y Computación Técnicas De La Comunicación
  • 2. 2 Prólogo La visión es algo maravilloso, igual que los otros sentidos, nos permite percibir todos los colores, formas y relieves que se nos presenten; todo gracias a que poseemos dos ojos con la capacidad de recibir luz, calcular distancias y enviar impulsos eléctricos a nuestro cerebro para comprender algo que entendemos como “imagen”. ¿Pero qué sucede con las personas que no poseen este sentido, o que lo perdieron a través del tiempo? ¿Cuál es la forma de percibir el mundo para una persona con discapacidad visual? Entre los métodos de comunicación de una persona invidente están el hablar y el escuchar, pero cuando hablamos de comunicar información que necesariamente debe ser visual ¿Qué métodos se pueden utilizar?, Aquí es donde entra la visión artificial, estuvimos analizando los métodos que presenta esta nueva tecnología, y parecen muy convincentes. En la actualidad existen muchos programas para esta clase de problemas, puede ser algo tan simple como usar un teclado de lenguaje braille o un lector de caracteres, pero la visión artificial nos ofrece algo más que eso, nos ofrece la capacidad de interpretar o reducir imágenes que ningún otro lenguaje ha podido hacerlo. Espero que este recorrido los motive a ustedes, los futuros ingenieros, inventores del mañana, para usar esta tecnología, la cual está ahí esperando evolucionar para cambiar la vida de las personas que más lo necesitan.
  • 3. CONTENIDO INTRODUCCIÓN............................................................................................................................. 6 CAPITULO I..................................................................................................................................... 8 EMPEZANDO A TRABAJAR CON VISION ARTIFICIAL ...................................................... 8 1. Sistema de visión artificial........................................................................................................ 8 1.1 Núcleo del sistema de visión artificial...................................................................................... 10 1.1.A Segmentación:........................................................................................................................ 10 1.1.B Representación y descripción .............................................................................................. 10 1.1.C Clasificación........................................................................................................................... 10 1.2 Interpretación............................................................................................................................ 11 CAPITULO II.................................................................................................................................. 12 INTERFERENCIAS DE TRABAJO ............................................................................................ 12 2. Interferencias técnicas y de optimización ............................................................................. 12 2.1 RUIDOS TÉCNICOS.............................................................................................................. 12 2.1.A Salt and pepper...................................................................................................................... 12 2.1.B Ruido uniforme...................................................................................................................... 13 2.1.C Ruido Gaussiano.................................................................................................................... 13 2.2 Interferencias debidas al contexto ........................................................................................... 14 2.2.A Punto de vista......................................................................................................................... 14 2.2.B Oclusión.................................................................................................................................. 14 2.2.C Escala...................................................................................................................................... 15 2.2.D Deformación........................................................................................................................... 15 2.2.E Fondo desordenado................................................................................................................ 16 2.2.F Variaciones dentro de una misma clase............................................................................... 16 CAPITULO III................................................................................................................................ 17 APLICACIONES ACTUALES DE LA VISION ARTIFICIAL ................................................ 17 3.1 Aplicaciones industriales de la visión artificial................................................................. 17 3.1.1 Metrología óptica 2D y 3D.............................................................................................. 17 3.1.2 Orientación y posicionamiento de objetos..................................................................... 18 3.2 Aplicaciones biomédicas de la visión artificial.................................................................. 18 3.2.1 La visión artificial en la biología.................................................................................... 18 3.2.2 La visión artificial en la medicina.................................................................................. 19
  • 4. 4 3.3 Aplicaciones de biométrica para seguridad...................................................................... 20 3.3.1 Huellas dactilares ............................................................................................................ 20 3.2.2 Detección de caras........................................................................................................... 21 CAPITULO IV ................................................................................................................................ 23 EL OJO BIONICO ......................................................................................................................... 23 CONCLUSIONES........................................................................................................................... 25 BIBLIOGRAFIA............................................................................................................................. 26
  • 5. 5 INDICE DE FIGURAS Ilustración 1. Procesos de la visión artificial....................................................................................... 8 Ilustración 2. Sistema de visión artificial............................................................................................ 9 Ilustración 3. Salt and pepper............................................................................................................ 12 Ilustración 4. Ruido Uniforme .......................................................................................................... 13 Ilustración 5. Ruido Gaussiano ......................................................................................................... 13 Ilustración 6. Punto de vista.............................................................................................................. 14 Ilustración 7.. Oclusión ..................................................................................................................... 14 Ilustración 8 Escala ........................................................................................................................... 15 Ilustración 9 Deformación................................................................................................................. 15 Ilustración 10 Fondo Desordenado ................................................................................................... 16 Ilustración 11 Variaciones dentro de una misma clase ..................................................................... 16 Ilustración 12. Metrología óptica 2D y 3D ....................................................................................... 17 Ilustración 13. Radiografía................................................................................................................ 19 Ilustración 14. Huella Dactilar .......................................................................................................... 20 Ilustración 15 Detección de Caras..................................................................................................... 21 Ilustración 16 Argus II ...................................................................................................................... 23 Ilustración 17 Vision con Argus II.................................................................................................... 24
  • 6. 6 INTRODUCCIÓN “Utilizarías los ojos como nunca hasta entonces. Todo lo que siente se convertiría en algo querido para ti. Tus ojos tocarían y abrazarían cada objeto que entrase en el radio de tu visión. Y luego, por fin, verías y un nuevo mundo de belleza se abriría ante ti”- Helen Keller. Lo que es claro, es que la visión artificial cambiará muchas vidas, pero primero, necesita ser mejorada por nosotros, por eso este documento es un abrebocas a lo que podríamos llegar a hacer con esta tecnología, no vamos a explicarles cómo hacerlo, pero si como lo han hecho otros investigadores como usted y yo, que han empezado a realizar, pero que no han podido completar, ahí están, esperando que lleguemos a construir el mañana y lo que será de esas personas que lo conformaran. En el mundo hay 314 millones de personas con discapacidad visual y Colombia posee un total de 1.143.992 casos de personas con este problema, representando el 43.5% del total de discapacitados del país.1 Parece ser un porcentaje alto para la gran cantidad de discapacitados en Colombia, y que el estado invierte más en hacer estas estadísticas que destinar fondos a la investigación. Antes de poder entrar en el fabuloso mundo de la visión artificial, es importante conocer cómo funciona la visión humana; el ojo humano es como una cámara fotográfica (de hecho se tomó como referencia para ser inventada) está compuesto por un globo ocular el cual es protegido por las cejas, las pestañas, los parpados y las glándulas lacrimales las cuales mantienen húmeda la superficie; Este globo está compuesto por el iris que puede ser de varios colores y la pupila que se abre y se cierra (como el diafragma de una cámara fotográfica) para regular la cantidad de luz que entrará; Cuando la luz entra por la pupila, primero debe pasar por una capa transparente y elástica llamado cristalino (como el lente de una cámara) la cual refractara los rayos de luz hacia la membrana más interna del ojo, la retina, esta membrana es la continuación del nervio óptico, la cual transmitirá la información al cerebro en forma de impulsos eléctricos, gracias a unas células foto receptoras llamadas bastones y conos, los bastones perciben la intensidad de la luz, y los fotones, perciben los colores (específicamente rojo, verde y azul); Desde aquí empezamos a notar de que la manera en que trabaja la información una cámara fotográfica es muy parecida a la del ojo humano, el lente, el diafragma, el sensor, los colores RGB, la tecnología de estos instrumentos ha avanzado demasiado, pero ¿Acaso una cámara fotográfica sabe que está fotografiando?, algunas personas creerán que si por el simple hecho de encontrar alguna función en su cámara digital que diga “Detección de rostros” o “Enfoque Automático”, estas funciones podrían tomarse como ejemplo de lo que es la visión artificial, pero el asunto va más allá que detectar un 1 Colombia tiene 1,14 millones de personas con problemas visuales, ElPais.com.co
  • 7. 7 simple cambio de pixeles (no digo que todas las cámaras funcionen de esta manera), la verdad es que aún falta mucho más por descubrir de este campo. La visión artificial también conocida como visión por computador es una disciplina científica, que utiliza diferentes métodos para adquirir, procesar, realizar un análisis y comprender las imágenes del mundo real, generando información numérica o simbólica que puedan ser entendidas por un computador.2 Así como los seres humanos usamos nuestros ojos para tener una percepción del mundo real esto mismo trata de realizar la visión artificial producir el mismo efecto para que las computadoras puedan percibir y entender una imagen o una secuencia de imágenes. Esta comprensión se produce gracias a diferentes campos como la geometría, la estadística, la física entre otras disciplinas que se aplican. La adquisición de los datos se consigue por diferentes medios como secuencias de imágenes, vistas desde diferentes cámaras de video o datos multidimensionales desde un escáner médico. La visión artificial también la podemos ver como una rama de la inteligencia artificial la cual busca modelar matemáticamente el proceso de percepción visual que poseemos los seres humanos y se encarga de generar software que permite simular estas capacidades visuales desde una computadora. Otro ejemplo de visión artificial un poco más avanzado se presenta cuando subimos la típica foto con los amigos a Facebook, y de repente vas a etiquetar a alguien y resulta que esta red social ya sabía quién era esa persona, o cuando te piden las huellas dactilares para registrarte en algún sitio, son algunas de las aplicaciones que veremos más adelante, por ahora, disfrutemos de este recorrido de aprendizaje. 2 Definición Visión Artificial, Wikipedia
  • 8. 8 CAPITULO I EMPEZANDO A TRABAJAR CON VISION ARTIFICIAL 1. Sistema de visión artificial Ya teniendo definido lo que es visión artificial tenemos que entender cuáles son los pasos necesarios para trabajar con esta tecnología, porque no es solo convertir una imagen a matrices inteligentes, sino que la imagen debe pasar por un proceso de limpieza, para luego detectar sus componentes e interpretarlos (ver Ilustración 1). Ilustración 1. Procesos de la visión artificial Debemos tener en cuenta que cuando trabajamos con imágenes tomadas del exterior, estas representan un mundo real, y no ideal, por lo cual vamos a encontrar muchas interferencias que debemos solucionar mediante otros métodos, la idea es que cuando se vaya a procesar la imagen para su reconocimiento, esta tenga una excelente calidad, de lo contrario podrían encontrarse muchas fallas. En el siguiente proceso, como lo dice la Ilustración 1, debemos aplicar unas técnicas del procesamiento de imágenes para identificar los elementos que necesitamos y llevarlos hasta su interpretación, por ejemplo: “Necesitamos que nuestra cámara de seguridad del museo, detecte cuando alguien intenta robar alguna de las obras”, una solución a esto se implementaría detectando los 3 estados de la escena: el estado normal de la obra, la interferencia del sujeto, y finalmente la irregularidad de la continuidad en la escena (la obra ya no se encuentra). Por último, tenemos la interpretación de los datos, expresados en un lenguaje que ya comprende el computador para poder reaccionar a la información, tomando el
  • 9. 9 ejemplo anterior: “Nuestro sistema detectó que la obra identificada ya no se encuentra”, lo más común es que se dispare una alarma, se cierren las salidas y se les comunique al personal de seguridad para que emprendan la búsqueda del ladrón, todo esto digno de una película de agentes. Un sistema de visión artificial podría definirse de muchas maneras, en este capítulo explicaremos un sistema simple que cumple con los procesos básicos mencionados anteriormente (ver Ilustración 2). Ilustración 2. Sistema de visión artificial Como podemos apreciar, la entrada de nuestro sistema será una imagen a la cual se le procesaran las interferencias encontradas, este procesamiento es a bajo nivel pero muy sencillo, seguido de esto, obtendremos una nueva imagen un poco más limpia y trabajable; En el núcleo del sistema de visión artificial se utilizan operaciones aritméticas, lógicas y un poco de algebra lineal para poder cumplir con su propósito, este procesamiento es a nivel medio; ya teniendo todos los atributos definidos, solo faltaría interpretarlos, utilizando un procesamiento a alto nivel, el sistema reconocerá los componentes de la imagen y dará una respuesta al usuario final (como el caso de la alarma). Todos estos sistemas se basan en una serie de algoritmos y técnicas que hacen uso de uso de una variada de disciplinas matemáticas, entre ellas el álgebra lineal, con esta
  • 10. 10 disciplina, se pueden comprender las proyecciones del mundo real tridimensional en imágenes bidimensionales, o inversamente, se puede utilizar la referencia bidimensional para determinar la posición de un objeto 3D. En algunos casos, las detecciones se consiguen mediante modelos de apariencia que utilizan los histogramas de color3 de las imágenes, con modelos previamente almacenados. Los algoritmos dentro del núcleo del sistema de visión artificial varían según el destino del software, ya que los algoritmos pueden enfocarse en la detección de ciertos objetos, obtener la ubicación exacta según la perspectiva o proyectar un escenario tridimensional según la reunión de otras imágenes. 1.1 Núcleo del sistema de visión artificial Uno de los conceptos más complejos de entender se encuentran en esta fase de la visión artificial, ¿Cómo sabemos que lógica utilizar después de limpiar una imagen? No te vamos a decir el cómo hacerlo, pero si unos cuantos procesos que debes tener en cuenta para formar tu núcleo de procesamiento. 1.1.A Segmentación: En esta fase se debe dividir la imagen en partes u objetos que la constituyen, tenemos que diferenciar lo que es un fondo y el objeto que necesitamos analizar, para eso se utiliza la información previamente almacenada de los histogramas de colores que se explicaron anteriormente; pero no solo se trata de la distribución del color, también se puede segmentar la imagen según el movimiento, regiones que sabemos que es el fondo, umbralización4 . 1.1.B Representación y descripción En esta fase se etiquetan los objetos teniendo en cuenta la información suministrada por la inspección de dicho objeto, la cual puede ser cuantitativa o cualitativa, en la inspección cualitativa tenemos en cuenta las medidas del objeto y sus ángulos de orientación, mientras que en la inspección cualitativa, nos basamos en su color y textura. 1.1.C Clasificación Esta fase consiste en reconocer los objetos de la escena a partir de las características extraídas, estas características pueden estar representadas en vectores o estructuras de datos definidas, además se debe identificar como 3 Histograma de color: En los campos de procesamiento de imagen y fotografía, un histograma de color es una representación anterior de la distribución de color en una imagen. https://es.wikipedia.org/wiki/Histograma_de_color 4 La umbralización tiene como objetivo convertir una imagen de escala de grises a una nueva con solo dos niveles (blanco y negro, true and false, 0 y 1)
  • 11. 11 están relacionados en la imagen (Ej, el vaso está sobre la mesa, el cuadro se encuentra en la pared), mediante algunos métodos como redes neuronales, sistemas expertos, fuzzy logic, entre otros. 1.2 Interpretación Este proceso depende del propósito del sistema de visión artificial, en esta toma de decisiones normalmente se controlan aparatos mecánicos que efectúan la manipulación de productos después de ser clasificados. Teniendo claro cuáles son los procesos que conforman un sistema de visión artificial, estamos listos para empezar a construir uno, cabe resaltar que el lenguaje de programación para desarrollar estos sistemas es independiente de la lógica que vayamos a aplicar (como todos los programas) uno de los lenguajes más utilizados para este tipo de software es MATLAB5 , pero es decisión del desarrollador elegir el framework más adecuado y cómodo para su trabajo. En el siguiente capítulo nos enfocaremos en los problemas que se pueden presentar al trabajar con imágenes tomadas del mundo real. 5 MATLAB descarga http://www.mathworks.com/products/matlab/
  • 12. CAPITULO II INTERFERENCIAS DE TRABAJO 2. Interferencias técnicas y de optimización En el momento de aplicar los conceptos teóricos de la visión artificial encontrar diferentes interferencias y problemas relacionados con el mundo que nos rodea. Esto se presenta por el hecho de que nuestro mundo no es perfecto y los elementos que se usan para la captura de imágenes tampoco lo son. Teniendo en cuenta estos problemas se encuentran los siguientes tipos de ruidos: 2.1 RUIDOS TÉCNICOS Esta clase de ruidos son ocasionados por el procesamiento digital de nuestros dispositivos de captura, ya que estos no son tan avanzados como el ojo humano, basta con tomar una fotografía de noche con nuestros teléfonos para encontrar esta clase de ruidos. 2.1.A Salt and pepper Es un ruido impulsivo que hace que los pixeles tiendan a un máximo (blanco) y a un mínimo (negro). El efecto de este hace que tengamos diversos puntos blancos y negros esparcidos a través de la imagen. Por eso se denomina Salt and Pepper (Sal y pimienta), se denomina de esta manera porque parece que la imagen hubiera sido roseada con estos compuestos. Para solucionar este ruido podemos utilizar un 6 filtro de promedio espacial pese a que se pierde definición en la imagen podemos solventar este ruido. Ilustración 3. Salt and pepper 6 Filtro de promedio espacial: Las operaciones de filtrado se llevan a cabo directamente sobre los píxeles de la imagen. En este proceso se relaciona, para todos y cada uno de los puntos de la imagen, un conjunto de píxeles próximos al píxel objetivo con la finalidad de obtener una información útil, dependiente del tipo de filtro aplicado, que permita actuar sobre el píxel concreto en que se está llevando a cabo el proceso de filtrado para, de este modo, obtener mejoras sobre la imagen y/o datos que podrían ser utilizados en futuras acciones o procesos de trabajo sobre ella.
  • 13. 13 2.1.B Ruido uniforme Es un ruido que afecta la imagen teniendo blanco y negro de manera uniforme sobre ella. El efecto que presenciamos a simple vista de este es que percibimos interferencias en la imagen, como si esta se encontrara codificada. Observamos una pantalla por encima de la imagen llena de pixeles con valores aleatorios y expandidos uniformemente, este ruido puede aparecer cuando se realiza el proceso de cuantificación de una imagen. Ilustración 4. Ruido Uniforme 2.1.C Ruido Gaussiano Es un ruido que se deriva de los equipos de captura. El efecto en la imagen parecerá al uniforme solo que los valores no son tan fuertes, tienden más a ser grises que negros y blancos. Para solucionar este problema podemos utilizar un filtro de promedio espacial con coeficientes Gaussianos. Ilustración 5. Ruido Gaussiano
  • 14. 14 2.2 Interferencias debidas al contexto Este tipo de interferencias están más basadas en problemas del mundo real que en problemas técnicos, pues ya dependen del dispositivo con el que se tomó la foto, y al escenario que se está fotografiando. 2.2.A Punto de vista Según como se encuentra la imagen orientada al observador. Un ejemplo claro de esto es: Un animal no se ve igual de frente que de espaldas, aunque éste sigue siendo un animal. Iluminación: La cantidad de luz que recibe el objeto. Un objeto deberá ser distinguible independientemente de si tiene alguna cara oscura debido a la iluminación. Ilustración 6. Punto de vista 2.2.B Oclusión Un objeto puede estar en segundo plano, es decir, que otro objeto tape parcialmente nuestro objetivo a la hora de extraerlo o analizarlo. Deberemos ser capaces de saber interpretar que un objeto diferente está entre nuestro objeto a extraer y el observador. Ilustración 7.. Oclusión
  • 15. 15 2.2.C Escala Factor que determina el tamaño de la imagen respecto al real. Un edificio no parecerá tener el mismo tamaño dependiendo de la imagen capturada ya sea por distancia, ángulo. Deberemos ser capaces de interpretar que un objeto puede ser el mismo pese a que el tamaño en las fotografías pueda ser diferente. Ilustración 8 Escala 2.2.D Deformación Un objeto puede estar deformado debido a múltiples factores o simplemente debido a errores de captura, o posicionamiento y ángulo de la captura. Deberemos interpretar que el objeto pertenece a una categoría pese a sus deformaciones. Ilustración 9 Deformación
  • 16. 16 2.2.E Fondo desordenado Un objeto puede estar en un contexto desordenado y caótico. Como por ejemplo un mosaico. Deberemos saber distinguir el objeto entre el caos que le envuelve. Ilustración 10 Fondo Desordenado 2.2.F Variaciones dentro de una misma clase Cierto tipo de objeto puede ser muy diferente a otro de su misma categoría, Tenemos el ejemplo de cuando observamos una silla, que hay multitud de sillas diferentes pero a todas les unen los mismos rasgos característicos: 4 patas, una placa donde sentarse, un reposo para la espalda. Ilustración 11 Variaciones dentro de una misma clase Depende de la manera que solucionemos estos problemas, que tipo de algoritmos o procesos se apliquen, nuestro programa puede ser más o menos eficiente y fiable.
  • 17. 17 CAPITULO III APLICACIONES ACTUALES DE LA VISION ARTIFICIAL 3.1 Aplicaciones industriales de la visión artificial En la industria, como campo general de desarrollo, el reconocimiento de imágenes está íntimamente ligado a un sistema de procesamiento que ofrezca una alta calidad y seguridad en su utilización practica como es la Inteligencia Artificial. Aunque la Inteligencia Artificial aun es un frente cambiante y en continuo desarrollo, las bases de la visión artificial como parte de un sistema de IA han sido fuertemente apoyadas por este sector, por el aprovechamiento de recursos que ello supone. A continuación se exponen ejemplos de la visión artificial aplicadas en la industria, a nivel de herramientas de trabajo y de productos finales de venta al usuario. La inspección de productos industriales, el guiado de robots o el control del tráfico son sólo algunas de las aplicaciones de los sistemas de visión artificial pero existen otros más innovadores y de los que se tiene menos conocimiento. 3.1.1 Metrología óptica 2D y 3D Diseño de sistemas industriales de visión artificial para control metrológico en 2 y 3 dimensiones con el fin de detectar desviaciones respecto a las medidas reales. En el área de la metrología, los sistemas de visión artificial tratan de obtener las magnitudes físicas del objeto y verificar posteriormente que se corresponden con el patrón exigido. Para ello se desarrolla un software capaz de detectar estos aspectos y establecer si se cumplen o no los diferentes requisitos. Entre las principales ventajas de este sistema se encuentra que no es necesario el contacto con el objeto y la posibilidad de realizar el control en el cien por cien de las piezas fabricadas. La visión artificial permite verificar dimensiones de piezas industriales con precisión. Ilustración 12. Metrología óptica 2D y 3D
  • 18. 18 La visión artificial puede alcanzar una precisión por debajo de la centésima de milímetro, lo que le hace ser un sistema atractivo para su implantación en industrias como la del automóvil. Eusebio de la Fuente, del Departamento de Ingeniería de Sistemas y Automática de la Universidad de Valladolid, asegura que la visión artificial posibilita el control de distancias, el número de estrías, radios o ángulos de una pieza industrial con gran precisión, ya que la medición se basa en sus características geométricas como son las rectas o los círculos. 3.1.2 Orientación y posicionamiento de objetos Diseño e implementación de sistemas de visión artificial para verificar la posición y orientación de elementos dentro de cintas de transportes para su manipulación posterior. Diseño de sistemas "pick and place" para manipulación automatizada de productos en líneas de producción. Recuento de productos en procesos complejos y de alta velocidad Diseño e implementación de sistemas de visión artificial para conteo de productos en transportes, estáticos... por ejemplo para empaquetado de productos automatizado. Control de calidad en procesos de producción Detección de defectos en productos; aspecto, tamaño, longitud Diseño e implementación de sistemas de visión artificial para control dimensional (tamaño, longitud) y estético (defectos físicos) aplicado al control de calidad de productos manufacturados en general tanto a nivel industrial (piezas de automóviles, salpicaderos, lunas de coche, ladrillos, baldosas) como de consumo. 3.2 Aplicaciones biomédicas de la visión artificial 3.2.1 La visión artificial en la biología En el campo de la biología hay que distinguir entre dos tipos de aplicaciones de visión artificial, aplicaciones microscópicas y macroscópicas. Para aplicaciones microscópicas la estrategia a seguir es, mediante técnicas de segmentación orientadas a regiones, la identificación de diferentes propiedades de las células (color, forma, tamaño, etc) o bien, para contar el número de microorganismos o células presentes en una muestra de la que se ha obtenido una imagen. En cuanto a las aplicaciones macroscópicas de lo que se trata es de la identificación de determinados tipos de texturas en vegetales, o características
  • 19. 19 de diferentes áreas naturales por rasgos característicos, como color, grado de floración o crecimiento de especies por diferencia de imágenes por ejemplo. En concreto este último método también se emplea en la geología para detectar movimientos de regiones. 3.2.2 La visión artificial en la medicina En el campo de la medicina se dan un gran número de aplicaciones en las que aparece la utilización de imágenes para la realización de diagnósticos de diferentes enfermedades, como por ejemplo radiografías, resonancias magnéticas, tomografías, etc. Por tanto y gracias a la extensión de este campo hay un gran número de aplicaciones: detección de tumores, arteroesclerosis, etc. Se pueden consultar las últimas novedades en este tipo de aplicaciones en la revista IEEE Trans. Medical Imaging. A continuación se puede observar el proceso al que se somete una radiografia (imagen original a), la selección de diferentes componentes de color, y otros parámetros que se configuran para facilitar el análisis de la misma. Ilustración 13. Radiografía
  • 20. 20 3.3 Aplicaciones de biométrica para seguridad Otras aplicaciones no médicas de la visión artificial aplicada a la biomedicina es por ejemplo la utilización de imágenes de huellas dactilares, caras o imágenes de retinas. Para aplicar la biometría a la identificación de individuos deben cumplirse una serie de requisitos: Permanencia. El rasgo a medir no debe cambiar en el tiempo (salvo enfermedad). Unicidad. El patrón debe tener una probabilidad muy baja de coincidir con el de otro sujeto. Universalidad. Toda persona debe tener dicha característica a observar. 3.3.1 Huellas dactilares Para la identificación por medio de huellas dactilares la estrategia a seguir es la observación de puntos singulares, para que cumplan los requisitos explicados en el apartado anterior. Los puntos con mayor concentración de puntos singulares (80%) se encuentran cuando se termina una línea y donde se bifurca una línea. A estos puntos se les llama minucias. Después a cada minucia se le atribuye una posición y una orientación. El proceso de obtención de las minucias recibe el nombre de filtrado. Una vez filtrada una huella para buscar coincidencias con las huellas almacenadas en la base de datos se realiza el emparejado. Las huellas tienen una primera clasificación según el patrón general que sigue, así, existe la clasificación de Henry, que distingue 5 tipos de huellas (right loop, left loop, whorl, arch y tented arch). Una vez clasificada la huella dentro de uno de ellos se procede a buscar dentro del grupo apropiado la huella que más se parece a la que deseamos identificar. Para esta parte también existe un gran número de algoritmos, que no vamos a explicar. Es importante destacar que para este proceso una comparación exhaustiva de las huellas almacenadas con la huella a identificar es un proceso muy costoso, por lo que se recurre a algoritmos no tan efectivos como el de “fuerza bruta” pero mucho más rápidos. Entre estos últimos las mejores soluciones son las proporcionadas por redes neuronales, la transformada de Hough o en algoritmos genéticos. Ilustración 14. Huella Dactilar
  • 21. 21 3.2.2 Detección de caras Existen infinidad de aplicaciones de detección de rostros, tanto para seguridad como para otro tipo de aplicaciones, como por ejemplo en cámaras de fotos, para que el enfoque automático sepa donde tiene que enfocar. ¿Cómo funciona el reconocimiento facial? Como existe una gran cantidad de aplicaciones, el funcionamiento varía de unas a otras, pero independientemente de los patrones empleados por cada programa hay una serie de pasos comunes. Una vez obtenida una imagen (ya sea empleando cámaras dedicadas a aplicaciones de seguridad o webcams domésticas) el primer paso consiste en la extracción de la cara de la imagen. Para ello se obtienen puntos singulares con los que centrar la imagen, los ojos por ejemplo. De esta imagen centrada se normaliza a un tamaño y profundidad específicos para después extraer rasgos de ella (estos primeros pasos son comunes a la mayor parte de aplicaciones de visión artificial): Ilustración 15 Detección de Caras A continuación se divide la imagen en bloques menores y se almacena en una matriz:
  • 22. 22 Finalmente se procesan los datos de las nuevas imágenes y se generan sus “Eigenfaces”, conjunto de vectores propios, mediante un proceso matemático llamado ACP. Es decir separamos la información de la cara en una serie de autovectores, derivados del análisis estadístico de un gran número de rostros. A la derecha podemos ver en la imagen el ejemplo de un Eigenface. Después comparándolos con los originales se obtiene el porcentaje de coincidencia con el original. Estas aplicaciones han sido un gran avance tecnológico, y demuestra que la visión artificial es un campo muy amplio para trabajar, pero aún falta la aplicación que le da sentido a este documento y a la cual de dedicamos un capítulo entero; El ojo biónico.
  • 23. CAPITULO IV EL OJO BIONICO Quizás nuestros padres recordaran al hombre nuclear, también conocido como “The Six Million Dollar Man”, un hombre que sufre un terrible accidente durante un vuelo, perdiendo sus extremidades y su ojo izquierdo, una agencia gubernamental que trabajaba en un programa secreto llamado Biónica toma a este hombre como sujeto de prueba y reemplaza sus miembros perdidos por partes cibernéticas que tienen un costo de seis millones de dólares. Esta historia no fue nada más que pura ciencia ficción de hace 30 años, pero aunque parezca mentira, la mayoría de avances tecnológicos surgen gracias a estas ideas, y así paso con el ojo biónico, que en este caso se llama Argus II7 , un sistema de prótesis de retina desarrollado por la empresa californiana Second Sight. El Argus II tiene por objeto proporcionar la estimulación eléctrica de la retina para inducir la percepción visual en personas invidentes. Una microcámara alojada en las gafas del paciente captura una escena y ésta se envía a un pequeño ordenador que el paciente lleva encima (la unidad de procesamiento de vídeo o VPU, por sus siglas en inglés) donde se procesa y transforma en instrucciones que se envían de vuelta a las gafas mediante un cable. Estas instrucciones se transmiten de forma inalámbrica a la antena del implante de retina. Las señales se envían al conjunto de electrodos, que emite pequeños impulsos de electricidad. Estos impulsos pasan por alto los fotorreceptores dañados y estimulan las células que quedan en la retina y que transmiten la información visual a través del nervio óptico al cerebro, para crear la percepción de patrones de luz. Los pacientes aprenden a interpretar estos patrones visuales con su implante de retina. Ilustración 16 Argus II 7 Link de Second Sight http://www.secondsight.com/?lang=es
  • 24. 24 La imagen que se recibe con el implante está fragmentada, y lo que tiene que hacer el cerebro es reconstruir la imagen, el reto en este proceso es saber que fragmento de la información tomar, y en qué momento. Ilustración 17 Vision con Argus II Este dispositivo ha sido implantado en 30 pacientes quienes estaban completamente ciegos antes de aplicarles la cirugía del implante, los resultados han sido excepcionales. La visión de los pacientes se ve mejorada en el aspecto de la percepción luminosa ya que a partir de esta se pueden identificar diversos objetos que se presentan en el campo de visión, normalmente se les implanta a personas con retinitis pigmentaria, una enfermedad que se caracteriza por la degeneración progresiva de la retina, lo que supone la pérdida gradual de conos y bastones, ya explicados anteriormente. A pesar de que este proyecto está más orientado a la biónica que a la ingeniería del software, cabe resaltar que sin un buen sistema que reconozca las imágenes que transmite la cámara, las interprete y envié señales de manera correcta al cerebro, este proyecto no tendría éxito; así que aquí es donde entramos nosotros los desarrolladores, para ofrecer otras técnicas que puedan evolucionar este grandioso invento.
  • 25. CONCLUSIONES La idea de visión artificial ha suscitado mucha imaginación y muchas preguntas al respecto, ya que sus palabras sugieren algo nuevo y extraño. Se trata de una nueva herramienta que busca dar solución a problemas de visión, y también de dar soluciones a procesos industriales, a diagnosticar enfermedades en ramas como la medicina, innovación para el desarrollo de sistemas de seguridad, entre otras aplicaciones que tiene. La evolución de esta tecnología depende de nosotros, es un campo no muy explorado y que está esperando ahí para cambiar la vida de muchas personas. Con el desarrollo de este nuevo campo de la inteligencia artificial, se busca dar soluciones a problemas que años atrás eran intratables, con el avance que este campo está presentando día a día muy seguramente se les encuentre una pronta solución. Para trabajar con visión artificial, es necesario tener unas buenas bases de algebra lineal y tener claro que las aplicaciones que se desarrollen bajo este método deben ser pensadas en un mundo real y no ideal.
  • 26. BIBLIOGRAFIA Es.wikipedia.org, (2015). Visión artificial. [online] Available at: https://es.wikipedia.org/wiki/Visi%C3%B3n_artificial [Accessed 5 Dec. 2015]. YouTube, (2015). Ojo Biónico es una Realidad y Ayuda a Recuperar Vista a Invidentes. [online] Available at: https://www.youtube.com/watch?v=uaO4JK8Ceq0 [Accessed 5 Dec. 2015]. Bernardo, A. and Bernardo, A. (2013). El primer ojo biónico del mundo, Argus II, comienza a usarse en Estados Unidos. [online] Think Big. Available at: http://blogthinkbig.com/el-primer-ojo-bionico- del-mundo/ [Accessed 5 Dec. 2015]. Secondsight.com, (2015). Second Sight Home Page. [online] Available at: http://www.secondsight.com/ [Accessed 5 Dec. 2015]. YouTube, (2015). Visión artificial Argus II - Dr. Jeroni Nadal. [online] Available at: https://www.youtube.com/watch?v=fIIOWJpU3Nw [Accessed 5 Dec. 2015]. YouTube, (2015). 01 - Curso De Visión Por Computador - Introducción. [online] Available at: https://www.youtube.com/watch?v=3iUEWenA-VM [Accessed 5 Dec. 2015]. YouTube, (2015). La visión artificial. [online] Available at: https://www.youtube.com/watch?v=h38G3ZM7zc8 [Accessed 5 Dec. 2015]. Sabia.tic.udc.es, (2015). Visión artificial e interacción sin mandos. [online] Available at: http://sabia.tic.udc.es/gc/Contenidos%20adicionales/trabajos/3D/VisionArtificial/index.html [Accessed 5 Dec. 2015].