12. ¿Qué es?
Disciplina científica con un objetivo.
Clasificación de objetos en clases.
Se puede enfocar de tres formas:
estadística.
sintáctica o estructural.
de redes neuronales.
13. Enfoques
Estadístico (o de la teoría Sintáctico se basa en las
de decisión) & de redes relaciones geométricas.
neuronales se basan en
Relaciones que van
lo mismo.
asociadas a la forma de
Extraer sus propiedades, los objetos.
de forma cualitativa.
15. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Fase de diseño.
16. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Fase de diseño.
Conjunto de
muestras
17. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Fase de diseño.
Conjunto de Selección de
muestras características
18. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
19. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Imagen digital
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
20. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Imagen digital
Preprocesamiento
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
21. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Imagen digital
Preprocesamiento Segmentación
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
22. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Imagen digital
Extracción de
Preprocesamiento Segmentación
características
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
23. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Imagen digital
Extracción de
Preprocesamiento Segmentación Clasificador
características
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
24. Esquema de un sistema de
reconocimiento.
Fase de funcionamiento.
Imagen digital
Extracción de
Preprocesamiento Segmentación Clasificador
características
Fase de diseño.
Conjunto de Selección de Diseño del clasificador:
muestras características funciones de decisión.
25. Segmentación.
Dividir una imagen para aislar nuestro objeto.
Objetivo: simplificar la representación de la imagen
para un mejor estudio de la misma.
Etiquetado de pixeles con las mismas características
para agrupar sus propiedades.
26. Extracción de características
Transformar la imagen de un objeto en un vector que
defina sus cualidades, normalmente físicas.
¿Es el dato relevante?
Los datos poco relevantes se eliminan para no interferir
en el modelo.
27. Propiedades de las
características a extraer.
Robustez: insensible al
ruido de captura e
iluminación.
Discriminantes: que
distingan objetos de
distintas clases.
Invariante ante
traslación, rotación y
escalado y perspectiva.
28. Propiedades de las
características a extraer.
Robustez: insensible al
ruido de captura e
iluminación.
Discriminantes: que
distingan objetos de
distintas clases.
Invariante ante
traslación, rotación y
escalado y perspectiva.
29. Propiedades de las
características a extraer.
Robustez: insensible al
ruido de captura e
iluminación.
Discriminantes: que
distingan objetos de
distintas clases.
Invariante ante
traslación, rotación y
escalado y perspectiva.
30. Un ejemplo...
Una posible utilización la vemos en el
reconocimiento de textos, en este caso tenemos
el patrón de las letras y comparamos con este
patrón el vector de atributos que obtenemos de
la imagen.
31. Clasificador
Partimos de un vector de atributos extraídos de la
imagen del objeto.
Clasifica las imágenes en las diferentes clases que se
contemplan.
Existen diferentes mecanismos de clasificación.
32. Diseño del clasificador.
Algoritmos que toman la decisión de donde o como
clasificar un objeto.
El diseño más extendido es el de clasificadores por
entrenamiento o aprendizaje máquina.
34. Tipos de aprendizaje
automático
Aprendizaje deductivo
Modelos generales Modelo especifico
Aprendizaje inductivo
Modelo especifico Modelos generales
Aprendizaje por refuerzo
Exploración autónoma y explotación de lo aprendido.
35. Aprendizaje inductivo
El objetivo es generar
un modelo general a
partir de ejemplos
específicos
El conjunto de
ejemplos se denomina
conjunto de
entrenamiento
36. Aprendizaje inductivo
El objetivo es generar
un modelo general a
partir de ejemplos
específicos
El conjunto de
ejemplos se denomina
conjunto de
entrenamiento
37. Concepto: Determinar el nuevo objeto a estudiar según
los atributos (hipótesis).
Instancia: Cada uno de los ejemplos de entrenamiento.
Atributo: Cada una de las medidas que forman el
vector de atributos de un ejemplo.
Reales: Pueden tomar cualquier valor numérico en un rango.
Discretos: Toman valores discretos ordenados: Por ejemplo la
temperatura como alta, media o baja.
Categóricos: Valores discretos no ordenados. Por ejemplo el color.
Clase: Es el atributo que buscamos determinar a partir
de los demás.
38. Ejemplo: modelado de la probabilidad
de fallo de una máquina.
Clase: Comprobamos si falla.
Atributos: Medidas por las que puede fallar:
Temperatura.
Nivel de Vibraciones.
Horas de funcionamiento.
Meses desde la última revisión.
Instancias: Situaciones que han pasado anteriormente.
Concepto: Relación entre las medidas y probabilidad de
fallo. (IF-THEN)
Si el nivel de vibraciones es alto y la temperatura es alta,
entonces fallará.
40. Capacidad de representación
y legibilidad.
Capacidad de expresar varios conceptos diferentes.
Frontera de decisión generada con cada modelo.
Árboles de Decisión.
Redes Neuronales.
Facilidad con la que un humano puede leer e interpretar.
A continuación, ejemplos con solo 2 atributos:
45. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará
95
fallará
120 vibración
46. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará si
95
fallará F
120 vibración
47. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará si
no
95
fallará vibr.>70? F
no
fallará
70 120 vibración
48. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará si
no
95
fallará vibr.>70? F
no no
fallará
NF
70 120 vibración
49. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará si
no
95
fallará fallará vibr.>70? F
no no si
50 fallará
NF temp.>50?
70 120 vibración
50. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará si
no
95
fallará fallará vibr.>70? F
no no si
50 fallará
NF temp.>50?
70 120 vibración no si
F
51. Árboles de decisión
vibr.>120?
no si
temp.
temp.>95? F
fallará si
no
95
fallará fallará vibr.>70? F
no no si
50 fallará
no
fallará NF temp.>50?
70 120 vibración no si
NF F
52. Más facil de entender e interpretar.
Niveles altos, atributos importantes.
Rectas de las fronteras perpendiculares a los ejes.
Se pueden utilizar para proporcionar información.
53. Redes Neuronales
Fronteras más complejas.
Formado por grandes
tablas numéricas.
Imposibles de interpretar.
Se puede utilizar como
clasificador. No sirve para
proporcionar información.
54. Redes Neuronales
Fronteras más complejas.
temp.
Formado por grandes fallará
tablas numéricas.
95
fallará
Imposibles de interpretar. no
fallará
50 fallará
Se puede utilizar como no
clasificador. No sirve para fallará
proporcionar información. 70 120 vibración
55. Computo ON-LINE
Tiempo necesario para clasificar un nuevo ejemplo.
Árboles de Decisión: Tiempo para recorrer el árbol, evaluar las funciones
de cada nodo una vez este clasificado.
Redes Neuronales: Tiempo para realizar las operaciones incluidas en la
red.
Métodos Probabilísticos: Tiempo para calcular probabilidades.
56. Ejemplo
Tomamos imágenes aéreas tanto en el espectro visible
(RGB) como en el infrarrojo (I).
Cada pixel tendrá un vector de 4 atributos.
Según los atributos, cada pixel lo clasificamos.
Río
Montaña
Coche
Edificio
El tiempo de computo es muy importante al analizar
muchos pixeles.
58. Computo OFF-LINE
Tiempo necesario para construir y/o ajustar el modelo
a partir de los ejemplos de entrenamiento.
Árboles de Decisión: Tiempo necesario para elegir la estructura del árbol
y los atributos a situar en cada uno de los nodos.
Redes Neuronales: Tiempo necesario para ajustar los pesos de las
conexiones.
Este tiempo no suele ser muy importante.
Consiste en generar el modelo, tarde lo que tarde.
Siempre que sea optimo y reduzca el tiempo ON-LINE.
59. Dificultad de ajustes de
parámetros.
Muy fácil generar el modelo, ya que no hay parámetros
que ajustar o que el modelo es poco sensible a la
modificación de estos. (Árboles de decisión).
Hay veces en los que hay que “podarlos”.
Dificultades al ajustar el modelo para que nos de
resultados óptimos, al disponer de muchos parámetros
a ajustar o que es muy sensible a la modificación de
los mismos. (Redes neuronales).
60. Robustez ante ejemplos de
entrenamiento ruidosos.
Base de datos muy grande, ejemplos mal etiquetados.
Ejemplo: Maquina que no falló, etiquetada como que si lo hizo.
Los algoritmos de árboles de decisión o de redes
neuronales, pueden funcionar correctamente aunque
haya un porcentaje ruidoso en el conjunto.
Los algoritmos como el vecino más cercano, no
ofrecen buenos resultados.
61. Sobreajuste (OVERFITTING)
Problema muy común.
El modelo se ajusta demasiado a los ejemplos de
entrenamiento.
Es imposible generalizar.
Las fronteras de decisión muy complejas producen un
sobreajuste.
62. Correcta Sobreajustada
No consigue 100% de Consigue el 100% de
clasificaciones correctas. clasificaciones correctas.
Correctamente Frontera artificial.
separadas.
63. Correcta Sobreajustada
No consigue 100% de Consigue el 100% de
clasificaciones correctas. clasificaciones correctas.
Correctamente Frontera artificial.
separadas.
64. Correcta Sobreajustada
No consigue 100% de Consigue el 100% de
clasificaciones correctas. clasificaciones correctas.
Correctamente Frontera artificial.
separadas.
65. Correcta Sobreajustada
No consigue 100% de Consigue el 100% de
clasificaciones correctas. clasificaciones correctas.
Correctamente Frontera artificial.
separadas.
66. Correcta Sobreajustada
No consigue 100% de Consigue el 100% de
clasificaciones correctas. clasificaciones correctas.
Correctamente Frontera artificial.
separadas.
68. Los métodos de aprendizaje inductivo se
clasifican en:
Lazy Eager
No construyen un Construyen un modelo.
modelo.
Parte del trabajo se hace
Hacemos todo el off-line, al recopilar todos
procesamiento on-line. los conjuntos de
entrenamiento.
El vecino más cercano
sería un ejemplo. Como pueden ser los
árboles de decisión,
redes neuronales, etc.
70. Vecino mas cercano
Consiste en...
Modelo de clasificación inductivo basado en el método
lazy
No crea ningún modelo durante el entrenamiento, lo
único que hace es almacenar en una base de datos los
ejemplos de entrenamiento
Consiste en clasificar elementos futuros únicamente
comparando la instancia a clasificar con su lista de
datos
71. Vecino mas cercano
Puede llevarse a cabo de dos formas:
Clasificación directa con la instancia más cercana
El nuevo ejemplo a clasificar se le asigna la clase de la
instancia más cercana al mismo (1-NN).
Clasificación teniendo en cuenta una región
La nueva instancia debe ser clasificada según el
máximo número de elementos de una clase dentro de
una región (K-NN) donde K>1.
72. Vecino mas cercano
Aclaración
En la gráfica aparecen X2
representados los Instancias de entrenamiento
Clase A
ejemplos de
Clase B
Clase C
entrenamiento que han
Nueva instancia por
clasificar
sido recopilados y de los
cuales conocemos su
clase, dentro del modelo
tenemos introducido
otro ejemplo, el cual
deseamos clasificar
X1
73. Vecino mas cercano
Aclaración
Método básico: solo un vecino 1-NN
X2
Instancias de entrenamiento
Clase A
Clase B
Clase C
Nueva instancia por
clasificar
Asignado el
ejemplo mas
cercano
X1
74. Vecino mas cercano
Si decidimos realizar una
clasificación la cuál no será
directamente el dato más
cercano, sino que se clasifica
según la clase que más se
repita dentro de una región,
Ejemplo aclaratorio debemos dar valores al
parámetro K. Donde K debe ser
mayor que 1
X2
Instancias de entrenamiento
K-NN
Clase A
Clase B
Asignamos la
Clase C
Nueva instancia por
clase a la
clasificar
mayoritaria de
las K instancias
mas cercanas Para este caso con k=5
X1
75. Vecino mas cercano
Ponderación de la función de distancia (K-NN)
Consiste en dar mayor importancia a los vecinos más
cercanos
N: Numero de ejemplos de cada clase ponderados
di: Distancia al ejemplo a clasificar
Cuanto menor sea la distancia mayor será el factor de
ponderación de la clase, damos más importancia a las
distancias en un k-NN
76. Vecino mas cercano
Procedimiento de clasificación de una nueva instancia
Normalmente distancias
Calcular la distancia. euclídeas, pudiendo
eliminar la raíz ya que
busco la distancia mayor
desde el ejemplo a
clasificar hasta todos los
ejemplos de
entrenamiento
Las distancias se miden en el espacio de atributos, por tanto trabajamos en
tantas dimensiones como atributos tengamos.
Elegir las K instancias más próximas y se asigna la clase
Por tanto tenemos que calcular la distancia a
mayoritaria entre las K instancias. TODOS los ejemplos de entrenamiento, por
tanto aunque tengamos un tiempo de computo
OFF-LINE corto, pues simplemente consiste en
Por lo que hay que calcular la distancias a todos los ejemplos de
almacenar los datos, el tiempo de computo ON-
LINE es alto pues necesitamos medir para
TODOS los ejemplos que deseamos clasificar su
entrenamiento (Alto tiempo de computo on-line) distancia a TODAS las instancias de ejemplo
Es importante la normalizaciónIMPORTANTE LA LOS
ES de los atributos (Atributos con
NORMALIZACIÓN DE
mayor valor absoluto siempreATRIBUTOS CONQUE LOS sobre los demás)
prevalecen
ATRIBUTOS, YA
MAYOR
VALOR ABSOLUTO
SIEMPRE PREVALECEN
SOBRE LOS DEMÁS.
77. Vecino mas cercano
Ejemplo
Weka hace uso de la siguiente formula para normalizar los
atributos en el rango de 0 a 1
Teniendo en cuenta que poseemos la siguiente base de datos formada por 4
instancias (ejemplos de entrenamiento) donde cada una dice el una persona devuelve
Menudo pastón cobra si
un préstamo según la edad y poder adquisitivo,abuelo
determinar si una persona de 65 años
e ingresos de 25000€ devolverá el préstamo:
Ejemplo Salario Edad Devuelve el préstamo
Aparentemente lo más
1 100,000 55 Si importante es la edad,
por tanto inicialmente
2 90,000 30 No podríamos llegar a la
conclusión que la clase del
3 15,000 60 Si ejemplo que deseamos
clasificar sería SI, por
tanto se le concedería el
4 20,000 25 No préstamo.
78. Vecino mas cercano
Ejemplo
Distancias:
El ejemplo más cercano es el cuarto, por tanto la clase
del ejemplo a clasificar sería que NO devolverá el
préstamo
79. Vecino mas cercano
Reducir el tiempo de computo on-line
Se reduce almacenando únicamente los elementos
relevantes, normalmente los de la frontera
Consiste en no guardar TODOS los ejemplos de
entrenamiento, solo los más representativos que en
principio son los que están cerca de la frontera entre 2
clases
80. Vecino mas cercano
Características
Capacidad de representación: Muy elevada, fronteras de decisión complejas.
Legibilidad: Ninguna, no se crea modelo
Tiempo de computo ON-LINE: Lento, es necesario calcular distancias a
todos los ejemplos de entrenamiento.
Tiempo de computo OFF-LINE: Rápido, solo el tiempo para almacenar todas
las instancias de entrenamiento.
Parámetros a ajustar: Solo el número de vecinos (K-NN)
Robustez ante instancias de entrenamiento ruidosas:
El 1-NN no es robusto.
A medida que aumentamos K se vuelve más robusto
Sobreajuste (overfitting): Es difícil que ocurra, más difícil con forme
aumentamos K.
82. Arboles de decisión
Consiste en...
Dada una base de datos se construyen diagramas de
construcciones lógicas, muy similares a los sistemas
de predicción basados en reglas
Se lee de arriba abajo y tienen las siguiente
características:
Representan funciones lógicas
(IF-THEN)
Compuesto de nodos y ramas
El NODO RAIZ es el nodo superior del árbol.
Los nodos internos están formados por los atributos (medidas)
Los nodos hojas están formados por las clases.
83. Arboles de decisión
Objetivo
El objetivo en el aprendizaje automático consiste en la creación de un
árbol de decisión a partir de un conjunto de instancias de entrenamiento
Si partimos de un gráfico la obtención del árbol es sencilla ya que solo
debemos satisfacer una serie de sentencias condicionales delalgoritmo
El ejemplo
un macabro
gráfico es
para decidir quien
sobrevivirá cuando se
Supervivientes del Titanic hunda el Titanic
Ingresos
Sexo
Hombre Mujer
Sobrevive Sobrevive
Edad
20 Edad<12 Edad>12
Sobrevive Sobrevive
Ingresos
No sobrevive
Ingresos<20 Ingresos>20
LAS SENTENCIAS IF-THEN PRODUCEN No sobrevive Sobrevive
FRONTERAS QUE TENGAN QUE SER
PERPENDICULARES A LOS EJES
12 Edad
84. Arboles de decisión
Entropía
La entropía se utiliza para encontrar el parámetro más significativo
en la caracterización de un clasificador.
Consiste en obtener el porcentaje de ejemplos de cada clase que
llega a cada nodo. Consiste en estimar cuanto de
separadas están las clases que me
r llegan a un nodo esto consiste en
i Porcentaje de instancias la Entropía, es decir, de
minimizar
pertenecientes a la todos los ejemplos de
clase i
entrenamiento que me llegan a un
nodo habrá un número de ejemplos
k Numero de clases clasificados con una clase y otros
clasificados con las demás clases,
Minimizar la Entropía consiste en que no haya mezclas de clases.
por tanto será mejor la elección de
un atributo, frente a otro, si
separa mejor las clases.
La entropía será máxima si a un nodo le llega el mismo porcentaje
de cada clase, si tenemos K clases:
85. Arboles de decisión
Ejemplo
Partimos de un conjunto de entrenamiento formado por 7 instancias
Las cuales definen si una máquina fallará o no, es decir, dos clases distintas.
Horas de
Temperatura Nivel de vibraciones Meses desde revisión Probabilidad de fallo
funcionamiento
ALTA ALTO <1000 > 1 MES fallará
BAJA BAJO <1000 < 1 MES no fallará
ALTA BAJO >1000 > 1 MES no fallará
ALTA BAJO <1000 > 1 MES no fallará
BAJA ALTO <1000 > 1 MES no fallará
BAJA ALTO >1000 > 1 MES fallará
ALTA ALTO <1000 < 1 MES fallará
86. Arboles de decisión
Ejemplo
Nosotros lo haremos de
forma visual pero el
El siguiente paso es obtener una nueva tabla a partir de los ejemplos de entrenamiento donde
algoritmo estudiará la
podemos observar cuantas clases y de que tipo son, para cada atributo: entropía de cada
atributo y decidirá su
posición en los distintos
Estudiando la base de datos para cada atributo se observa que el atributo que mejor separa un
nodos
número mayor de clases (Menor entropía) es el de
Ya que existen tres vibraciones
de las
siete instancias de
entrenamiento definidas
por Bajas Vibraciones, las
cuales son de la misma CLASE
ATRIBUTO VALORES (ENTROPÍA NULA).
clase
fallará no fallaraá
ALTO 2 2
Temperatura
BAJO 1 2
ALTO 3 1
Nivel de vibraciones
BAJO 0 3
< 1000 2 3
Horas de funcionamiento
> 1000 1 1
> 1 Mes 2 3
Meses desde la revisión
< 1 Mes 1 1
87. Arboles de decisión
Ejemplo
Arbol hasta el momento: NIVEL DE
VIBRACIÓN
ALTO BAJO
? No fallará
No fallará 1 instancia No fallará 3 instancia
Fallará 3 instancias Fallará 0 instancias
Por la derecha ya hemos acabado por que a la hojas solo le puede llegar
una clase ELECCIÓN DEL SIGUIENTE
ATRIBUTO TENIENDO EN
CUENTA QUE VAMOS A
En cambio en la zona izquierda tenemos entropía distinta de cero, ya ESTUDIAR LAS 4
INSTANCIAS QUE FALTAN
que 25% de los ejemplos dice que la máquina fallara y el resto dice que POR CLASIFICAR TENIENDO
EN CUENTA QUE LAS
no. VIBRACIONES SON ALTAS
88. Arboles de decisión
Ejemplo
Elección del siguiente atributo
El siguiente atributo que
CLASE
aparte de reducir la entropía,
ATRIBUTO VALORES
la minimiza en un mayor
fallará no fallaraá número de casos es la
Temperatura, por tanto
ALTO 2 0
Temperatura
obtendríamos:
BAJO 1 1
Nivel de vibración
< 1000 2 1
Horas de ALTO BAJO
funcionamiento
> 1000 1 0 Temperatura No fallará
ALTO BAJO (3,0)
> 1 Mes 2 1
Meses desde Fallará ?
la revisión
< 1 Mes 1 0 (2,0) (1,1)
89. Arboles de decisión
Ejemplo
Siguiendo con lo dicho hasta
ahora, vamos acortando el
Elección del siguiente atributo número de ejemplos d
entrenamiento que no han sido
clasificado, teniendo en cuenta
CLASE
ATRIBUTO VALORES que las vibraciones son ALTAS y
fallará la temperatura BAJA, quedaría
no fallaraá
por clasificar 2 instancias de
< 1000 0 entrenamiento 3
Horas de funcionamiento
> 1000 1 0
> 1 Mes 1 1
Meses desde la revisión
< 1 Mes 0 0
Arbol generado: Nivel de vibración
ALTO BAJO
Temperatura No fallará
ALTO BAJO (3,0)
Fallará Horas de
funcionamiento
(2,0)
<1000 >1000
(1,0) No fallará Fallará (1,0)
90. Arboles de decisión Mientras que el ID3 nunca produce
árboles demasiado grandes, sino
Poda (Pruning) que dejan de crecer cuando TODOS
los nodos hoja contienen una sola
clase o cuando en un camino del
árbol se han utilizado todos los
atributos, el C4.5 puede repetir
atributos en el árbol Hasta ahora hemos hablado de los
Algoritmos utilizados para construir o ajustar el modelo
modelos de clasificación, pero
algunos de estos modelos poseen
distintitos algoritmos utilizados
a partir de las instancias de entrenamiento para construir o ajustar el
modelo a partir de las instancias
de entrenamiento, vamos a ver 2
algoritmos del clasificador que
ID3: Atributos discretos. Deja de crecer cuando todos los nodos hoja
contienen unas sola clase o cuando en un camino del árbol se han utilizado
todos los atributos
C4.5: Para atributos continuos o reales y discretos. Implementado en WEKA
como J48. Puede repetir atributos en el árbol
Un árbol demasiado grande puede producir
sobreajuste, por tanto es necesario podar los árboles
91. Arboles de decisión
Poda (Pruning)
Consiste en realizar un test estadístico que indica si el árbol
podado funcionará previsiblemente mejor o peor que el árbol
sin podar.
Se considera el peor caso posible (peor situación posible dentro del
rango previsible).
El rango es mayor o menor en función de un parámetro que es
ajustable denominado nivel de confianza que por defecto vale
El rango es mayor o menor en función del nivel de confianza.
0.25, es decir, estudia si es mejor podar un árbol para el 25%
de los casos más desfavorables según una función de densidad
de probabilidad gaussiana.
Hay dos posibles tipos de poda:
Reemplazo de un subárbol (un subárbol se sustituye por una hoja).
Elevación de un subárbol (un subárbol se eleva en el árbol principal).
92. Arboles de decisión
Poda (Pruning)
N1
N1
Elevación de
un subárbol
N2 N3 N2 N4
A B C N4 A B C* D*
D E
N1
Remplazo de A+B N3
un subárbol
C N4
D E
93. Arboles de decisión
Caracteristicas
Capacidad de representación: No muy elevada, las superficies de decisión son
siempre perpendiculares a los ejes.
Legibilidad: Muy elevada, Uno de los mejores modelos en este sentido
Tiempo de computo ON-LINE: Muy rápido, clasificar un nuevo ejemplo es tan sencillo
como recorrer el árbol hasta alcanzar un nodo hoja.
Tiempo de computo OFF-LINE: Rápido, tanto ID3 como C4.5 son algoritmos simples.
Parámetros a ajustar: Fundamentalmente el nivel de confianza para la poda. Fácil de
ajustar: el valor por defecto (25%) da buenos resultados.
Robustez ante instancias de entrenamiento ruidosas: Robusto, cualquier ejemplo de
entrenamiento ruidoso no va a afectar si hay suficientes instancias de entrenamiento.
Sobreajuste (overfitting): No se produce siempre que se realice una poda del árbol
C4.5.
95. Validación cruzada
Cross-validation
CROSS-VALIDATION
Es una técnica utilizada para evaluar los resultados de
un análisis estadístico y garantizar que son
independientes de la partición entre datos de
entrenamiento y prueba. Es una forma de
Establecer si el modelo
generado funcionará mal
Con la validación cruzada buscamos: Se utiliza en entornos
donde el objetivo principal
Validar la solidez de un modelo determinado. es la predicción y se quiere
estimar cómo de preciso
es un modelo que se
Evaluar varios modelos de una instrucción única. llevará a cabo a la
práctica.
Generar varios modelos e identificar a continuación el mejor modelo
basándose en estadísticas.
96. Validación cruzada
Consiste en...
Consiste en repetir y calcular la media aritmética
obtenida de las medidas de evaluación sobre
diferentes particiones.
Se calcula el porcentaje de aciertos sobre los datos no
utilizados para generar el modelo para proporcionarnos
una medida de cuan de preciso es. Por tanto el procedimiento
de validación cruzada nos
permite obtener una
medida realista y utilizar
todos los ejemplos de
entrenamiento para
generar el árbol
97. Validación cruzada
Consiste en...
Consiste en repetir y calcular la media aritmética
obtenida de las medidas de evaluación sobre
diferentes particiones.
Se calcula el porcentaje de aciertos sobre los datos no
utilizados para generar el modelo para proporcionarnos
una medida de cuan de preciso es. Por tanto el procedimiento
de validación cruzada nos
permite obtener una
medida realista y utilizar
Problema: No siempre tenemos un conjunto de
todos los ejemplos de
entrenamiento para
generar el árbol
entrenamiento grande
98. Validación cruzada
Pasos a seguir Para generar por ejemplo
un árbol de decisión
1. Se divide los datos de entrenamiento en 10 grupos (por
defecto) .
2. Separo un grupo y uso el resto (9) para generar el árbol,
midiendo el porcentaje de clasificación del grupo que no ha
sido utilizado para generar el árbol.
3. Repito el paso 2 para cada grupo
por tanto realizo el
paso 2 10 veces
4. Promedio todos los resultados, habiendo generado 10
arboles
No hay problema si el
5. El árbol definitivo se genera utilizando TODOS LOS GRUPOS. tiempo de computo OFF-
LINE para generar el
modelo es bajo como es
en el caso de arboles de
decisión
100. Razonamiento bayesiano
Clasificador bayesiano
Enfoque probabilístico de la Probabilidad de que un
inferencia. patrón pertenezca a una
clase
Está basado en asumir que las
incógnitas de interés siguen
distribuciones probabilísticas. Clase A Clase C
Se puede conseguir una
solución óptima por medio de Clase B
estas distribuciones y datos
observados.
101. Aprendizaje bayesiano
Consiste en...
El aprendizaje se puede ver
como el proceso de
Conocimiento previo
encontrar la hipótesis más
probable, dado un conjunto Entrenamiento
de ejemplos de
entrenamiento y un
conocimiento a priori sobre Hipótesis
la probabilidad de cada
hipótesis.
Clasificación
102. Aprendizaje bayesiano
Caracteristicas
Cada ejemplo de entrenamiento afecta a la
Esto es más efectivo que
probabilidad de las hipótesis. descartar directamente
las hipótesis
incompatibles.
Se puede incluir conocimiento a priori:
Probabilidad de cada hipótesis
Distribución de probabilidades de los ejemplos.
Una nueva instancia es clasificada como función de la
predicción de múltiples hipótesis, ponderadas por sus
probabilidades.
103. Teorema de Bayes
En la teoría de la probabilidad el
teorema de Bayes es un resultado
enunciado por Thomas Bayes en
1763 que expresa la probabilidad
condicional de un evento aleatorio A
dado B en términos de la distribución
de probabilidad condicional del evento
B dado A y la distribución de
probabilidad marginal de sólo A.
Termino a calcular para Termino a calcular a partir de
clasificar un nuevo ejemplo los ejemplos de entrenamiento
Thomas Bayes (Londres, Inglaterra, 1702 -
Tunbridge Wells, 1761) fue un matemático
h Hipótesis (Objeto) británico.
D Conjunto de valores de los atributos
104. Teorema de Bayes
Probabilidades
P(h) Probabilidad a priori de un de los objetos
P(D) Probabilidad a priori de que los atributos
tengan unos ciertos valores
P(h|D) Probabilidad a posteriori de que una instancia
P(h|D)
Dado que los atributos
muestran ciertos valores.
pertenezca a una clase Este es el dato a obtener para
clasificar una nueva
instancia
P(D|h) Probabilidad a posteriori de que los atributos
posean unos ciertos valores P(D|h)
Dado que la instancia
pertenece a una cierta
clase
105. Teorema de Bayes
Calculo de probabilidades
P(h) La probabilidad a priori de una clase se puede
P(h)
calcular como el porcentaje de ejemplos de
Fácil de calcular
Suponiendo que los
ejemplos de
entrenamiento pertenecientes a esa clase. entrenamiento se eligen
aleatoriamente
P(D) Para estimar la probabilidad de que los P(D)
atributos tengan un cierto conjunto de valores esMuy difícil de calcular.
Para calcular la
necesario disponer de un número extremadamente distribución que siguen
una serie de atributos
necesitamos un conjunto
elevado de ejemplos de entrenamiento. de entrenamiento muy
grande
Si los atributos son continuos se ha de estimar
Estimar otros tipos de
distribuciones es funciones de densidad. Por lo general gausianas
complicadisimo
106. Teorema de Bayes
Calculo de probabilidades II
P(D|h)
Complicado de obtener
Similar a estimar la probabilidad de que los atributos
posean un cierto conjunto de valores
Solo aplicable a una fracción de las instancias de
entrenamiento: aquellas cuya clase es h
107. Aprendizaje bayesiano
Clase a la que pertenece una nueva instancia
Por ejemplo aplicamos el teorema de Bayes para dos clases
Para mas ejemplos tan
solo tendríamos que
realizar varias
comprobaciones
siguiendo un algoritmo de
comparación para
obtener el máximo
Con denominadores comunes tan solo hemos de calcular
Por lo que la nueva instancia pertenece a la clase A
108. Aprendizaje bayesiano
Ventajas y desventajas
Ventajas
Es un aprendizaje casi optimo
Desventajas
Necesidad de un conocimiento a priori. Si no se tiene este
conocimiento estas probabilidades han de ser estimadas.
Coste computacional alto para generar el modelo. En el caso
general es lineal con el número de hipótesis candidatas.
Se ha de disponer de un gran número de ejemplos de
entrenamiento
109. Clasificador bayesiano ingenuo
Naïve Bayes
Método muy utilizado en la práctica.
Permite aplicar el aprendizaje bayesiano incluso
cuando el número de ejemplos disponible es pequeño.
Se basa en: Es a causa de estas
simplificaciones, que se
suelen resumir en la
Suponer que todos los atributos son independientes hipótesis de
independencia entre las
(más fácil estimar las probabilidades).
variables predictoras, que
recibe el apelativo de
ingenuo.
En la practica esta suposición se cuando elen la gran
¿Por qué es posible aplicar Naïve Bayes da
número de ejemplos es pequeño?
mayoría de los casos atributos son independientes, se cumple:
Cuando dos
P(at =val,at =val )=P(at =val)⋅P(at =val )
Una función de densidad de probabilidad univariante es mucho
más fácil de estimar que una multivariante.
110. Aprendizaje bayesiano
Conclusiones
Capacidad de representación alta: las fronteras de decisión pueden tener cualquier
forma.
Legibilidad: Baja, debido a que los modelos son funciones de densidad de
probabilidad.
Tiempo de computo on-line: Rápido una vez que el modelo ha sido estimado.
Tiempo de computo off-line: Lento: es necesario estimar las funciones de densidad
de probabilidad a partir de las instancias de entrenamiento.
Parámetros a ajustar: Relacionados con el tipo de función de densidad de a ajustar
Parametros
probabilidad de los atributos. Naïve Bayes es fácil de
utilizar, pero en general
el aprendizaje Bayesiano
no lo es.
Robustez ante instancias de entrenamiento ruidosas: Muy alta, dado que el
método está basado en probabilidades.
Sobrepujaste (overfitting): Imposible obtener sobreajuste al trabajar con
probabilidades.
112. Reconocimiento de objetos
Basados en puntos significativos
Para cualquier objeto en una imagen, se pueden extraer una
serie de puntos de interés para proporcionar una descripción
del objeto.
Es importante que las características extraídas de la imagen de
entrenamiento sean detectables incluso bajo cambios de
Estos puntos
generalmente se
encuentran en regiones
escala de la imagen, ruido e iluminación. de alto contraste de la
imagen, tales como los
bordes del objeto.
113. Reconocimiento de objetos
Scale-invariant feature transform
Se trata de un algoritmo para detectar y describir las
características locales de las imágenes.
Fue publicado por David Lowe en 1999.
Los puntos clave de los objetos son extraídos de una
serie de imágenes de referencia y almacenados en una
base de datos. conalmacenan el conjunto de puntos significativos
Se
sus características para cada objeto
El objeto se clasifica por el vecino mas cercano en la
base de datos.
114. Reconocimiento de objetos
Basados en puntos significativos
Invariantes a la geometría:
Rotación, traslación, escala...
Invariantes a características
fotometricas: Brillo,
exposición...
116. Haar-like features
Detectores basados en caracteristicas tipo Haar
El esquema del algoritmo está inspirado en el modelo
de Viola-Jones 2001 paradelaalgoritmos de objetos en tiempoViola y Michel Jones en
Una serie
detección
propuesto por Paul
real
Estos detectores se basan en una cascada de
clasificadores que es explorada por toda la imagen en
múltiples escalas y localizaciones. Boost Adaptative
AdaBoost:
Cada etapa de la cascada se basa en el uso de simples
características tipo Haar seleccionadas y combinadas
mediante AdaBoost durante el entrenamiento.
117. Haar-like features
Rapidez del clasificador
La eficiencia de este esquema reside en el hecho de
que los negativos van siendo eliminados
progresivamente.
Si Si Si
Imagen Clasificador 1 Clasificador 2
...... Clasificador N Positivo
No No No
Negativo
Muy utilizado para la detección de objetos en tiempo real
118. Haar-like features
Detección de caras
son 12x12 para ojos1 y nariz,
nuevamente de 2, 3 y 4).
nsionadas con 10 etapas, una
98% y una tasa de falsos
a etapa ha sido entrenada con
s, utilizando 900 ejemplos de
st.
cabamos de dar en el último
a tasa de falsos positivos haya
Fig. 5. Zonas de interés en una cara detectada para ojo izquierdo, o
magnitud respecto al detector
derecho, nariz y boca.
un descenso tan acusado? La por Paul Viola y
Algunas características tipo Haar propuestas
boca son elementos con Jones Michel
una
que la de la cara entera, de III. RESULTADOS
nformación estructural que
Hinweis der Redaktion
\n
Antes de empezar creo que es conveniente hablar de lo que sabemos o no acerca del reconocimiento de objetos, cosas como su funcionamiento, su utilidad y sus or&#xED;genes.\n\nDe esta forma creo que lo adecuado es empezar por sus or&#xED;genes.\n
Se puede decir que el origen del reconocimiento de objetos surge de la necesidad del ser humano de diferenciar entre dos objetos similares o entre dos personas parecidas. Como bien puede ser diferenciar a dos hermanos gemelos o para diferenciar a dos animales de la misma especie. Lo que viene a ser el &#x201C;&#xBF;qui&#xE9;n es qui&#xE9;n?&#x201D;.\n
Se puede decir que el origen del reconocimiento de objetos surge de la necesidad del ser humano de diferenciar entre dos objetos similares o entre dos personas parecidas. Como bien puede ser diferenciar a dos hermanos gemelos o para diferenciar a dos animales de la misma especie. Lo que viene a ser el &#x201C;&#xBF;qui&#xE9;n es qui&#xE9;n?&#x201D;.\n
De forma muy b&#xE1;sica y comparado con el humano un sistema de reconocimiento de objetos se compone de tres sencillos pasos. Para empezar un sistema de adquisici&#xF3;n de im&#xE1;genes captura una imagen del entorno deseado (que ser&#xED;a el ojo), acto seguido esta imagen es enviada a una unidad de procesamiento (el cerebro) el cual se encarga de separar los objetos que se encuentran en nuestra imagen tras lo cual se recurren a los patrones de los que disponemos para diferenciarlos (en nuestro caso lo har&#xED;amos recurriendo a la memoria).\n
De forma muy b&#xE1;sica y comparado con el humano un sistema de reconocimiento de objetos se compone de tres sencillos pasos. Para empezar un sistema de adquisici&#xF3;n de im&#xE1;genes captura una imagen del entorno deseado (que ser&#xED;a el ojo), acto seguido esta imagen es enviada a una unidad de procesamiento (el cerebro) el cual se encarga de separar los objetos que se encuentran en nuestra imagen tras lo cual se recurren a los patrones de los que disponemos para diferenciarlos (en nuestro caso lo har&#xED;amos recurriendo a la memoria).\n
Una de las posibles utilidades de un sistema de reconocimiento de objetos puede ser el reconocimiento de patrones para la detecci&#xF3;n de caras, separar los objetos de una imagen del fondo. Diferenciar en una fotograf&#xED;a si la mariposa que en ella aparece es de un tipo u otro e incluso, en un grupo de mariposas, encontrar la que buscamos y descartar el resto.\n
Una de las posibles utilidades de un sistema de reconocimiento de objetos puede ser el reconocimiento de patrones para la detecci&#xF3;n de caras, separar los objetos de una imagen del fondo. Diferenciar en una fotograf&#xED;a si la mariposa que en ella aparece es de un tipo u otro e incluso, en un grupo de mariposas, encontrar la que buscamos y descartar el resto.\n
El reconocimiento de patrones es la disciplina cient&#xED;fica cuyo objetivo es la clasificaci&#xF3;n de objetos en un cierto n&#xFA;mero de categor&#xED;as, de esta forma cualquier tipo de medida que lo necesite ser&#xE1; clasificada.\n\nPara ello existen 3 formas de hacerlo, que son con los enfoques estad&#xED;stico, sint&#xE1;ctico o estructural y mediante redes neuronales.\n
Tanto el enfoque estad&#xED;stico (t&#xAA; de decisi&#xF3;n) como el basado en redes neuronales utilizan patrones que se extraen de sus propiedades de naturaleza cualitativa, como por ejemplo el color, tama&#xF1;o, densidad, peso, volumen que ocupan, etc.\n\nPor otro lado el enfoque sint&#xE1;ctico se fundamenta en las relaciones geom&#xE9;tricas asociadas a la forma de los objetos, lo que nos permite reconocer diferentes vistas de los mismos.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
En el esquema de funcionamiento de un sistema de reconocimiento existen dos partes claramente diferenciadas, que son las fases de funcionamiento y dise&#xF1;o. Para &#xE9;sta &#xFA;ltima necesitamos un conjunto de muestras del objeto que queremos procesar, as&#xED; pues para ello se debe realizar una selecci&#xF3;n de caracter&#xED;sticas y dise&#xF1;ar el clasificador a partir de unas funciones de decisi&#xF3;n que se explicar&#xE1;n m&#xE1;s adelante.\n\nPara la fase de funcionamiento se podr&#xED;a decir que la primera etapa es casi la m&#xE1;s importante, &#xE9;sta es la Imagen digital, resulta importante ya que de no ser de una calidad adecuada el reconocimiento puede resultar fallido, pero no basta con tener la imagen, tambi&#xE9;n hay que operar con ella y hacerle operaciones como la detecci&#xF3;n de bordes o el aumento de la nitidez, esto lo realiza la etapa de preprocesado. En la etapa de segmentaci&#xF3;n se aisla al objeto, separ&#xE1;ndolo del resto de la imagen. Acto seguido se extraen las caracter&#xED;sticas que definen al objeto que estamos estudiado y con ese vector de atributos realizamos la clasificaci&#xF3;n. Estas dos &#xFA;ltimas etapas est&#xE1;n intr&#xED;nsicamente relacionadas con las vistas en la fase de dise&#xF1;o ya que &#xE9;stas son definidas y reguladas desde la etapa de dise&#xF1;o.\n
La segmentaci&#xF3;n, como muy bien explicaron los compa&#xF1;eros la semana pasada es el proceso por el cual se divide una imagen digital en varias partes u objetos y as&#xED; poder separar nuestro objeto de estudio del fondo y del entorno.\n\nSu principal objetivo es simplificar la forma de representar una imagen para ayudarnos en su estudio.\n\nAs&#xED; pues, mediante un etiquetado pixel a pixel podemos separar los puntos que comparte la misma etiqueta, los cuales, podemos afirmar que tendr&#xE1;n grandes similitudes visuales.\n
Se trata de transformar un objeto perteneciente a una imagen en un vector de atributos que lo defina, de forma que sea m&#xE1;s f&#xE1;cil compararlo con el resto de objetos a fin de diferenciarlo de ellos.\n\nInicialmente no sabemos si un dato ser&#xE1; o no relevante, por tanto para generar un modelo introduciremos atributos y posteriormente podremos determinar si un atributo es o no relevante para la clasificaci&#xF3;n.\n\nSi hay pocos ejemplos estos datos no relevantes pueden interferir en el modelo, por tanto debemos aumentar el numero de ejemplos de entrenamiento o realizar una etapa inicial de selecci&#xF3;n de caracter&#xED;sticas o atributos que influyan, dicho de otra forma, eliminar atributos poco relevantes o que induzcan a error.\n
Cosas tales como el color, la forma geom&#xE9;trica o el volumen son cosas que nos ayudan a diferenciar varios objetos. Pero a la hora de elegir las caracter&#xED;sticas debemos tener en cuenta ciertas propiedades que nos ayuden a realizar de forma correcta nuestras tareas. De forma que no podemos elegir cualquiera, ya que puede inducirnos a error.\n\nLas principales propiedades que deben cumplir las caracter&#xED;sticas que elijamos son las siguientes:\n=>Robustez: la extracci&#xF3;n debe ser insensible al ruido de captura e iluminaci&#xF3;n, ya que en muchas ocasiones no se consigue limpiar la imagen al 100%\n=>Discriminantes: las caracter&#xED;sticas deben servir para distinguir objetos de clases distintas, de esta forma se entiende que no se puede distinguir entre un cami&#xF3;n y un coche si la caracter&#xED;stica que analizamos es el color de la carrocer&#xED;a.\n=>Invariante ante traslaci&#xF3;n: los valores de las caracter&#xED;sticas son independientes de la posici&#xF3;n. Rotaci&#xF3;n y escalado: caracter&#xED;sticas independientes de la orientaci&#xF3;n del objeto y de su tama&#xF1;o. Perspectiva: transformaciones no lineales de deformaci&#xF3;n.\n
Cosas tales como el color, la forma geom&#xE9;trica o el volumen son cosas que nos ayudan a diferenciar varios objetos. Pero a la hora de elegir las caracter&#xED;sticas debemos tener en cuenta ciertas propiedades que nos ayuden a realizar de forma correcta nuestras tareas. De forma que no podemos elegir cualquiera, ya que puede inducirnos a error.\n\nLas principales propiedades que deben cumplir las caracter&#xED;sticas que elijamos son las siguientes:\n=>Robustez: la extracci&#xF3;n debe ser insensible al ruido de captura e iluminaci&#xF3;n, ya que en muchas ocasiones no se consigue limpiar la imagen al 100%\n=>Discriminantes: las caracter&#xED;sticas deben servir para distinguir objetos de clases distintas, de esta forma se entiende que no se puede distinguir entre un cami&#xF3;n y un coche si la caracter&#xED;stica que analizamos es el color de la carrocer&#xED;a.\n=>Invariante ante traslaci&#xF3;n: los valores de las caracter&#xED;sticas son independientes de la posici&#xF3;n. Rotaci&#xF3;n y escalado: caracter&#xED;sticas independientes de la orientaci&#xF3;n del objeto y de su tama&#xF1;o. Perspectiva: transformaciones no lineales de deformaci&#xF3;n.\n
Un claro ejemplo es el que mostramos, se ve una imagen en la cual aparecen unas letras escritas a boli, esa ser&#xED;a la imagen de la cual queremos realizar el reconocimiento de objetos, aunque en este ejemplo se trata de un reconocimiento de texto. En este segundo paso tenemos el vector de caracter&#xED;sticas o atributos que se han extraido de la imagen. Dicho vector se enviar&#xE1; al clasificador en el cual, tras aplicar los algoritmos necesarios para comparar nuestras caracter&#xED;sticas con las de la base de datos, se obtendr&#xE1; el texto digitalizado y se etiquetar&#xE1; a cada letra asignandole su valor alfanumerico.\n
El clasificador, como su propio nombre indica, se encarga de clasificar todos y cada uno de los objetos que le llegan y dividirlos en cada una de las clases que se hayan contemplado en la base de datos o en los patrones de referencia. Aqu&#xED; llega la imagen adecuadamente tratada y extraida de su fondo y entorno. \n\nLa clasificaci&#xF3;n parte de un vector de atributos obtenido mediante la extracci&#xF3;n de caracter&#xED;sticas, vector el cual es comparado con los existentes en las bibliotecas que usamos para clasificar nuestros objetos.\n\nLos mecanismos que se encargan de esta tarea son los que van a explicar mis compa&#xF1;eros a continuaci&#xF3;n, aunque antes hay que hacer referencia al dise&#xF1;o de esta etapa.\n
Se trata del algoritmo que se encarga de decidir la denominaci&#xF3;n de un objeto (definir a qu&#xE9; clase pertenece) a partir de las caracter&#xED;sticas o atributos extra&#xED;dos.\n\nM&#xE1;s adelante se van a ver los diferentes algoritmos de decisi&#xF3;n que podemos utilizar para la clasificaci&#xF3;n de los objetos.\n\nPor cuesti&#xF3;n de tiempo no vamos a poder tratar todas las formas de abordar la clasificaci&#xF3;n, por eso nos vamos a centrar en el dise&#xF1;o de clasificadores por entrenamiento de los mismos, es decir, en el aprendizaje m&#xE1;quina.\n
\n
Clasificaci&#xF3;n seg&#xFA;n el paradigma\n-Aprendizaje Deductivo: Las t&#xE9;cnicas del Aprendizaje Deductivo se basan en la transferencia de los conocimientos que un experto humano posee a un sistema inform&#xE1;tico. Un ejemplo paradigm&#xE1;tico de las metodolog&#xED;as que utilizan tales t&#xE9;cnicas lo constituyen los Sistemas Basados en el Conocimiento y, en particular, los Sistemas Expertos.\n\n-Aprendizaje Inductivo: Las t&#xE9;cnicas de Aprendizaje Inductivo se basan en que el sistema pueda, autom&#xE1;ticamente, conseguir los conocimientos necesarios a partir de ejemplos reales sobre la tarea que se desea modelizar. En este segundo tipo, los ejemplos los constituyen aquellas partes de los sistemas basados en los modelos ocultos de Markov o en las redes neuronales artificiales que son configuradas autom&#xE1;ticamente a partir de muestras de aprendizaje.\n\n-Por refuerzo:\nEl sistema no recibe informaci&#xF3;n de entrada, sino q intenta x si mismo obtener datos (EXPLORACI&#xD3;N AUTONOMA) y su sistema de aprendizaje es mediante prueba y error.\nProblema:&#xBF;EN QUE MOMENTO DEJAMOS DE APRENDER?\nSoluci&#xF3;n de compromiso: Dilema entre la exploraci&#xF3;n (continuar buscado nueva reglas) y la explotaci&#xF3;n (utilizar las reglas aprendidas)\n\nDentro del aprendizaje inductivo encontramos:\n\nAprendizaje supervisado\nEl algoritmo produce una funci&#xF3;n que establece una correspondencia entre las entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo es el problema de clasificaci&#xF3;n, donde el sistema de aprendizaje trata de etiquetar (clasificar) una serie de vectores utilizando una entre varias categor&#xED;as (clases). La base de conocimiento del sistema est&#xE1; formada por ejemplos de etiquetados anteriores. Este tipo de aprendizaje puede llegar a ser muy &#xFA;til en problemas de investigaci&#xF3;n biologica, biologia computacional y bioinformatica.\nAprendizaje no supervisado\nTodo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan s&#xF3;lo por entradas al sistema. No se tiene informaci&#xF3;n sobre las categor&#xED;as de esos ejemplos. Por lo tanto, en este caso, el sistema tiene que ser capaz de reconocer patrones para poder etiquetar las nuevas entradas.\nAprendizaje semisupervisado\nEste tipo de algoritmos combinan los dos algoritmos anteriores para poder clasificar de manera adecuada. Se tiene en cuenta los datos marcados y los no marcados.\nAprendizaje por refuerzo\nEl algoritmo aprende observando el mundo que le rodea. Su informaci&#xF3;n de entrada es el feedback o retroalimentaci&#xF3;n que obtiene del mundo exterior como respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.\nTransducci&#xF3;n\nSimilar al aprendizaje supervisado, pero no construye de forma expl&#xED;cita una funci&#xF3;n. Trata de predecir las categor&#xED;as de los futuros ejemplos bas&#xE1;ndose en los ejemplos de entrada, sus respectivas categor&#xED;as y los ejemplos nuevos al sistema.\nAprendizaje multi-tarea\nM&#xE9;todos de aprendizaje que usan conocimiento previamente aprendido por el sistema de cara a enfrentarse a problemas parecidos a los ya vistos.\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
CONCEPTO: (OBTENER UN MODELO) \nEs obtener el modelo el cual queremos aprender a partir de los ejemplos de entrenamiento, tambi&#xE9;n llamado hip&#xF3;tesis. Seg&#xFA;n los atributos, me dir&#xE1; la clase del nuevo ejemplo que tenemos que estudiar, EL MODELO.\nLos conceptos (tipos de modelos) se expresan de diferentes formas:\n &#xC1;rboles de decisi&#xF3;n\n Listas de reglas\n Redes Neuronales\n Vecino m&#xE1;s proximo\n Modelos bayesianos o probabil&#xED;sticos.\n Etc.\nLas fronteras de decisi&#xF3;n (frontera entre clases distintas de acuerdo con el modelo) que crea cada modelo, son diferentes. \n\n INSTANCIA: Cada uno de los ejemplos de entrenamiento vistos hasta ese momento.\n ATRIBUTO: Cada una de las medidas que forman el vector de atributos de un ejemplo, pueden ser:\n REALES: Puede tomar cualquier valor num&#xE9;rico dentro de un rango.\n DISCRETO: Toman valores discretos ordenados.\nEj: La temperatura como {alta, media, baja}.\n CATEG&#xD3;RICOS: Toma valores discretos no ordenados.\nEj: El color como {azul, rojo, amarillo}.\n CLASE: Es el atributo que debe deducirse a partir de los dem&#xE1;s.\n
an pasado anteriormente.\nEjemplo: modelado de la probabilidad de fallo de una m&#xE1;quina.\n- Clases: Comprobamos si la m&#xE1;quina puede fallar o no puede.\nAtributos: Son el conjunto de medidas con las que podemos ver si sucede:\nTemperatura.\nNivel de vibraciones.\nHoras de funcionamiento.\nMeses desde la &#xFA;ltima revisi&#xF3;n.\n- Instancias: Situaciones que han pasado anteriormente.\nConcepto: Relaci&#xF3;n entre las medidas y la probabilidad de fallo (IF-THEN).\n\nSI nivel_vibraciones = ALTO & temperatura = ALTA. ENTONCES va a fallar seguro.\n\n
\n
Es la capacidad de expresar varios conceptos diferentes, se estudia mediante la frontera de decisi&#xF3;n generada con cada modelo (&#xE1;rboles de decisi&#xF3;n, redes neuronales, etc), unos ejemplos con solo 2 atributos podr&#xED;an ser:\n\nInstant&#xE1;neamente podemos ver lo que est&#xE1; haciendo nuestro modelo, el problema fundamental de este clasificador es que las rectas que definen a las fronteras de decisi&#xF3;n han de ser perpendiculares a los ejes. LOS &#xC1;RBOLES SON F&#xC1;CILES DE ENTENDER E INTERPRETAR, LOS NIVELES ALTOS DEL &#xC1;RBOL INDICAN LOS ATRIBUTOS M&#xC1;S IMPORTANTES. \nPUDIENDO UTILIZARSE PARA OFRECER INFORMACI&#xD3;N.\nRedes neuronales. Tiene fronteras no lineales.\nMayor capacidad de representaci&#xF3;n.\nPermiten representar conceptos m&#xE1;s complejos que los arboles de decisi&#xF3;n.\n\nSus fronteras son mucho m&#xE1;s complejas, lo que hace que el modelo est&#xE9; formado por grandes tablas num&#xE9;ricas, siendo habitualmente imposible ver intuitivamente lo que est&#xE1; haciendo el modelo. Son muy dif&#xED;ciles o imposibles de interpretar, ya que hay m&#xFA;ltiples conexiones entre neuronas con pesos diferentes, y no podemos ver que atributo influye m&#xE1;s. \nSE PUEDE UTILIZAR COMO UN CLASIFICADOR, PERO NO PARA OFRECER INFORMACI&#xD3;N.\n\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
Arboles de decisi&#xF3;n: tiempo necesario para elegir la estructura del &#xE1;rbol y los atributos a situar en cada uno de los nodos.\nRedes Neuronales: tiempo necesario para ajustar los pesos de las conexiones.\n
NOTA PARA ALDO:\n&#x201C;Funcionando muy lejos del nivel &#xF3;ptimo si no se establece todo bien, necesitamos un &#xF3;ptimo entrenamiento de las redes neuronales (velocidad: tasa de aprendizaje, n&#xBA; iteraciones de la red neuronal).&#x201D; \n\nNo entiendo lo que dice gonzalo.\n
Unos ejemplos de entrenamiento ruidosos, se producen cuando hay una base de datos muy grande y puede que hayan ejemplos mal etiquetados.\n
A medida que a&#xF1;adimos niveles al Arbol de decisi&#xF3;n, las hip&#xF3;tesis se refinan tanto que describen muy bien los ejemplos utilizados en el aprendizaje, pero el error de clasificaci&#xF3;n puede aumentar al evaluar ejemplos.\nSe dice que una hip&#xF3;tesis h se sobreajusta al conjunto de entrenamiento si existe alguna otra hip&#xF3;tesis h' tal que el error de h es menor que el de h' sobre el conjunto de entrenamiento, pero es mayo sobre la distribuci&#xF3;n completa de ejemplos del problema (entrenamiento + test).\nEs decir, clasifica muy bien los datos de entrenamiento pero luego no sabe generalizar al conjunto de test. Es debido a que aprende hasta el ruido del conjunto de entrenamiento, adapt&#xE1;ndose a las regularidades del conjunto de entrenamiento).\n\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
Un clasificador bayesiano es un clasificador de patrones basado en teor&#xED;as estad&#xED;sticas de aprendizaje. El aprendizaje bayesiano calcula la probabilidad de cada hip&#xF3;tesis de los datos y realiza predicciones sobre estas bases. Es un aprendizaje casi &#xF3;ptimo, pero requiere grandes cantidades de c&#xE1;lculo debido a que el espacio de hip&#xF3;tesis es normalmente muy grande, o incluso puede ser infinito.\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
\n
Otra caracter&#xED;stica importante de estas caracter&#xED;sticas es que las posiciones relativas entre ellos en la escena original no debe cambiar de una imagen a otra. Por ejemplo, si s&#xF3;lo las cuatro esquinas de una puerta fueron utilizados como caracter&#xED;sticas, que podr&#xED;a funcionar independientemente de la posici&#xF3;n de la puerta, pero si los puntos en el marco se utiliza tambi&#xE9;n, el reconocimiento fallar&#xED;a si la puerta est&#xE1; abierta o cerrada\n\n\n
David G. Lowe profesor del departamento de ciencias de la computaci&#xF3;n de la University of British Columbia e investigador de visi&#xF3;n artificial \nSe almacenan el conjunto de puntos significativos con sus caracter&#xED;sticas para cada objeto\n
\n
\n
Estos detectores se basan en una cascada de clasificadores que es explorada por toda la imagen en m&#xFA;ltiples escalas y localizaciones. Cada etapa de la cascada se basa en el uso de simples caracter&#xED;sticas tipo Haar (eficientemente computadas utilizando la imagen integral) seleccionadas y combinadas mediante AdaBoost durante el entrenamiento.\n
La eficiencia de este esquema reside en el hecho de que los negativos (la inmensa mayor&#xED;a de las ventanas a explorar) van siendo eliminados progresivamente (ver Fig. 2), de forma que las primeras etapas eliminan a un gran n&#xFA;mero de ellos (los m&#xE1;s f&#xE1;ciles) con muy poco procesado. Esto permite que las etapas finales tengan tiempo suficiente para encargarse de clasificar correctamente los casos m&#xE1;s dif&#xED;ciles.\n\n