SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Agreement
 If you plan to share these slides or to use the content in these slides for
your own work, please include the following reference:
 Si tu intención es compartir esta presentación, o usar su contenido para tu
propio trabajo, por favor, incluye la siguiente referencia:
Tejero-de-Pablos, A. (2022) “Inteligencia artificial, visión por ordenador,
y datos multimodales”. ACE Japón Webinar Series.
Inteligencia artificial,
visión por ordenador,
y datos multimodales
ACE JAPÓN WEBINAR SERIES
ANTONIO TEJERO DE PABLOS
6 DE ABRIL DE 2022
Image from oracle.com
Índice
2
Sobre mí
Inteligencia artificial y visión por ordenador
Mi tema de investigación: Datos multimodales y
heterogéneos
El futuro de la inteligencia artificial
Sobre mí
Página web - https://antonio-t.github.io/
Sobre mí
 Universidad de Valladolid (~2012)
 Ingeniero de Telecomunicaciones
 Máster en Tecnologías de la Información y Comunicaciones
 Instituto de Ciencia y Tecnología de Nara (~2017)
 Doctorado en ingeniería (ciencias de la información)
 Universidad de Tokio – Instituto RIKEN (~2021)
 Investigador
 CyberAgent AI Lab (Actualidad)
 Científico investigador
4
Inteligencia artificial
y visión por
ordenador
Qué es la inteligencia
artificial
¿Robots?
¿Una réplica digital del
cerebro humano?
6
Image from analyticsinsight.net
Qué es la inteligencia artificial 7
La inteligencia artificial no es robótica
No siempre intenta imitar el cerebro del ser humano
 Pero es fácil de ejemplificar mediante el comportamiento de un robot
Inteligencia artificial vs. aprendizaje máquina
 Reconocimiento de patrones
Image from medium.com
Aprendizaje máquina 8
Reconocimiento de patrones
 Aportar datos (secuencias numéricas, imágenes, etc.) a un
algoritmo de aprendizaje que encuentra similitudes entre ellos a
la hora de realizar una tarea
 Implementado en un programa de ordenador
El reconocimiento de patrones permite:
 Predecir cambios en la población y otras estadísticas
 Traducir textos de un idioma a otro
 Reconocer caras para identificar usuarios
Image from simplilearn.com
Visión por ordenador
Los ojos (?) del robot
Reconocimiento de patrones en imágenes
Múltiples aplicaciones
 Medicina, automóviles, etc.
9
Image from IrisVision.com
Cámara
Fotos/
vídeos
Algoritmo de
aprendizaje
Image from shutterstock.com
Representación
latente
(características)
Visión por ordenador: Inicios
El humano determina qué ”características” aprender
 Limitado en cuanto a precisión y dificultad de la tarea
¿Qué es una red neuronal?
 Redes neuronales pequeñas en sus inicios
10
Image from wikipedia.org
Image from analyticsvidhya.org
Red neuronal
・Coche
・Persona
・…
Representación
mediante contornos
Visión por ordenador: Actualidad
Aprendizaje profundo
 Aumento exponencial del número de parámetros (~175 billones)
 La red neuronal determina las características a aprender de forma óptima
 Reconocimiento de patrones más complejos, tareas más complicadas
11
Image from researchgate.net
…
Aprendizaje profundo: Ejemplo 1
 Segmentación semántica
12
Image from nanonets.com
Aprendizaje profundo: Ejemplo 2
 Generación de imagen
No todo es ideal
 Se requieren grandes cantidades de datos (millones)
13
Image from twitter.com/charles2m
Mi tema de investigación:
Datos multimodales
y heterogéneos
El poder de los datos multimodales
El mundo es multimodal: imagen, video, audio, texto, etc.
Hay tareas que requieren más de un sentido
 Conducción: Imagen de la carretera + Voces de niños
 Diagnóstico: Imagen del corazon + Señal ECG
15
Image from aare.edu.au
El poder de los datos multimodales
Las redes neuronales pueden procesar distintos tipos de información
 Pero no es trivial en qué punto, y cómo han de mezclarse
16
・Coche
・Coche
Opción 1 Opción 2, etc.
Datos heterogéneos
El aprendizaje profundo requiere reunir grandes cantidades de datos
17
Images from wikipedia.org
Durante el
aprendizaje:
Una vez desplegado
el sistema:
Datos heterogéneos
El problema de generalización
 Una red neuronal ”naïve” sólo conoce los datos que ha visto
18
Image from Out-of-distribution Generalization and Its Applications for Multimedia (Wang et al.)
Algunos de mis resultados
Resumen automático de vídeo deportivo (detección de mejores momentos)
 Uso de datos multimodales (imagen y sensores)
Diagnóstico automático de imagen cardiaca
 Uso de datos heterogéneos debido a la escasez de pacientes
19
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM MEAN
MAX
…
Input view
images
Feature
extractor
Encoder Classifier Probabilities Final
decision
(ensemble)
N
N
(a)
(b)
(c)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
MEAN
MAX
…
Input view
images
Feature
extractor
Encoder Classifier Probabilities Final
decision
(ensemble)
N
N
(a)
(b)
(c)
(d)
(e)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
CNN
(VGG-M)
CNN
(VGG-M)
CNN
(VGG-M)
Input view
images
Feature
extractor
N
(a)
(b)
(c)
(d)
CPR volume
segment
(192×192×N
voxels)
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
CNN
(VGG-M)
FV
Linear
SVM
…
Input view
images
Feature
extractor
Encoder Classifier Probab
N
N
(a)
(b)
(c)
(d)
(e)
CPR volume
segment
(192×192×N
voxels)
Aprendizaje
Paciente 1
Scanner A
Despliegue
Paciente 2
Scanner B
+
El futuro de la
inteligencia artificial
El futuro cercano de la IA
¿Va a quitarnos la inteligencia artificial el trabajo?
 Posiblemente, con trabajos simples y repetitivos
 El ser humano centrado en la creación. Colaboración IA-humano.
Principal problema
 El individuo ”de a pie” no tiene fundamentos de ciencia / tecnología
21
Image from espsciencetime.org
El futuro lejano de la
inteligencia artificial
¿Va a reemplazar la inteligencia artificial al cerebro
humano?
 No con la tecnología actual
 Cerebro humano ≠ inteligencia
 La humanidad también evoluciona
 Idealmente, la inteligencia artificial será una ayuda
Todo esto es ciencia ficción
 Objetivos realistas a corto plazo
22
Image from bernardmarr.com
¡GRACIAS POR SU
ATENCIÓN!

Weitere ähnliche Inhalte

Ähnlich wie Inteligencia artificial, visión por ordenador, y datos multimodales - ACE Japón Webinar Series (2022/04/06)

Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3
Ulises Cortés
 
U2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcionalU2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcional
rafael366138
 
Tema 1 Inteligencia Artificial.pptx
Tema 1  Inteligencia  Artificial.pptxTema 1  Inteligencia  Artificial.pptx
Tema 1 Inteligencia Artificial.pptx
IES Eugenio frutos
 
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
CIMAT
 
Trabajo danis.pdf
Trabajo danis.pdfTrabajo danis.pdf
Trabajo danis.pdf
adaura
 
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIALINTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
adaura
 

Ähnlich wie Inteligencia artificial, visión por ordenador, y datos multimodales - ACE Japón Webinar Series (2022/04/06) (20)

Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
Enrique Blanco & Pablo González - Autoencoders, GANS y otros chicos del montó...
 
Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3Foro atica-gsi-noviembre2010 3
Foro atica-gsi-noviembre2010 3
 
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
Raspberry jam Bogota 2016 - Sistema de visión artificial aplicados a procesos...
 
U2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcionalU2 inteligencia artificial y programación funcional
U2 inteligencia artificial y programación funcional
 
Tema 1 Inteligencia Artificial.pptx
Tema 1  Inteligencia  Artificial.pptxTema 1  Inteligencia  Artificial.pptx
Tema 1 Inteligencia Artificial.pptx
 
Patrones
PatronesPatrones
Patrones
 
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT EdgeLa nueva revolución Industrial: Inteligencia Artificial & IoT Edge
La nueva revolución Industrial: Inteligencia Artificial & IoT Edge
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
Clasificación de acciones sociales usando computer vision
Clasificación de acciones sociales usando computer visionClasificación de acciones sociales usando computer vision
Clasificación de acciones sociales usando computer vision
 
Visión por computador
Visión por computadorVisión por computador
Visión por computador
 
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
 
Trabajo danis.pdf
Trabajo danis.pdfTrabajo danis.pdf
Trabajo danis.pdf
 
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIALINTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
INTELIGÈNCIA I PERCEPCIÓ ARTIFICIAL
 
Unidad 1: Informatica
Unidad 1: InformaticaUnidad 1: Informatica
Unidad 1: Informatica
 
Redes Bayesianas
Redes BayesianasRedes Bayesianas
Redes Bayesianas
 
tomografias.pptx
tomografias.pptxtomografias.pptx
tomografias.pptx
 

Mehr von Antonio Tejero de Pablos

Mehr von Antonio Tejero de Pablos (7)

ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
ECCV2022 paper reading - MultiMAE: Multi-modal Multi-task Masked Autoencoders...
 
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
CVPR2022 paper reading - Balanced multimodal learning - All Japan Computer Vi...
 
WakateMIRU2022 (グループ8) ディープワークによる時間管理
WakateMIRU2022 (グループ8) ディープワークによる時間管理WakateMIRU2022 (グループ8) ディープワークによる時間管理
WakateMIRU2022 (グループ8) ディープワークによる時間管理
 
VAEs for multimodal disentanglement
VAEs for multimodal disentanglementVAEs for multimodal disentanglement
VAEs for multimodal disentanglement
 
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEEMachine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
 
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
Presentation Skills Up! Seminar - Harada Ushiku Lab (English)
 
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
プレゼンスキルアップ!講座 原田・牛久研究室(日本語)
 

Kürzlich hochgeladen

ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
gustavoiashalom
 
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATINSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
evercoyla
 
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
Ricardo705519
 
tesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa mariatesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa maria
susafy7
 

Kürzlich hochgeladen (20)

ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVOESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
 
TIPOS DE SOPORTES - CLASIFICACION IG.pdf
TIPOS DE SOPORTES - CLASIFICACION IG.pdfTIPOS DE SOPORTES - CLASIFICACION IG.pdf
TIPOS DE SOPORTES - CLASIFICACION IG.pdf
 
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
 
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdfAnálisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
 
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATINSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
 
Trazos paileros para realizar trazos, cortes y calculos.pptx
Trazos paileros para realizar trazos, cortes y calculos.pptxTrazos paileros para realizar trazos, cortes y calculos.pptx
Trazos paileros para realizar trazos, cortes y calculos.pptx
 
Control estadistico de procesos Primera parte.pdf
Control estadistico de procesos Primera parte.pdfControl estadistico de procesos Primera parte.pdf
Control estadistico de procesos Primera parte.pdf
 
422382393-Curso-de-Tableros-Electricos.pptx
422382393-Curso-de-Tableros-Electricos.pptx422382393-Curso-de-Tableros-Electricos.pptx
422382393-Curso-de-Tableros-Electricos.pptx
 
DISEÑO PAVIMENTOS CLASE 06 PAVIMENTOS.pdf
DISEÑO PAVIMENTOS CLASE 06 PAVIMENTOS.pdfDISEÑO PAVIMENTOS CLASE 06 PAVIMENTOS.pdf
DISEÑO PAVIMENTOS CLASE 06 PAVIMENTOS.pdf
 
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
analisis tecnologico( diagnostico tecnologico, herramienta de toma de deciones)
 
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdfCONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
 
Clasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxClasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docx
 
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHTAPORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
 
QUIMICA GENERAL UNIVERSIDAD TECNOLOGICA DEL PERU
QUIMICA GENERAL UNIVERSIDAD TECNOLOGICA DEL PERUQUIMICA GENERAL UNIVERSIDAD TECNOLOGICA DEL PERU
QUIMICA GENERAL UNIVERSIDAD TECNOLOGICA DEL PERU
 
Determinación de espacios en la instalación
Determinación de espacios en la instalaciónDeterminación de espacios en la instalación
Determinación de espacios en la instalación
 
Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo process
 
Lineamientos del Plan Oferta y Demanda sesión 5
Lineamientos del Plan Oferta y Demanda sesión 5Lineamientos del Plan Oferta y Demanda sesión 5
Lineamientos del Plan Oferta y Demanda sesión 5
 
tesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa mariatesis maíz univesidad catolica santa maria
tesis maíz univesidad catolica santa maria
 
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheAportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
 
“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...
“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...
“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...
 

Inteligencia artificial, visión por ordenador, y datos multimodales - ACE Japón Webinar Series (2022/04/06)

  • 1. Agreement  If you plan to share these slides or to use the content in these slides for your own work, please include the following reference:  Si tu intención es compartir esta presentación, o usar su contenido para tu propio trabajo, por favor, incluye la siguiente referencia: Tejero-de-Pablos, A. (2022) “Inteligencia artificial, visión por ordenador, y datos multimodales”. ACE Japón Webinar Series.
  • 2. Inteligencia artificial, visión por ordenador, y datos multimodales ACE JAPÓN WEBINAR SERIES ANTONIO TEJERO DE PABLOS 6 DE ABRIL DE 2022 Image from oracle.com
  • 3. Índice 2 Sobre mí Inteligencia artificial y visión por ordenador Mi tema de investigación: Datos multimodales y heterogéneos El futuro de la inteligencia artificial
  • 4. Sobre mí Página web - https://antonio-t.github.io/
  • 5. Sobre mí  Universidad de Valladolid (~2012)  Ingeniero de Telecomunicaciones  Máster en Tecnologías de la Información y Comunicaciones  Instituto de Ciencia y Tecnología de Nara (~2017)  Doctorado en ingeniería (ciencias de la información)  Universidad de Tokio – Instituto RIKEN (~2021)  Investigador  CyberAgent AI Lab (Actualidad)  Científico investigador 4
  • 7. Qué es la inteligencia artificial ¿Robots? ¿Una réplica digital del cerebro humano? 6 Image from analyticsinsight.net
  • 8. Qué es la inteligencia artificial 7 La inteligencia artificial no es robótica No siempre intenta imitar el cerebro del ser humano  Pero es fácil de ejemplificar mediante el comportamiento de un robot Inteligencia artificial vs. aprendizaje máquina  Reconocimiento de patrones Image from medium.com
  • 9. Aprendizaje máquina 8 Reconocimiento de patrones  Aportar datos (secuencias numéricas, imágenes, etc.) a un algoritmo de aprendizaje que encuentra similitudes entre ellos a la hora de realizar una tarea  Implementado en un programa de ordenador El reconocimiento de patrones permite:  Predecir cambios en la población y otras estadísticas  Traducir textos de un idioma a otro  Reconocer caras para identificar usuarios Image from simplilearn.com
  • 10. Visión por ordenador Los ojos (?) del robot Reconocimiento de patrones en imágenes Múltiples aplicaciones  Medicina, automóviles, etc. 9 Image from IrisVision.com Cámara Fotos/ vídeos Algoritmo de aprendizaje Image from shutterstock.com Representación latente (características)
  • 11. Visión por ordenador: Inicios El humano determina qué ”características” aprender  Limitado en cuanto a precisión y dificultad de la tarea ¿Qué es una red neuronal?  Redes neuronales pequeñas en sus inicios 10 Image from wikipedia.org Image from analyticsvidhya.org Red neuronal ・Coche ・Persona ・… Representación mediante contornos
  • 12. Visión por ordenador: Actualidad Aprendizaje profundo  Aumento exponencial del número de parámetros (~175 billones)  La red neuronal determina las características a aprender de forma óptima  Reconocimiento de patrones más complejos, tareas más complicadas 11 Image from researchgate.net …
  • 13. Aprendizaje profundo: Ejemplo 1  Segmentación semántica 12 Image from nanonets.com
  • 14. Aprendizaje profundo: Ejemplo 2  Generación de imagen No todo es ideal  Se requieren grandes cantidades de datos (millones) 13 Image from twitter.com/charles2m
  • 15. Mi tema de investigación: Datos multimodales y heterogéneos
  • 16. El poder de los datos multimodales El mundo es multimodal: imagen, video, audio, texto, etc. Hay tareas que requieren más de un sentido  Conducción: Imagen de la carretera + Voces de niños  Diagnóstico: Imagen del corazon + Señal ECG 15 Image from aare.edu.au
  • 17. El poder de los datos multimodales Las redes neuronales pueden procesar distintos tipos de información  Pero no es trivial en qué punto, y cómo han de mezclarse 16 ・Coche ・Coche Opción 1 Opción 2, etc.
  • 18. Datos heterogéneos El aprendizaje profundo requiere reunir grandes cantidades de datos 17 Images from wikipedia.org Durante el aprendizaje: Una vez desplegado el sistema:
  • 19. Datos heterogéneos El problema de generalización  Una red neuronal ”naïve” sólo conoce los datos que ha visto 18 Image from Out-of-distribution Generalization and Its Applications for Multimedia (Wang et al.)
  • 20. Algunos de mis resultados Resumen automático de vídeo deportivo (detección de mejores momentos)  Uso de datos multimodales (imagen y sensores) Diagnóstico automático de imagen cardiaca  Uso de datos heterogéneos debido a la escasez de pacientes 19 CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM MEAN MAX … Input view images Feature extractor Encoder Classifier Probabilities Final decision (ensemble) N N (a) (b) (c) CPR volume segment (192×192×N voxels) CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM MEAN MAX … Input view images Feature extractor Encoder Classifier Probabilities Final decision (ensemble) N N (a) (b) (c) (d) (e) CPR volume segment (192×192×N voxels) CNN (VGG-M) CNN (VGG-M) CNN (VGG-M) CNN (VGG-M) Input view images Feature extractor N (a) (b) (c) (d) CPR volume segment (192×192×N voxels) CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM CNN (VGG-M) FV Linear SVM … Input view images Feature extractor Encoder Classifier Probab N N (a) (b) (c) (d) (e) CPR volume segment (192×192×N voxels) Aprendizaje Paciente 1 Scanner A Despliegue Paciente 2 Scanner B +
  • 21. El futuro de la inteligencia artificial
  • 22. El futuro cercano de la IA ¿Va a quitarnos la inteligencia artificial el trabajo?  Posiblemente, con trabajos simples y repetitivos  El ser humano centrado en la creación. Colaboración IA-humano. Principal problema  El individuo ”de a pie” no tiene fundamentos de ciencia / tecnología 21 Image from espsciencetime.org
  • 23. El futuro lejano de la inteligencia artificial ¿Va a reemplazar la inteligencia artificial al cerebro humano?  No con la tecnología actual  Cerebro humano ≠ inteligencia  La humanidad también evoluciona  Idealmente, la inteligencia artificial será una ayuda Todo esto es ciencia ficción  Objetivos realistas a corto plazo 22 Image from bernardmarr.com

Hinweis der Redaktion

  1. Ojo humano: 576 megapíxeles Cámaras HD actuales: 61 megapíxeles Ese montón de señales el cerebro las interpreta. Tu comida favorita, empiezas a salivar. Dotar a una máquina la habilidad de reconocer el mundo, nos da aplicaciones como la navegación autónoma. Yo estuve trabajando en diagnóstico automático de imagen médica hasta hace un año, y luego cambié a mi tema de investigación actual
  2. ¿Cómo hacemos una red neuronal más profunda? El tema es mucho más complejo. Hay muchos mas tipos de redes neuronales y operaciones.
  3. Estas personas no son investigadores en vision por Sin embargo, esta ”inteligencia artificial” que hemos creado, no sabe ni que esto es una persona, ni que debajo de la cabeza tiene un cuerpo, etc.
  4. Hay tareas, que requieren de más de un sentido. - Volviendo a las aplicaciones anteriores
  5. Voy a hablar de uno de las limitaciones del las tecnologías actuales, que es el de generalizar
  6. La información no tiene una representación única.