SlideShare una empresa de Scribd logo
1 de 114
Diseño y construcción de
una plataforma de
clasificación de texto basada
en textmining aplicada sobre
una red de blogs para
por CAMILO ALBERTO LÓPEZ ARAVENA
betazeta networks s.a
PROFESORES GUÍA Y CO-GUÍA
  Sebastián Ríos, Jorge Pérez

COMISIÓN
 Pablo Barceló, Carlos Rebeco
2 • 30
Tanalyze
   r
LA Empresa




             4 • 30
LA Empresa




             4 • 30
LA Empresa

‣
    Blogs




             4 • 30
LA Empresa

‣
    Blogs
‣
    7,5 MILLONES




                   4 • 30
5 • 30
Problemas




            5 • 30
Problemas


‣
    ¿qué estamos ofreciendo hoy?




                                   5 • 30
Problemas


‣
  ¿qué estamos ofreciendo hoy?
‣
  Contenido Generado por Usuarios!



                                     5 • 30
6 • 30
Solución y objetivos




                       6 • 30
Solución y objetivos
            Apoyo al procesamiento de altos
            volúmenes de información mediante una
            plataforma de visualización y
            categorización de contenidos




                                                    6 • 30
Solución y objetivos
 ‣
     Entender   Apoyo al procesamiento de altos
                volúmenes de información mediante una
                plataforma de visualización y
                categorización de contenidos




                                                        6 • 30
Solución y objetivos
 ‣
   Entender      Apoyo al procesamiento de altos
 ‣
   Seleccionar   volúmenes de información mediante una
                 plataforma de visualización y
                 categorización de contenidos




                                                         6 • 30
Solución y objetivos
 ‣
   Entender      Apoyo al procesamiento de altos
 ‣
   Seleccionar   volúmenes de información mediante una
                 plataforma de visualización y
 ‣
   definir        categorización de contenidos




                                                         6 • 30
Solución y objetivos
 ‣
   Entender      Apoyo al procesamiento de altos
 ‣
   Seleccionar   volúmenes de información mediante una
                 plataforma de visualización y
 ‣
   definir        categorización de contenidos
 ‣
   Construir



                                                         6 • 30
Solución y objetivos
 ‣
   Entender      Apoyo al procesamiento de altos
 ‣
   Seleccionar   volúmenes de información mediante una
                 plataforma de visualización y
 ‣
   definir        categorización de contenidos
 ‣
   Construir
 ‣
   Evaluar


                                                         6 • 30
a continuación...




                    7 • 30
a continuación...
1. contexto teórico
2. desarrollo
3. demo
4. Evaluación y resultados
experimentales
5. conclusiones y trabajo futuro
                                   7 • 30
8 • 30
un poco de contexto
 ‣
     data mining




                      8 • 30
un poco de contexto
 ‣
     data mining




                      8 • 30
un poco de contexto
 ‣
     data mining
 ‣
     text mining




                      8 • 30
un poco de contexto
 ‣
     data mining
 ‣
     text mining
 ‣
     topic modeling



                      8 • 30
9 • 30
LDA
LATENT DIRICHLET ALLOCATION



                              9 • 30
MO
               DE
                    LO




      LDA
                         GE
                            NE
                               R   AT
                                      IVO




LATENT DIRICHLET ALLOCATION



                                            9 • 30
10 • 30
medicin
Tecnología
             a

                   10 • 30
medicin
Tecnología
             a



                   10 • 30
medicin
Tecnología
    Google    a
   internet
 computador
     byte




                    10 • 30
medicin
Tecnología
    Google    acerebro
   internet   enfermedad
 computador    paciente
     byte        clínica




                           10 • 30
Tecnología
    Google
   internet     cerebro
 computador   enfermedad
     byte      paciente
                 clínica




                           10 • 30
Tecnología
    Google
   internet
 computador
     byte
   cerebro
 enfermedad
   paciente
    clínica
              10 • 30
Tecnología
    Google
   internet
 computador
     byte
   cerebro
 enfermedad
   paciente
    clínica
              10 • 30
Tecnología




             10 • 30
medicin
Tecnología
             a



                  10 • 30
medicin
Tecnología
             a

33%          66%
                  10 • 30
medicin
Tecnología
                                 a

33%                             66%
google clínica cerebro byte enfermedad paciente
                                              10 • 30
11 • 30
LD   2   11 • 30
Tema 1                Tema 2
   Google                Google
  internet              internet
computador            computador
    byte                  byte
 medicina              medicina
   clínica               clínica
  paciente



             LD   2
                        paciente
enfermedad            enfermedad



                             11 • 30
Tema 1                Tema 2
   Google                Google
  internet              internet
computador            computador
    byte                  byte
 medicina              medicina
   clínica               clínica
  paciente



             LD   2
                        paciente
enfermedad            enfermedad



                             11 • 30
Tema 1                           Tema 2
   Google                           Google
  internet                         internet
computador   10%   30% 75% 95%   computador
    byte                             byte
 medicina    90%   70% 25% 5%     medicina
   clínica                          clínica
  paciente



             LD             2
                                   paciente
enfermedad                       enfermedad



                                        11 • 30
Desarrollo
13 • 30
Consideraciones




                  13 • 30
Consideraciones



         áéí      13 • 30
Delta lda

            14 • 30
Tecnologías
  Pyth DJAN
  MySqGO
  on
  l
  Delta lda

              14 • 30
15 • 30
Arquitectura




               15 • 30
Arquitectura
               Tanalyzer




                           15 • 30
Arquitectura
               Tanalyzer

                  Django




                           15 • 30
Arquitectura
               Tanalyzer

                  Django   Mysql




                                   15 • 30
Arquitectura
                      Tanalyzer




               WebService
                            Django
                              Django   Mysql




                                               15 • 30
Arquitectura
                      Tanalyzer




               WebService
                            Django
                              Django   Mysql




                                               15 • 30
Arquitectura
                      Tanalyzer




               WebService
                            Django
                              Django         Mysql


                              interfaz web



                                                     15 • 30
Tanalyzer
                Transforma
                           Entrenamie
  Extracción        ción
                               nto
                  y carga

 Clasificació
             Webservice         Validación
      n

               aplicación web

                                             16 • 30
Tanalyzer
                Transforma
                           Entrenamie
  Extracción        ción
                               nto
                  y carga

 Clasificació
             Webservice         Validación
      n

               aplicación web

                                             16 • 30
Tanalyzer
                Transforma
                           Entrenamie
  Extracción        ción
                               nto
                  y carga

 Clasificació
             Webservice         Validación
      n

               aplicación web

                                             16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Tanalyzer
                     Transforma
                                Entrenamie
       Extracción        ción
                                    nto
                       y carga

      Clasificació
                  Webservice         Validación
           n
BD

                    aplicación web

                                                  16 • 30
Demo
       17 • 30
18 • 30
Evaluación




             18 • 30
Evaluación
 ‣
     precision




                 18 • 30
Evaluación
 ‣
     precision




                 18 • 30
Evaluación
 ‣
     precision




                 18 • 30
Evaluación
 ‣
   precision
 ‣
   recall




               18 • 30
Evaluación
 ‣
   precision
 ‣
   recall




               18 • 30
Evaluación
 ‣
   precision
                           2
 ‣
   recall
                  1              1
 ‣
   f-measure               +
               precision       recall




                                        18 • 30
Evaluación
 ‣
   precision
 ‣
   recall
 ‣
   f-measure
 ‣
   quality



               18 • 30
Evaluación
 ‣
   precision
 ‣
   recall      hola tengo cuatro palabras
 ‣
   f-measure
 ‣
   quality



                                            18 • 30
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam cursus fringilla mi vel posuere. Aenean imperdiet turpis at lectus
               rutrum nec elementum diam imperdiet. Nullam consectetur interdum libero sit amet congue. Quisque lacinia est non neque
               scelerisque suscipit. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam id lectus nunc, quis fermentum nisl.
               Pellentesque non nulla nec sapien volutpat mattis ac euismod metus. Pellentesque habitant morbi tristique senectus et netus et
               malesuada fames ac turpis egestas. Ut malesuada lorem bibendum mauris accumsan sodales. Phasellus tempus porttitor ante, eu


Evaluación
               pulvinar felis cursus eget. Duis massa odio, tincidunt in consequat vel, rutrum eu nibh. Duis a egestas velit. Nunc vel ipsum
               purus. In tempus pharetra ornare. Sed lobortis nulla at ipsum commodo eu varius dolor vulputate.
               Class aptent taciti sociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Integer sit amet purus ut elit varius
               molestie vel eget risus. Aenean sit amet urna id ligula scelerisque consequat. Etiam sed leo metus. Pellentesque habitant morbi
               tristique senectus et netus et malesuada fames ac turpis egestas. Etiam diam neque, cursus vitae viverra ut, malesuada ac augue.
 ‣
   precision   Etiam sapien orci, venenatis et rhoncus et, venenatis at metus. Sed iaculis sollicitudin tortor vel pulvinar. Nullam rutrum vehicula
               ligula eget congue. Suspendisse erat purus, euismod at mattis non, tincidunt in metus.

 ‣
   recall      Cras magna est, lacinia non euismod ut, placerat in odio. Cras sed risus et sem egestas volutpat. Integer ac malesuada lectus. Ut ac
               arcu quam, in volutpat urna. Nulla ac tristique nibh. Praesent non erat vel est aliquam mollis ut vitae purus. Curabitur nibh nulla,
               varius sed egestas pellentesque, egestas quis lorem. Donec euismod, lorem ac eleifend gravida, nibh arcu rhoncus tellus, id
 ‣
   f-measure   aliquam urna neque ut mi. Nullam posuere viverra tortor, id varius odio tristique et. Vestibulum sed mi lectus. In hac habitasse
               platea dictumst. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas.

 ‣
   quality     Donec lacinia felis a sem suscipit luctus. Suspendisse iaculis, purus sit amet adipiscing luctus, nulla est luctus purus, eu auctor
               mauris mauris volutpat dui. Nam iaculis ullamcorper odio et elementum. Proin porttitor dolor quis lectus laoreet quis tempor
               urna blandit. Proin vitae metus faucibus turpis tincidunt malesuada in id leo. Donec urna nunc, molestie eget malesuada nec,
               viverra a mauris. Etiam consectetur felis elit. Cras vitae semper metus. In ac libero aliquam justo euismod fringilla id tempus
               nulla. Aliquam sit amet quam id velit tempor dignissim. Vivamus faucibus ultrices posuere. Aliquam dolor urna, ullamcorper ac
               facilisis non, rutrum elementum erat. Sed arcu tortor, tempor gravida molestie id, tempor nec ante. Mauris sodales tempus tellus,
               ac faucibus purus rhoncus nec. Donec auctor lacus in risus volutpat a mattis massa congue.
               Nulla facilisi. Nulla diam nibh, vestibulum nec tristique et, iaculis eget est. Phasellus consequat lectus ac velit auctor interdum.
               Praesent sem metus, imperdiet non suscipit ac, vehicula a felis. Donec scelerisque felis non lacus cursus aliquet. Vestibulum ante
               ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Praesent sagittis massa a orci consequat condimentum.
               Nullam dapibus vehicula lectus, id gravida justo volutpat non. Curabitur sit amet nulla eu magna aliquet adipiscing. Praesent
                                                                                                                                          18 • 30
               hendrerit pulvinar congue.
Evaluación
 ‣
   precision
 ‣
   recall
 ‣
   f-measure
               Puntaje
 ‣
   quality     Palabras


                          18 • 30
Evaluación
 ‣
   precision
 ‣
   recall      menos topicos
 ‣
   f-measure
 ‣
   quality     menos palabras
 ‣
   alpha
 ‣
   Beta

                                18 • 30
Evaluación
                 cerebro
 ‣
   precision
               enfermedad
 ‣
   recall
                paciente
 ‣
   f-measure
                  clínica
 ‣
   quality
                   byte
 ‣
   alpha
 ‣
   Beta

                            18 • 30
Resultados
8 BLOGS
   8 temas
1600 artículos
                 20 • 30
F4Measure&respecto&a&Alpha&
         0,9000$


         0,8000$


         0,7000$


         0,6000$
                                                                                                                            Alpha$0,5$
Valor&




         0,5000$                                                                                                            Alpha$0,4$
                                                                                                                            Alpha$0,3$
         0,4000$
                                                                                                                            Alpha$0,1$
         0,3000$
                                                                                                                            Alpha$0,09$
         0,2000$


         0,1000$
                   1$ 2$ 3$ 4$ 5$ 6$ 7$ 8$ 9$ 10$11$12$13$14$15$16$17$18$19$20$21$22$23$24$25$26$27$28$29$30$31$32$33$34$

                         Tolerancia&sobre&distribución&porcentual&de&topics&
                                                                                                                                          21 • 30
F4Measure&respecto&a&Beta&
         0,9000$


         0,8000$


         0,7000$


         0,6000$
                                                                                                                            Beta$2$
                                                                                                                            Beta$1$
Valor&




         0,5000$
                                                                                                                            Beta$0,9$
         0,4000$                                                                                                            Beta$0,7$

         0,3000$
                                                                                                                            Beta$0,5$
                                                                                                                            Beta$0,4$
         0,2000$


         0,1000$
                   1$ 2$ 3$ 4$ 5$ 6$ 7$ 8$ 9$ 10$11$12$13$14$15$16$17$18$19$20$21$22$23$24$25$26$27$28$29$30$31$32$33$34$

                               Tolerancia&sobre&distribución&porcentual&de&topics&
                                                                                                                                        22 • 30
Medidas&respecto&a&Quality&
         1,2"

           1"

         0,8"
Valor&



         0,6"

         0,4"

         0,2"

           0"
                0"     1"   2"    3"   4"      5"     6"   7"     8"   9"   10"   11"   12"   13"   14"   15"   16"   17"   18"   19"

                                                       Tolerancia&sobre&quality&

                     Precision"             Recall"             F9Measure"              %"documentos"analizados"

                                                                                                                                        23 • 30
1 BLOG
  15 temas
120 artículos

                24 • 30
Análisis&de&clasificación&manual&de&topicos&para&
                                    FayerWayer&
         1,2"

           1"

         0,8"
Valor&




         0,6"

         0,4"

         0,2"

           0"
                1" 2" 3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15" 16" 17" 18" 19" 20" 21" 22" 23" 24" 25" 26" 27" 28" 29" 30" 31" 32" 33" 34"

                                       Tolerancia&sobre&distribución&porcentual&de&topics&

                                                  Precision"          Recall"         F9Measure"



                                                                                                                                                 25 • 30
26 • 30
Conclusiones




               26 • 30
Conclusiones

 ‣
     factibilidad




                    26 • 30
Conclusiones

 ‣
   factibilidad
 ‣
   Visualización




                   26 • 30
Conclusiones

 ‣
   factibilidad
 ‣
   Visualización
 ‣
   Exactitud




                   26 • 30
Conclusiones

 ‣
   factibilidad
 ‣
   Visualización
 ‣
   Exactitud
 ‣
   objetivos


                   26 • 30
Conclusiones

                   ‣
                       entender
 ‣
   factibilidad
 ‣
   Visualización
 ‣
   Exactitud
 ‣
   objetivos


                                  26 • 30
Conclusiones

                   ‣
                     entender
 ‣
   factibilidad    ‣
                     seleccionar
 ‣
   Visualización
 ‣
   Exactitud
 ‣
   objetivos


                                   26 • 30
Conclusiones

                ‣
                   entender
 ‣
   factibilidad ‣
                   seleccionar
 ‣
   Visualización ‣
                   definir
 ‣
   Exactitud
 ‣
   objetivos


                                 26 • 30
Conclusiones

                ‣
                   entender
 ‣
   factibilidad ‣
                   seleccionar
 ‣
   Visualización ‣
                   definir
 ‣
   Exactitud     ‣
                   construir
 ‣
   objetivos


                                 26 • 30
Conclusiones

                ‣
                   entender
 ‣
   factibilidad ‣
                   seleccionar
 ‣
   Visualización ‣
                   definir
 ‣
   Exactitud     ‣
                   construir
 ‣
   objetivos     ‣
                   evaluar


                                 26 • 30
27 • 30
Trabajo futuro




                 27 • 30
Trabajo futuro

 ‣
     otros modelos




                     27 • 30
Trabajo futuro

 ‣
   otros modelos
 ‣
   funcionalidad




                   27 • 30
Trabajo futuro

 ‣
   otros modelos
 ‣
   funcionalidad
 ‣
   velocidad




                   27 • 30
Trabajo futuro

 ‣
   otros modelos
 ‣
   funcionalidad
 ‣
   velocidad
 ‣
   mejorar exactitud


                       27 • 30
MUCHAS
GRACIAS
¿ PREGUNTAS ?
Presentación Defensa

Más contenido relacionado

Similar a Presentación Defensa

Sustentation Tesis Maestria
Sustentation Tesis MaestriaSustentation Tesis Maestria
Sustentation Tesis Maestriawilsonvelez
 
Lakarra Google Como Herramienta Prestigio Online
Lakarra Google Como Herramienta Prestigio OnlineLakarra Google Como Herramienta Prestigio Online
Lakarra Google Como Herramienta Prestigio OnlineIñaki Lakarra
 
Definició i posada en marxa de la presència 2.0 a un negoci
Definició i posada en marxa de la presència 2.0 a un negociDefinició i posada en marxa de la presència 2.0 a un negoci
Definició i posada en marxa de la presència 2.0 a un negociDigital Granollers
 
Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012
Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012
Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012Overalia
 
Cloud computing UPAEP Abierta
Cloud computing UPAEP AbiertaCloud computing UPAEP Abierta
Cloud computing UPAEP AbiertaLucy Padilla
 
Accessibilidad en entornos web interactivos: superación de barreras digitales.
Accessibilidad en entornos web interactivos: superación de barreras digitales.Accessibilidad en entornos web interactivos: superación de barreras digitales.
Accessibilidad en entornos web interactivos: superación de barreras digitales.afrikidoc
 
Presentacion tog Jornada Innovacion
Presentacion tog Jornada InnovacionPresentacion tog Jornada Innovacion
Presentacion tog Jornada InnovacionIBCmass
 
Presentación Institucional LANIA
Presentación Institucional LANIAPresentación Institucional LANIA
Presentación Institucional LANIALANIA Mx
 
CaboLabs: expertos en informática médica, estándares e interoperabilidad
CaboLabs: expertos en informática médica, estándares e interoperabilidadCaboLabs: expertos en informática médica, estándares e interoperabilidad
CaboLabs: expertos en informática médica, estándares e interoperabilidadPablo Pazos
 
Integración de ti al negocio a través del catalogo de servicios consejos pr...
Integración de ti al negocio a través del catalogo de servicios   consejos pr...Integración de ti al negocio a través del catalogo de servicios   consejos pr...
Integración de ti al negocio a través del catalogo de servicios consejos pr...Nicolas Seguel
 
Desarrollo plataforma tecnologica para la gestion de la produccion pgp
Desarrollo plataforma tecnologica para la gestion de la produccion pgpDesarrollo plataforma tecnologica para la gestion de la produccion pgp
Desarrollo plataforma tecnologica para la gestion de la produccion pgpInamod
 
El condimento para potenciar la productividad de GeneXus
El condimento para potenciar la productividad de GeneXusEl condimento para potenciar la productividad de GeneXus
El condimento para potenciar la productividad de GeneXusGeneXus
 
Presentacion de axion ti resumen_2011
Presentacion de axion ti resumen_2011Presentacion de axion ti resumen_2011
Presentacion de axion ti resumen_2011fjvicens
 
Diplomado en gestión eac
Diplomado en gestión eacDiplomado en gestión eac
Diplomado en gestión eacLucy Padilla
 

Similar a Presentación Defensa (20)

Sustentation Tesis Maestria
Sustentation Tesis MaestriaSustentation Tesis Maestria
Sustentation Tesis Maestria
 
Lakarra Google Como Herramienta Prestigio Online
Lakarra Google Como Herramienta Prestigio OnlineLakarra Google Como Herramienta Prestigio Online
Lakarra Google Como Herramienta Prestigio Online
 
Definició i posada en marxa de la presència 2.0 a un negoci
Definició i posada en marxa de la presència 2.0 a un negociDefinició i posada en marxa de la presència 2.0 a un negoci
Definició i posada en marxa de la presència 2.0 a un negoci
 
Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012
Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012
Analítica web Overalia Máster Comunicación Corporativa UPV/EHU 2012
 
Cloud computing UPAEP Abierta
Cloud computing UPAEP AbiertaCloud computing UPAEP Abierta
Cloud computing UPAEP Abierta
 
Modulo5
Modulo5Modulo5
Modulo5
 
Estudios de satisfaccion de usuarios
Estudios de satisfaccion de usuariosEstudios de satisfaccion de usuarios
Estudios de satisfaccion de usuarios
 
Estadisticas de Uso de la BV-SSPA
Estadisticas de Uso de la BV-SSPAEstadisticas de Uso de la BV-SSPA
Estadisticas de Uso de la BV-SSPA
 
Accessibilidad en entornos web interactivos: superación de barreras digitales.
Accessibilidad en entornos web interactivos: superación de barreras digitales.Accessibilidad en entornos web interactivos: superación de barreras digitales.
Accessibilidad en entornos web interactivos: superación de barreras digitales.
 
Presentacion tog Jornada Innovacion
Presentacion tog Jornada InnovacionPresentacion tog Jornada Innovacion
Presentacion tog Jornada Innovacion
 
Presentación Institucional LANIA
Presentación Institucional LANIAPresentación Institucional LANIA
Presentación Institucional LANIA
 
CaboLabs: expertos en informática médica, estándares e interoperabilidad
CaboLabs: expertos en informática médica, estándares e interoperabilidadCaboLabs: expertos en informática médica, estándares e interoperabilidad
CaboLabs: expertos en informática médica, estándares e interoperabilidad
 
Web 2.0 (dic 2010)
Web 2.0 (dic 2010)Web 2.0 (dic 2010)
Web 2.0 (dic 2010)
 
Integración de ti al negocio a través del catalogo de servicios consejos pr...
Integración de ti al negocio a través del catalogo de servicios   consejos pr...Integración de ti al negocio a través del catalogo de servicios   consejos pr...
Integración de ti al negocio a través del catalogo de servicios consejos pr...
 
Desarrollo plataforma tecnologica para la gestion de la produccion pgp
Desarrollo plataforma tecnologica para la gestion de la produccion pgpDesarrollo plataforma tecnologica para la gestion de la produccion pgp
Desarrollo plataforma tecnologica para la gestion de la produccion pgp
 
El condimento para potenciar la productividad de GeneXus
El condimento para potenciar la productividad de GeneXusEl condimento para potenciar la productividad de GeneXus
El condimento para potenciar la productividad de GeneXus
 
La perspectiva de la Transformación Digital desde la Regulación
La perspectiva de la Transformación Digital desde la RegulaciónLa perspectiva de la Transformación Digital desde la Regulación
La perspectiva de la Transformación Digital desde la Regulación
 
Presentacion de axion ti resumen_2011
Presentacion de axion ti resumen_2011Presentacion de axion ti resumen_2011
Presentacion de axion ti resumen_2011
 
Jornada: Computer Vision en la Industria 4.0
Jornada: Computer Vision en la Industria 4.0Jornada: Computer Vision en la Industria 4.0
Jornada: Computer Vision en la Industria 4.0
 
Diplomado en gestión eac
Diplomado en gestión eacDiplomado en gestión eac
Diplomado en gestión eac
 

Último

EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxJorgeParada26
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosJhonJairoRodriguezCe
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativanicho110
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIhmpuellon
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxFederico Castellari
 

Último (10)

EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 

Presentación Defensa

  • 1.
  • 2.
  • 3. Diseño y construcción de una plataforma de clasificación de texto basada en textmining aplicada sobre una red de blogs para por CAMILO ALBERTO LÓPEZ ARAVENA betazeta networks s.a PROFESORES GUÍA Y CO-GUÍA Sebastián Ríos, Jorge Pérez COMISIÓN Pablo Barceló, Carlos Rebeco
  • 6. LA Empresa 4 • 30
  • 7. LA Empresa 4 • 30
  • 8. LA Empresa ‣ Blogs 4 • 30
  • 9. LA Empresa ‣ Blogs ‣ 7,5 MILLONES 4 • 30
  • 11. Problemas 5 • 30
  • 12. Problemas ‣ ¿qué estamos ofreciendo hoy? 5 • 30
  • 13. Problemas ‣ ¿qué estamos ofreciendo hoy? ‣ Contenido Generado por Usuarios! 5 • 30
  • 16. Solución y objetivos Apoyo al procesamiento de altos volúmenes de información mediante una plataforma de visualización y categorización de contenidos 6 • 30
  • 17. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos volúmenes de información mediante una plataforma de visualización y categorización de contenidos 6 • 30
  • 18. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y categorización de contenidos 6 • 30
  • 19. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y ‣ definir categorización de contenidos 6 • 30
  • 20. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y ‣ definir categorización de contenidos ‣ Construir 6 • 30
  • 21. Solución y objetivos ‣ Entender Apoyo al procesamiento de altos ‣ Seleccionar volúmenes de información mediante una plataforma de visualización y ‣ definir categorización de contenidos ‣ Construir ‣ Evaluar 6 • 30
  • 22. a continuación... 7 • 30
  • 23. a continuación... 1. contexto teórico 2. desarrollo 3. demo 4. Evaluación y resultados experimentales 5. conclusiones y trabajo futuro 7 • 30
  • 25. un poco de contexto ‣ data mining 8 • 30
  • 26. un poco de contexto ‣ data mining 8 • 30
  • 27. un poco de contexto ‣ data mining ‣ text mining 8 • 30
  • 28. un poco de contexto ‣ data mining ‣ text mining ‣ topic modeling 8 • 30
  • 31. MO DE LO LDA GE NE R AT IVO LATENT DIRICHLET ALLOCATION 9 • 30
  • 33. medicin Tecnología a 10 • 30
  • 34. medicin Tecnología a 10 • 30
  • 35. medicin Tecnología Google a internet computador byte 10 • 30
  • 36. medicin Tecnología Google acerebro internet enfermedad computador paciente byte clínica 10 • 30
  • 37. Tecnología Google internet cerebro computador enfermedad byte paciente clínica 10 • 30
  • 38. Tecnología Google internet computador byte cerebro enfermedad paciente clínica 10 • 30
  • 39. Tecnología Google internet computador byte cerebro enfermedad paciente clínica 10 • 30
  • 40. Tecnología 10 • 30
  • 41. medicin Tecnología a 10 • 30
  • 42. medicin Tecnología a 33% 66% 10 • 30
  • 43. medicin Tecnología a 33% 66% google clínica cerebro byte enfermedad paciente 10 • 30
  • 45. LD 2 11 • 30
  • 46. Tema 1 Tema 2 Google Google internet internet computador computador byte byte medicina medicina clínica clínica paciente LD 2 paciente enfermedad enfermedad 11 • 30
  • 47. Tema 1 Tema 2 Google Google internet internet computador computador byte byte medicina medicina clínica clínica paciente LD 2 paciente enfermedad enfermedad 11 • 30
  • 48. Tema 1 Tema 2 Google Google internet internet computador 10% 30% 75% 95% computador byte byte medicina 90% 70% 25% 5% medicina clínica clínica paciente LD 2 paciente enfermedad enfermedad 11 • 30
  • 51. Consideraciones 13 • 30
  • 52. Consideraciones áéí 13 • 30
  • 53. Delta lda 14 • 30
  • 54. Tecnologías Pyth DJAN MySqGO on l Delta lda 14 • 30
  • 56. Arquitectura 15 • 30
  • 57. Arquitectura Tanalyzer 15 • 30
  • 58. Arquitectura Tanalyzer Django 15 • 30
  • 59. Arquitectura Tanalyzer Django Mysql 15 • 30
  • 60. Arquitectura Tanalyzer WebService Django Django Mysql 15 • 30
  • 61. Arquitectura Tanalyzer WebService Django Django Mysql 15 • 30
  • 62. Arquitectura Tanalyzer WebService Django Django Mysql interfaz web 15 • 30
  • 63. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n aplicación web 16 • 30
  • 64. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n aplicación web 16 • 30
  • 65. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n aplicación web 16 • 30
  • 66. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 67. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 68. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 69. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 70. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 71. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 72. Tanalyzer Transforma Entrenamie Extracción ción nto y carga Clasificació Webservice Validación n BD aplicación web 16 • 30
  • 73. Demo 17 • 30
  • 75. Evaluación 18 • 30
  • 76. Evaluación ‣ precision 18 • 30
  • 77. Evaluación ‣ precision 18 • 30
  • 78. Evaluación ‣ precision 18 • 30
  • 79. Evaluación ‣ precision ‣ recall 18 • 30
  • 80. Evaluación ‣ precision ‣ recall 18 • 30
  • 81. Evaluación ‣ precision 2 ‣ recall 1 1 ‣ f-measure + precision recall 18 • 30
  • 82. Evaluación ‣ precision ‣ recall ‣ f-measure ‣ quality 18 • 30
  • 83. Evaluación ‣ precision ‣ recall hola tengo cuatro palabras ‣ f-measure ‣ quality 18 • 30
  • 84. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam cursus fringilla mi vel posuere. Aenean imperdiet turpis at lectus rutrum nec elementum diam imperdiet. Nullam consectetur interdum libero sit amet congue. Quisque lacinia est non neque scelerisque suscipit. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam id lectus nunc, quis fermentum nisl. Pellentesque non nulla nec sapien volutpat mattis ac euismod metus. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut malesuada lorem bibendum mauris accumsan sodales. Phasellus tempus porttitor ante, eu Evaluación pulvinar felis cursus eget. Duis massa odio, tincidunt in consequat vel, rutrum eu nibh. Duis a egestas velit. Nunc vel ipsum purus. In tempus pharetra ornare. Sed lobortis nulla at ipsum commodo eu varius dolor vulputate. Class aptent taciti sociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Integer sit amet purus ut elit varius molestie vel eget risus. Aenean sit amet urna id ligula scelerisque consequat. Etiam sed leo metus. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Etiam diam neque, cursus vitae viverra ut, malesuada ac augue. ‣ precision Etiam sapien orci, venenatis et rhoncus et, venenatis at metus. Sed iaculis sollicitudin tortor vel pulvinar. Nullam rutrum vehicula ligula eget congue. Suspendisse erat purus, euismod at mattis non, tincidunt in metus. ‣ recall Cras magna est, lacinia non euismod ut, placerat in odio. Cras sed risus et sem egestas volutpat. Integer ac malesuada lectus. Ut ac arcu quam, in volutpat urna. Nulla ac tristique nibh. Praesent non erat vel est aliquam mollis ut vitae purus. Curabitur nibh nulla, varius sed egestas pellentesque, egestas quis lorem. Donec euismod, lorem ac eleifend gravida, nibh arcu rhoncus tellus, id ‣ f-measure aliquam urna neque ut mi. Nullam posuere viverra tortor, id varius odio tristique et. Vestibulum sed mi lectus. In hac habitasse platea dictumst. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. ‣ quality Donec lacinia felis a sem suscipit luctus. Suspendisse iaculis, purus sit amet adipiscing luctus, nulla est luctus purus, eu auctor mauris mauris volutpat dui. Nam iaculis ullamcorper odio et elementum. Proin porttitor dolor quis lectus laoreet quis tempor urna blandit. Proin vitae metus faucibus turpis tincidunt malesuada in id leo. Donec urna nunc, molestie eget malesuada nec, viverra a mauris. Etiam consectetur felis elit. Cras vitae semper metus. In ac libero aliquam justo euismod fringilla id tempus nulla. Aliquam sit amet quam id velit tempor dignissim. Vivamus faucibus ultrices posuere. Aliquam dolor urna, ullamcorper ac facilisis non, rutrum elementum erat. Sed arcu tortor, tempor gravida molestie id, tempor nec ante. Mauris sodales tempus tellus, ac faucibus purus rhoncus nec. Donec auctor lacus in risus volutpat a mattis massa congue. Nulla facilisi. Nulla diam nibh, vestibulum nec tristique et, iaculis eget est. Phasellus consequat lectus ac velit auctor interdum. Praesent sem metus, imperdiet non suscipit ac, vehicula a felis. Donec scelerisque felis non lacus cursus aliquet. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Praesent sagittis massa a orci consequat condimentum. Nullam dapibus vehicula lectus, id gravida justo volutpat non. Curabitur sit amet nulla eu magna aliquet adipiscing. Praesent 18 • 30 hendrerit pulvinar congue.
  • 85. Evaluación ‣ precision ‣ recall ‣ f-measure Puntaje ‣ quality Palabras 18 • 30
  • 86. Evaluación ‣ precision ‣ recall menos topicos ‣ f-measure ‣ quality menos palabras ‣ alpha ‣ Beta 18 • 30
  • 87. Evaluación cerebro ‣ precision enfermedad ‣ recall paciente ‣ f-measure clínica ‣ quality byte ‣ alpha ‣ Beta 18 • 30
  • 89. 8 BLOGS 8 temas 1600 artículos 20 • 30
  • 90. F4Measure&respecto&a&Alpha& 0,9000$ 0,8000$ 0,7000$ 0,6000$ Alpha$0,5$ Valor& 0,5000$ Alpha$0,4$ Alpha$0,3$ 0,4000$ Alpha$0,1$ 0,3000$ Alpha$0,09$ 0,2000$ 0,1000$ 1$ 2$ 3$ 4$ 5$ 6$ 7$ 8$ 9$ 10$11$12$13$14$15$16$17$18$19$20$21$22$23$24$25$26$27$28$29$30$31$32$33$34$ Tolerancia&sobre&distribución&porcentual&de&topics& 21 • 30
  • 91. F4Measure&respecto&a&Beta& 0,9000$ 0,8000$ 0,7000$ 0,6000$ Beta$2$ Beta$1$ Valor& 0,5000$ Beta$0,9$ 0,4000$ Beta$0,7$ 0,3000$ Beta$0,5$ Beta$0,4$ 0,2000$ 0,1000$ 1$ 2$ 3$ 4$ 5$ 6$ 7$ 8$ 9$ 10$11$12$13$14$15$16$17$18$19$20$21$22$23$24$25$26$27$28$29$30$31$32$33$34$ Tolerancia&sobre&distribución&porcentual&de&topics& 22 • 30
  • 92. Medidas&respecto&a&Quality& 1,2" 1" 0,8" Valor& 0,6" 0,4" 0,2" 0" 0" 1" 2" 3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15" 16" 17" 18" 19" Tolerancia&sobre&quality& Precision" Recall" F9Measure" %"documentos"analizados" 23 • 30
  • 93. 1 BLOG 15 temas 120 artículos 24 • 30
  • 94. Análisis&de&clasificación&manual&de&topicos&para& FayerWayer& 1,2" 1" 0,8" Valor& 0,6" 0,4" 0,2" 0" 1" 2" 3" 4" 5" 6" 7" 8" 9" 10" 11" 12" 13" 14" 15" 16" 17" 18" 19" 20" 21" 22" 23" 24" 25" 26" 27" 28" 29" 30" 31" 32" 33" 34" Tolerancia&sobre&distribución&porcentual&de&topics& Precision" Recall" F9Measure" 25 • 30
  • 96. Conclusiones 26 • 30
  • 97. Conclusiones ‣ factibilidad 26 • 30
  • 98. Conclusiones ‣ factibilidad ‣ Visualización 26 • 30
  • 99. Conclusiones ‣ factibilidad ‣ Visualización ‣ Exactitud 26 • 30
  • 100. Conclusiones ‣ factibilidad ‣ Visualización ‣ Exactitud ‣ objetivos 26 • 30
  • 101. Conclusiones ‣ entender ‣ factibilidad ‣ Visualización ‣ Exactitud ‣ objetivos 26 • 30
  • 102. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ Exactitud ‣ objetivos 26 • 30
  • 103. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ definir ‣ Exactitud ‣ objetivos 26 • 30
  • 104. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ definir ‣ Exactitud ‣ construir ‣ objetivos 26 • 30
  • 105. Conclusiones ‣ entender ‣ factibilidad ‣ seleccionar ‣ Visualización ‣ definir ‣ Exactitud ‣ construir ‣ objetivos ‣ evaluar 26 • 30
  • 107. Trabajo futuro 27 • 30
  • 108. Trabajo futuro ‣ otros modelos 27 • 30
  • 109. Trabajo futuro ‣ otros modelos ‣ funcionalidad 27 • 30
  • 110. Trabajo futuro ‣ otros modelos ‣ funcionalidad ‣ velocidad 27 • 30
  • 111. Trabajo futuro ‣ otros modelos ‣ funcionalidad ‣ velocidad ‣ mejorar exactitud 27 • 30
  • 112.

Notas del editor

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. \n
  58. \n
  59. \n
  60. \n
  61. \n
  62. \n
  63. \n
  64. \n
  65. \n
  66. \n
  67. \n
  68. \n
  69. \n
  70. \n
  71. \n
  72. \n
  73. \n
  74. \n
  75. \n
  76. \n
  77. \n
  78. \n
  79. \n
  80. \n
  81. \n
  82. \n
  83. \n
  84. \n
  85. \n
  86. \n
  87. \n
  88. \n
  89. \n
  90. \n
  91. \n
  92. \n
  93. \n
  94. \n
  95. \n
  96. \n
  97. \n
  98. \n
  99. \n
  100. \n
  101. \n
  102. \n
  103. \n
  104. \n
  105. \n
  106. \n
  107. \n
  108. \n
  109. \n
  110. \n
  111. \n
  112. \n
  113. \n
  114. \n
  115. \n
  116. \n
  117. \n
  118. \n
  119. \n
  120. \n
  121. \n
  122. \n
  123. \n
  124. \n
  125. \n
  126. \n
  127. \n
  128. \n
  129. \n
  130. \n
  131. \n
  132. \n
  133. \n
  134. \n
  135. \n
  136. \n
  137. \n
  138. \n
  139. \n
  140. \n
  141. \n
  142. \n
  143. \n
  144. \n
  145. \n
  146. \n
  147. \n
  148. \n
  149. \n
  150. \n
  151. \n
  152. \n
  153. \n
  154. \n
  155. \n
  156. \n
  157. \n
  158. \n
  159. \n
  160. \n
  161. \n
  162. \n
  163. \n
  164. \n
  165. \n
  166. \n
  167. \n
  168. \n
  169. \n
  170. \n
  171. \n
  172. \n
  173. \n
  174. \n
  175. \n
  176. \n
  177. \n
  178. \n
  179. \n
  180. \n
  181. \n
  182. \n
  183. \n
  184. \n
  185. \n
  186. \n
  187. \n
  188. \n
  189. \n
  190. \n
  191. \n
  192. \n
  193. \n
  194. \n
  195. \n
  196. \n
  197. \n
  198. \n