SlideShare ist ein Scribd-Unternehmen logo
1 von 293
Downloaden Sie, um offline zu lesen
Uma introdução a
Machine Learning
      Guilherme Silveira
  http://www.caelum.com.br
a idéia
a idéia

problemas
perguntas
a idéia

problemas             soluções
perguntas             respostas
quem sou eu
quem sou eu
quem sou eu
casa ==> caelum
decidi ir de carro
decidi ir de carro


                     <== piada
pego o carro...
pego o carro...
pego o carro...
assisto o trânsito
  de camarote
decidi ir de metrô
quem conhece
  são paulo?
quem conhece
     são paulo?
quem conhece o metrô
    em são paulo?
Problema?
Problema?




 vista interna
além do trânsito
além do trânsito


minha vida pessoal
mudança
o preço dos imóveis
             Tamanho     Preço
               100      750000
               200      860000
está caro?     150      977000
               140       81900
               160      984000
               180     1127000
               130      638000
                80      647000
                40      346000
p: qual um preço justo
   para esse imóvel?
está caro?
regressão linear   f(x) = ax + b
planilha
planilha
planilha
planilha



preço = 5053x + 57758
planilha



preço = 5053x + 57758
regressão linear   f(x) = ax + b
regressão linear   f(x) = ax + b
regressão linear                f(x) = ax + b



polinômios   f(x) = a + bx + cx^2 + ... + dx^n
regressão linear                f(x) = ax + b



polinômios   f(x) = a + bx + cx^2 + ... + dx^n
regressão linear                           f(x) = ax + b



 polinômios              f(x) = a + bx + cx^2 + ... + dx^n




preço = a + ... + dx^n
p: como estimar o valor de algo?
   possível resposta: regressão
p: como estimar o valor de algo?
   possível resposta: regressão
 p: qual a nota que o aluno vai
      tirar na prova final?
p: como estimar o valor de algo?
   possível resposta: regressão
  p: qual a nota que o aluno vai
       tirar na prova final?
p: qual será a nota do hipólito na
        próxima olimpíada?
p: como estimar o valor de algo?
   possível resposta: regressão
  p: qual a nota que o aluno vai
       tirar na prova final?
p: qual será a nota do hipólito na
        próxima olimpíada?
   p: quanto tempo os alunos
   precisarão para essa prova?
simplicidade++
   bizarro--
função Brad Pitt
função Brad Pitt
 (a função perfeita?)
função Brad Pitt
 (a função perfeita?)
e o número de
           dormitórios?
Tamanho          Preço
  100           750000
  200           860000
  150           977000
  140            81900
  160           984000
  180          1127000
  130           638000
   80           647000
   40           346000
e o número de
           dormitórios?
Tamanho      Dormitório     Preço
  100            2         750000
  200            3         860000
  150            4         977000
  140            3          81900
  160            3         984000
  180            4        1127000
  130            3         638000
   80            3         647000
   40            1         346000
bibliotecas
http://commons.apache.org/math/
http://math.nist.gov/javanumerics/jama/
http://mahout.apache.org/
google: language + regression
chego no trabalho
abro os emails
p: classificação
p: classificação
    É spamzis!
p: classificação
    É spamzis!

     Não é!
p: classificação
    É spamzis!

     Não é!
p: classificação
    É spamzis!    1

     Não é!
p: classificação
    É spamzis!    1

     Não é!       0
treino!
valido!
p: ele é 1?
p: ele é 1?
p: ele é 1?
    acredito que sim, com
       chance de 78%
lista com 1000 itens
lista com 1000 itens




classificação
  humana
lista com 1000 itens




classificação
  humana
lista com 1000 itens




classificação             treino da
  humana                 máquina
lista com 800 itens
  lista com 1000 itens




classificação             treino da
  humana                 máquina
lista com 800 itens
  lista com 1000 itens




classificação             treino da               valida a
  humana                 máquina                qualidade
lista com 800 itens
  lista com 1000 itens
                                                 lista com 200 itens




classificação             treino da               valida a
  humana                 máquina                qualidade
99% de acerto



                          lista com 800 itens
  lista com 1000 itens
                                                 lista com 200 itens




classificação             treino da               valida a
  humana                 máquina                qualidade
p: ele é 1?
r: regressão logística
p: ele é 1?
r: regressão logística
p: ele é 1?
r: regressão logística
            chance de x%
p: o email é spam?
p: o email é spam?
p: o aluno está com dificuldade?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: qual a chance do aluno acertar
          esse exercício?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: qual a chance do aluno acertar
          esse exercício?
p: qual a chance de essa imagem
      ser o número 3? ou 8?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: qual a chance do aluno acertar
          esse exercício?
p: qual a chance de essa imagem
      ser o número 3? ou 8?
p: qual a chance de essa imagem
          ser um cancêr?
nota: simplificações desses
         problemas
e o cartão de credito?
você gastou 50
     dia 30
    loja 15
você gastou 30
     dia 30
    loja 17
você gastou 25
     dia 30
    loja 21
você gastou 25
     dia 30
    loja 21
você gastou 2500
     dia 30
      loja 7
dia   valor   loja

30     30     15

30     35     17

30    100      8

1      37      9

30    2500     7
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja    label

30     30     15       0

30     35     17       0

30    100      8       0

1      37      9       0

30    2500     7       1




                     treina
dia    valor   loja   label

30      30     15      0

30      35     17      0

30     100      8      0

1       37      9      0

30     2500     7      1




      treina
dia   valor   loja   label

30      30    15      0

30      35    17      0

30     100     8      0

1       37     9      0

30     2500    7      1




      valida
dia   valor   loja   label

30      30    15      0

30      35    17      0      37% de acerto
30     100     8      0

1       37     9      0

30     2500    7      1




      valida
dia   valor   loja   label

30      30    15      0

30      35    17      0      37% de acerto
30     100     8      0

1       37     9      0

30     2500    7      1




      valida
dia   valor   loja   label

30      30    15      0

30      35    17      0           37% de acerto
30     100     8      0

1       37     9      0

30     2500    7      1




                             eu continuo
                              roubando
      valida
regressão logística é,
 em geral, linear ou
     lerdíssima
regressão logística é,
 em geral, linear ou
     lerdíssima
       regularização
regressão logística é,
 em geral, linear ou
     lerdíssima
       regularização
        polinômios
regressão logística é,
 em geral, linear ou
     lerdíssima
       regularização
        polinômios
          outras
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0
                             treina
30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0
                             treina
30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1




                             treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina

dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0      treina
30    2500     7      1


      treina

dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0      treina
30    2500     7      1


      treina

dia   valor   loja   label


                             treina
30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0      treina
30    2500     7      1


      treina

dia   valor   loja   label


                             treina
30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
                             treina
dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1


         dia
               treina
               valor   loja   label

         30     30     15      0

treina   30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1


               treina
         dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

treina   1      37      9      0

         30    2500     7      1

               treina
dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1


         dia
               treina
               valor   loja   label

         30     30     15      0

treina   30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1      treina
               treina
         dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

treina   1      37      9      0

         30    2500     7      1

               treina
dia   valor   loja   label
         treina   30     30     15      0

                  30     35     17      0

                  30    100      8      0
treina            1      37      9      0

                  30    2500     7      1


                        treina
         treina


treina
         treina
87% de acerto

                      dia   valor   loja   label
         treina       30     30     15      0

                      30     35     17      0

                      30    100      8      0
treina                1      37      9      0

                      30    2500     7      1


                            treina
         treina


treina
         treina
87% de acerto

                        dia   valor   loja   label
           treina       30     30     15      0

                        30     35     17      0

                        30    100      8      0
  treina                1      37      9      0

                        30    2500     7      1


                              treina
           treina


  treina
o seu telefone toca
        treina
87% de acerto

                        dia   valor   loja   label
           treina       30     30     15      0

                        30     35     17      0

                        30    100      8      0
  treina                1      37      9      0

                        30    2500     7      1


                              treina
           treina


  treina
o seu telefone toca
        treina
p: o email é spam?




http://neuroph.sourceforge.net/
p: o email é spam?

p: essa movimentação é uma
          fraude?



    http://neuroph.sourceforge.net/
p: o email é spam?

p: essa movimentação é uma
          fraude?

p: qualquer pergunta sim/não
         como antes?
    http://neuroph.sourceforge.net/
acesso o
“banco.caelum.com.br”
dia   valor      loja

30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE

30     5       BUTECO
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE   alimentação

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

                          profissional
30    149      CAELUM

1     499     FACULDADE   alimentação

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

                          profissional
30     35      MUNI TR

                          profissional
30    149      CAELUM

1     499     FACULDADE   alimentação

30     5       BUTECO
p: a movimentação 15 é?
p: a movimentação 15 é
entretenimento ou não? (0 ou 1)
p: a movimentação 15 é
entretenimento ou não? (0 ou 1)
    p: a movimentação 15 é
 alimentação ou não? (0 ou 1)
p: a movimentação 15 é
entretenimento ou não? (0 ou 1)
    p: a movimentação 15 é
 alimentação ou não? (0 ou 1)
    p: a movimentação 15 é
  profissional ou não? (0 ou 1)
dia   valor      loja      categoria

30     30      MAX PAD    alimentação

30     35      MUNI TR    transporte

30    149      CAELUM     profissional

1     499     FACULDADE   profissional

30     5       BUTECO     alimentação
dia   valor      loja      categoria

30     30      MAX PAD    alimentação

30     35      MUNI TR    transporte
                      onde estão os
30    149      CAELUM     0 e 1?
                       profissional

1     499     FACULDADE   profissional

30     5       BUTECO     alimentação
dia   valor      loja     categoria

30     30      MAX PAD       0

30     35      MUNI TR       1

30    149      CAELUM        2

1     499     FACULDADE      2

30     5       BUTECO        0
dia   valor      loja      categoria

30     30      MAX PAD        0

30     35      MUNI TR        1
                          é 0, 1 ou 2?
30    149      CAELUM         2

1     499     FACULDADE       2

30     5       BUTECO         0
dia   valor      loja     categoria

30     30      MAX PAD       é

30     35      MUNI TR     resto

30    149      CAELUM      resto

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor      loja     categoria

30     30      MAX PAD       é

30     35      MUNI TR     resto
                      é 0 ou o resto?
30    149      CAELUM       77%
                           resto

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR       é

30    149      CAELUM      resto

1     499     FACULDADE    resto

30     5       BUTECO        é
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR       é
                      é 1 ou o resto?
30    149      CAELUM       53%
                           resto

1     499     FACULDADE    resto

30     5       BUTECO        é
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR     resto

30    149      CAELUM        é

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR     resto
                      é 2 ou o resto?
30    149      CAELUM      64%
                            é

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0



dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1



dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0



dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1



dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0


                   entretenimento
dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1



dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0


                   entretenimento
dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1

                     alimentação
dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

          1     37      9      1

         30    2500     7      0


entretenimento
         dia   valor   loja   label

         30     30     15      1

         30     35     17      0

         30    100      8      0

          1     37      9      0

         30    2500     7      1

 alimentação
         dia   valor   loja   label

         30     30     15      0

         30     35     17      1

         30    100      8      1

          1     37      9      0

         30    2500     7      0


 profissional
dia   valor   loja   label

               30     30     15      0

               30     35     17      0
77%            30    100      8      0

                1     37      9      1

               30    2500     7      0


      entretenimento
               dia   valor   loja   label

               30     30     15      1

               30     35     17      0

               30    100      8      0

                1     37      9      0

               30    2500     7      1

       alimentação
               dia   valor   loja   label

               30     30     15      0

               30     35     17      1

               30    100      8      1

                1     37      9      0

               30    2500     7      0


       profissional
dia   valor   loja   label

               30     30     15      0

               30     35     17      0
77%            30    100      8      0

                1     37      9      1

               30    2500     7      0


      entretenimento
               dia   valor   loja   label

               30     30     15      1

53%            30     35     17      0

               30    100      8      0

                1     37      9      0

               30    2500     7      1

       alimentação
               dia   valor   loja   label

               30     30     15      0

               30     35     17      1

               30    100      8      1

                1     37      9      0

               30    2500     7      0


       profissional
dia   valor   loja   label

               30     30     15      0

               30     35     17      0
77%            30    100      8      0

                1     37      9      1

               30    2500     7      0


      entretenimento
               dia   valor   loja   label

               30     30     15      1

53%            30     35     17      0

               30    100      8      0

                1     37      9      0

               30    2500     7      1

       alimentação
               dia   valor   loja   label

               30     30     15      0

64%            30     35     17      1

               30    100      8      1

                1     37      9      0

               30    2500     7      0


       profissional
77%

      entretenimento

53%

                       treina
       alimentação

64%


       profissional
entretenimento



                 treina
 alimentação




 profissional
entretenimento

entretenimento



                    treina
 alimentação




 profissional
entretenimento

entretenimento



                     treina
 alimentação


         você ficou esperando o
         outro robô aparecer né?
 profissional
One vs All
p: dentre as categorias A,B,C a
 qual categoria ele pertence?
p: dentre as categorias A,B,C a
 qual categoria ele pertence?
  p: o aluno está motivado,
   desanimado, desiludido,
 decepcionado, contente ou
          malandrão?
o aluno não terminou :(
será que eu poderia ter
      ajudado ele?
qto tempo em cada
     exercício?
qto tempo em cada
     exercício?


  alunos   = []
  alunos   << [12, 150, 3, 15]
  alunos   << [4, 170, 32, 25]
  alunos   << [1, 10, 3, 25]
  alunos   << [12, 20, 31, 15]
se ele termina o curso
 em 3 meses ou não
se ele termina o curso
 em 3 meses ou não
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]
se ele termina o curso
 em 3 meses ou não
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]

     labels = [1, 1, 0, 0]
treina
treina
treina
treina
e o guilherme?
e o guilherme?

guilherme = [6, 140, 25, 10]
e o guilherme?

guilherme = [6, 140, 25, 10]

model.predict(Node.features(guilherme))
adivinhe!
SVM
SVM
dados fake
dados fake
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]
dados fake
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]

     labels = [1, 1, 0, 0]
dados reais
dados reais
dados reais
C utilizado   ACERTOS NO TREINO PREVISOES COM AC
0.08!         93.18%!           85.71%
dados reais
C utilizado   ACERTOS NO TREINO PREVISOES COM AC
0.08!         93.18%!           85.71%




C utilizado! ! ACERTOS NO TREINO!PREVISOES
0.001! !
      !        70.45454545454545!61.90476190476190
0.04! ! !      88.63636363636364!71.42857142857143
0.08! ! !      93.18181818181819!85.71428571428571
0.2! !
    !          100.0! !
                     !           100.0
dados reais
C utilizado   ACERTOS NO TREINO PREVISOES COM AC
0.08!         93.18%!           85.71%




C utilizado! ! ACERTOS NO TREINO!PREVISOES
0.001! !
      !        70.45454545454545!61.90476190476190
0.04! ! !      88.63636363636364!71.42857142857143
0.08! ! !      93.18181818181819!85.71428571428571
0.2! !
    !          100.0! !
                     !           100.0
SVM para classificar
     (0,1, ...)
p: dentre as categorias A,B,C a
 qual categoria ele pertence?
p: dentre as categorias A,B,C a
 qual categoria ele pertence?

p: o aluno vai desistir do curso?

  p: essa pessoa tem perfil de
           terrorista?
grupos de alunos
grupos de alunos
grupos de alunos
user id 15 ?? user id 17
user id 15 ?? user id 17
user id 15 ?==? user id 17
user id 15 ?? user id 17
  user id 15 ?==? user id 17
333784321236738126783 ?==? 1238793923832178612397
user id 15 ?? user id 17
  user id 15 ?==? user id 17
333784321236738126783 ?==? 1238793923832178612397

   dificuldade != facilidade
user id 15 ?? user id 17
  user id 15 ?==? user id 17
333784321236738126783 ?==? 1238793923832178612397

   dificuldade != facilidade
características em comum
características em comum
                   altura???
características em comum
número de respostas erradas
                              altura???
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                               feedbacks dados
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                               feedbacks dados
      notas de feedback recebidos
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                                  feedbacks dados
      notas de feedback recebidos

                          likes
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                                  feedbacks dados
      notas de feedback recebidos

                          likes
          cursos
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                                   feedbacks dados
      notas de feedback recebidos

                           likes
          cursos
                   quantidade de caracteres
joga no plano
olha eles aqui!
chuta um ponto

X

           X
genial

X

             X
melhora

X

              X
melhora

X

                  X
    X
melhora

X

                  X
    X


                      X
melhora

X

                  X
    X


                      X
melhora

X

                  X
    X


                      X
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
esses são os grupos
grupos esperados:

muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas



                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos esperados:


X
muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas



                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos esperados:


X                              X
muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas



                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos esperados:


X                              X
muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas




              X
                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos encontrados:
grupos encontrados:

muitas perguntas,
 poucos erros
grupos encontrados:

muitas perguntas,     muitos erros,
 poucos erros       poucas perguntas
grupos encontrados:

muitas perguntas,                muitos erros,
 poucos erros                  poucas perguntas



                 muitos erros,
               poucas perguntas,
                ajuda bastante
grupos encontrados:

muitas perguntas,                muitos erros,
 poucos erros                  poucas perguntas



                 muitos erros,
               poucas perguntas,
                ajuda bastante
                                         entre
                                         outros
p: como meus _____ se
       agrupam?
p: como meus _____ se
        agrupam?
  p: como os alunos se
       comportam?
p: como meus _____ se
        agrupam?
  p: como os alunos se
       comportam?

p: como os instrutores se
      comportam?
p: como meus _____ se
        agrupam?
  p: como os alunos se
       comportam?

p: como os instrutores se
      comportam?

p: como os exercícios se
      comportam?
p: como meus clientes se
       agrupam?
p: como meus clientes se
        agrupam?
p: como meus produtos se
        agrupam?
p: como meus clientes se
        agrupam?
p: como meus produtos se
        agrupam?

p: como minhas features se
        agrupam?
p: como meus clientes se
        agrupam?
p: como meus produtos se
        agrupam?

p: como minhas features se
        agrupam?

p: como os clientes usam o
         sistema?
resumindo
machine learning
machine learning
regressão linear
machine learning
regressão linear
 classificadores
machine learning
regressão linear
 classificadores
 redes neurais
machine learning
regressão linear
 classificadores
 redes neurais
     logistic
machine learning
regressão linear
 classificadores
 redes neurais
     logistic
    k-cluster
a média de bugs de uma
equipe é X
a média de bugs de uma
equipe é X
“nessa equipe está Y”
metricminer.org.br
se usar o computador
se usar o computador
se usar o computador
      não dirija
se beber não dirija
se beber não dirija
se ler, não dirija
se ler, não dirija
se falar, não dirija
se falar, não dirija
“carros” automáticos
“carros” automáticos
“carros” automáticos
“carros” automáticos
detectando...
detectando...
detectando...
detectando...
detectando...
detectando...
detectando...   margem de erro
o que você quer saber
  sobre um cliente?
o que você quer saber
    sobre um cliente?
o que o cliente quer saber
    sobre ele mesmo?
o que você quer saber
     sobre um cliente?
 o que o cliente quer saber
     sobre ele mesmo?
como os clientes se agrupam?
o que você quer saber
     sobre um cliente?
 o que o cliente quer saber
     sobre ele mesmo?
como os clientes se agrupam?

como seus itens se agrupam?
o que você quer saber
     sobre um cliente?
 o que o cliente quer saber
     sobre ele mesmo?
como os clientes se agrupam?

como seus itens se agrupam?

 quando o cliente fará algo?
nós respondemos 2
nós respondemos 2
  levante as suas
obrigado 1
guilherme.silveira@caelum.com.br
@guilhermecaelum
http://caelum.com.br/online

Weitere ähnliche Inhalte

Andere mochten auch

Resultado Final do Concurso de Bom Sucesso
Resultado Final do Concurso de Bom Sucesso Resultado Final do Concurso de Bom Sucesso
Resultado Final do Concurso de Bom Sucesso Joao Rivonaldo Silva
 
Exames médicos valores - União Sindical
Exames médicos   valores - União SindicalExames médicos   valores - União Sindical
Exames médicos valores - União Sindicalsinteimp
 
2500 years of learning theory: The good, the bad & the ugly - Donald Clark
2500 years of learning theory: The good, the bad & the ugly - Donald Clark2500 years of learning theory: The good, the bad & the ugly - Donald Clark
2500 years of learning theory: The good, the bad & the ugly - Donald ClarkLearning Pool Ltd
 
Sarah Palin\'s Shopping Spree
Sarah Palin\'s Shopping SpreeSarah Palin\'s Shopping Spree
Sarah Palin\'s Shopping Spreecoolstuff
 
Labor Market and Salary Survey in Russia
Labor Market and Salary Survey in RussiaLabor Market and Salary Survey in Russia
Labor Market and Salary Survey in RussiaAwara Direct Search
 
Lineadeltiempodelacomputacion Iiuac
Lineadeltiempodelacomputacion IiuacLineadeltiempodelacomputacion Iiuac
Lineadeltiempodelacomputacion IiuacOscorp
 
Priceliste celine infrapower infrared heater europe
Priceliste celine infrapower infrared heater europePriceliste celine infrapower infrared heater europe
Priceliste celine infrapower infrared heater europeMarina Infocenter
 
Atelier (re)Commencez votre plan média
Atelier (re)Commencez votre plan média Atelier (re)Commencez votre plan média
Atelier (re)Commencez votre plan média Lucie PELLICIER
 
Clase 4 Plan De Mercado Y Promociones Febrero
Clase 4 Plan De Mercado Y Promociones  FebreroClase 4 Plan De Mercado Y Promociones  Febrero
Clase 4 Plan De Mercado Y Promociones Febrerodeisy torrico
 
Schaarheftafels van Gruse
Schaarheftafels van GruseSchaarheftafels van Gruse
Schaarheftafels van GrusePeter Koelewijn
 
INTRODUCCION A LA INGENIERIA
INTRODUCCION A LA INGENIERIAINTRODUCCION A LA INGENIERIA
INTRODUCCION A LA INGENIERIAOscorp
 
Contabilidade basica peps ueps
Contabilidade basica peps uepsContabilidade basica peps ueps
Contabilidade basica peps uepssimuladocontabil
 

Andere mochten auch (17)

Apresentacao
ApresentacaoApresentacao
Apresentacao
 
Resultado Final do Concurso de Bom Sucesso
Resultado Final do Concurso de Bom Sucesso Resultado Final do Concurso de Bom Sucesso
Resultado Final do Concurso de Bom Sucesso
 
Exames médicos valores - União Sindical
Exames médicos   valores - União SindicalExames médicos   valores - União Sindical
Exames médicos valores - União Sindical
 
Option Strategies
Option StrategiesOption Strategies
Option Strategies
 
Acoples rapidos
Acoples rapidosAcoples rapidos
Acoples rapidos
 
2500 years of learning theory: The good, the bad & the ugly - Donald Clark
2500 years of learning theory: The good, the bad & the ugly - Donald Clark2500 years of learning theory: The good, the bad & the ugly - Donald Clark
2500 years of learning theory: The good, the bad & the ugly - Donald Clark
 
Sarah Palin\'s Shopping Spree
Sarah Palin\'s Shopping SpreeSarah Palin\'s Shopping Spree
Sarah Palin\'s Shopping Spree
 
Labor Market and Salary Survey in Russia
Labor Market and Salary Survey in RussiaLabor Market and Salary Survey in Russia
Labor Market and Salary Survey in Russia
 
Catálogo de delícias
Catálogo de delíciasCatálogo de delícias
Catálogo de delícias
 
Lineadeltiempodelacomputacion Iiuac
Lineadeltiempodelacomputacion IiuacLineadeltiempodelacomputacion Iiuac
Lineadeltiempodelacomputacion Iiuac
 
Priceliste celine infrapower infrared heater europe
Priceliste celine infrapower infrared heater europePriceliste celine infrapower infrared heater europe
Priceliste celine infrapower infrared heater europe
 
Atelier (re)Commencez votre plan média
Atelier (re)Commencez votre plan média Atelier (re)Commencez votre plan média
Atelier (re)Commencez votre plan média
 
Clase 4 Plan De Mercado Y Promociones Febrero
Clase 4 Plan De Mercado Y Promociones  FebreroClase 4 Plan De Mercado Y Promociones  Febrero
Clase 4 Plan De Mercado Y Promociones Febrero
 
Schaarheftafels van Gruse
Schaarheftafels van GruseSchaarheftafels van Gruse
Schaarheftafels van Gruse
 
INTRODUCCION A LA INGENIERIA
INTRODUCCION A LA INGENIERIAINTRODUCCION A LA INGENIERIA
INTRODUCCION A LA INGENIERIA
 
Contabilidade basica peps ueps
Contabilidade basica peps uepsContabilidade basica peps ueps
Contabilidade basica peps ueps
 
Cara Membina Graf
Cara Membina GrafCara Membina Graf
Cara Membina Graf
 

Mehr von Guilherme Silveira

Equipes ágeis em 2012 - Lições aprendidas
Equipes ágeis em 2012 - Lições aprendidasEquipes ágeis em 2012 - Lições aprendidas
Equipes ágeis em 2012 - Lições aprendidasGuilherme Silveira
 
Depois de Scrum e XP: não pare de aprender, não pare de inovar
Depois de Scrum e XP: não pare de aprender, não pare de inovarDepois de Scrum e XP: não pare de aprender, não pare de inovar
Depois de Scrum e XP: não pare de aprender, não pare de inovarGuilherme Silveira
 
O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...
O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...
O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...Guilherme Silveira
 
Software de qualidade e qualidade de código
Software de qualidade e qualidade de códigoSoftware de qualidade e qualidade de código
Software de qualidade e qualidade de códigoGuilherme Silveira
 
REST: Hypermidia e Cache - DNAD 2011
REST: Hypermidia e Cache - DNAD 2011REST: Hypermidia e Cache - DNAD 2011
REST: Hypermidia e Cache - DNAD 2011Guilherme Silveira
 
Crie seu sistema REST com JAX-RS e o futuro
Crie seu sistema REST com JAX-RS e o futuroCrie seu sistema REST com JAX-RS e o futuro
Crie seu sistema REST com JAX-RS e o futuroGuilherme Silveira
 
Put your client and server to rest - Javaone
Put your client and server to rest - JavaonePut your client and server to rest - Javaone
Put your client and server to rest - JavaoneGuilherme Silveira
 
Deploy continuo, integraçao continua não basta
Deploy continuo, integraçao continua não bastaDeploy continuo, integraçao continua não basta
Deploy continuo, integraçao continua não bastaGuilherme Silveira
 
noSql + rest: Arquitetura Contemporanea
noSql + rest: Arquitetura ContemporaneanoSql + rest: Arquitetura Contemporanea
noSql + rest: Arquitetura ContemporaneaGuilherme Silveira
 

Mehr von Guilherme Silveira (20)

Equipes ágeis em 2012 - Lições aprendidas
Equipes ágeis em 2012 - Lições aprendidasEquipes ágeis em 2012 - Lições aprendidas
Equipes ágeis em 2012 - Lições aprendidas
 
Depois de Scrum e XP: não pare de aprender, não pare de inovar
Depois de Scrum e XP: não pare de aprender, não pare de inovarDepois de Scrum e XP: não pare de aprender, não pare de inovar
Depois de Scrum e XP: não pare de aprender, não pare de inovar
 
O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...
O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...
O grandiosismo dos loucos - Agile Brazil 2011, Cecilia Fernandes e Guilherme ...
 
Software de qualidade e qualidade de código
Software de qualidade e qualidade de códigoSoftware de qualidade e qualidade de código
Software de qualidade e qualidade de código
 
REST: Hypermidia e Cache - DNAD 2011
REST: Hypermidia e Cache - DNAD 2011REST: Hypermidia e Cache - DNAD 2011
REST: Hypermidia e Cache - DNAD 2011
 
Crie seu sistema REST com JAX-RS e o futuro
Crie seu sistema REST com JAX-RS e o futuroCrie seu sistema REST com JAX-RS e o futuro
Crie seu sistema REST com JAX-RS e o futuro
 
Using the web for real
Using the web for realUsing the web for real
Using the web for real
 
Arquitetura: chega de mesmice
Arquitetura: chega de mesmiceArquitetura: chega de mesmice
Arquitetura: chega de mesmice
 
Arquitetura: chega de mesmice
Arquitetura: chega de mesmiceArquitetura: chega de mesmice
Arquitetura: chega de mesmice
 
Arquitetura chega de mesmice
Arquitetura  chega de mesmiceArquitetura  chega de mesmice
Arquitetura chega de mesmice
 
Arquitetura: chega de mesmice
Arquitetura: chega de mesmiceArquitetura: chega de mesmice
Arquitetura: chega de mesmice
 
Put your client and server to rest - Javaone
Put your client and server to rest - JavaonePut your client and server to rest - Javaone
Put your client and server to rest - Javaone
 
Rest @ Qcon 2010
Rest @ Qcon 2010Rest @ Qcon 2010
Rest @ Qcon 2010
 
Rest clients
Rest clientsRest clients
Rest clients
 
Rest clients
Rest clientsRest clients
Rest clients
 
Rest clients
Rest clientsRest clients
Rest clients
 
Um produto por semana
Um produto por semanaUm produto por semana
Um produto por semana
 
Deploy continuo, integraçao continua não basta
Deploy continuo, integraçao continua não bastaDeploy continuo, integraçao continua não basta
Deploy continuo, integraçao continua não basta
 
noSql + rest: Arquitetura Contemporanea
noSql + rest: Arquitetura ContemporaneanoSql + rest: Arquitetura Contemporanea
noSql + rest: Arquitetura Contemporanea
 
Rest workflows
Rest workflowsRest workflows
Rest workflows
 

Uma introdução concisa à Machine Learning

  • 1. Uma introdução a Machine Learning Guilherme Silveira http://www.caelum.com.br
  • 4. a idéia problemas soluções perguntas respostas
  • 9. decidi ir de carro
  • 10. decidi ir de carro <== piada
  • 14. assisto o trânsito de camarote
  • 15. decidi ir de metrô
  • 16. quem conhece são paulo?
  • 17. quem conhece são paulo? quem conhece o metrô em são paulo?
  • 21. além do trânsito minha vida pessoal
  • 22.
  • 23.
  • 24.
  • 26. o preço dos imóveis Tamanho Preço 100 750000 200 860000 está caro? 150 977000 140 81900 160 984000 180 1127000 130 638000 80 647000 40 346000
  • 27. p: qual um preço justo para esse imóvel?
  • 28.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35. regressão linear f(x) = ax + b
  • 41. regressão linear f(x) = ax + b
  • 42. regressão linear f(x) = ax + b
  • 43. regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n
  • 44. regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n
  • 45. regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n preço = a + ... + dx^n
  • 46. p: como estimar o valor de algo? possível resposta: regressão
  • 47. p: como estimar o valor de algo? possível resposta: regressão p: qual a nota que o aluno vai tirar na prova final?
  • 48. p: como estimar o valor de algo? possível resposta: regressão p: qual a nota que o aluno vai tirar na prova final? p: qual será a nota do hipólito na próxima olimpíada?
  • 49. p: como estimar o valor de algo? possível resposta: regressão p: qual a nota que o aluno vai tirar na prova final? p: qual será a nota do hipólito na próxima olimpíada? p: quanto tempo os alunos precisarão para essa prova?
  • 50. simplicidade++ bizarro--
  • 52. função Brad Pitt (a função perfeita?)
  • 53. função Brad Pitt (a função perfeita?)
  • 54. e o número de dormitórios? Tamanho Preço 100 750000 200 860000 150 977000 140 81900 160 984000 180 1127000 130 638000 80 647000 40 346000
  • 55. e o número de dormitórios? Tamanho Dormitório Preço 100 2 750000 200 3 860000 150 4 977000 140 3 81900 160 3 984000 180 4 1127000 130 3 638000 80 3 647000 40 1 346000
  • 59.
  • 61. p: classificação É spamzis!
  • 62. p: classificação É spamzis! Não é!
  • 63. p: classificação É spamzis! Não é!
  • 64. p: classificação É spamzis! 1 Não é!
  • 65. p: classificação É spamzis! 1 Não é! 0
  • 67.
  • 68.
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.
  • 75.
  • 76.
  • 77.
  • 79. p: ele é 1?
  • 80. p: ele é 1?
  • 81. p: ele é 1? acredito que sim, com chance de 78%
  • 82. lista com 1000 itens
  • 83. lista com 1000 itens classificação humana
  • 84. lista com 1000 itens classificação humana
  • 85. lista com 1000 itens classificação treino da humana máquina
  • 86. lista com 800 itens lista com 1000 itens classificação treino da humana máquina
  • 87. lista com 800 itens lista com 1000 itens classificação treino da valida a humana máquina qualidade
  • 88. lista com 800 itens lista com 1000 itens lista com 200 itens classificação treino da valida a humana máquina qualidade
  • 89. 99% de acerto lista com 800 itens lista com 1000 itens lista com 200 itens classificação treino da valida a humana máquina qualidade
  • 90. p: ele é 1? r: regressão logística
  • 91. p: ele é 1? r: regressão logística
  • 92. p: ele é 1? r: regressão logística chance de x%
  • 93. p: o email é spam?
  • 94. p: o email é spam? p: o aluno está com dificuldade?
  • 95. p: o email é spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo?
  • 96. p: o email é spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance do aluno acertar esse exercício?
  • 97. p: o email é spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance do aluno acertar esse exercício? p: qual a chance de essa imagem ser o número 3? ou 8?
  • 98. p: o email é spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance do aluno acertar esse exercício? p: qual a chance de essa imagem ser o número 3? ou 8? p: qual a chance de essa imagem ser um cancêr?
  • 100. e o cartão de credito?
  • 101. você gastou 50 dia 30 loja 15
  • 102. você gastou 30 dia 30 loja 17
  • 103. você gastou 25 dia 30 loja 21
  • 104. você gastou 25 dia 30 loja 21
  • 105. você gastou 2500 dia 30 loja 7
  • 106. dia valor loja 30 30 15 30 35 17 30 100 8 1 37 9 30 2500 7
  • 107. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 108. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 109. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 110. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 111. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 112. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 113. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 114. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 valida
  • 115. dia valor loja label 30 30 15 0 30 35 17 0 37% de acerto 30 100 8 0 1 37 9 0 30 2500 7 1 valida
  • 116. dia valor loja label 30 30 15 0 30 35 17 0 37% de acerto 30 100 8 0 1 37 9 0 30 2500 7 1 valida
  • 117. dia valor loja label 30 30 15 0 30 35 17 0 37% de acerto 30 100 8 0 1 37 9 0 30 2500 7 1 eu continuo roubando valida
  • 118. regressão logística é, em geral, linear ou lerdíssima
  • 119. regressão logística é, em geral, linear ou lerdíssima regularização
  • 120. regressão logística é, em geral, linear ou lerdíssima regularização polinômios
  • 121. regressão logística é, em geral, linear ou lerdíssima regularização polinômios outras
  • 122. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 123. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 124. dia valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 125. dia valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 126. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 127. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 treina 30 2500 7 1 treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 128. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 treina 30 2500 7 1 treina dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 129. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 treina 30 2500 7 1 treina dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina treina
  • 130. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia treina valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina
  • 131. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia treina valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina
  • 132. dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina treina
  • 133. 87% de acerto dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina treina
  • 134. 87% de acerto dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina o seu telefone toca treina
  • 135. 87% de acerto dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina o seu telefone toca treina
  • 136. p: o email é spam? http://neuroph.sourceforge.net/
  • 137. p: o email é spam? p: essa movimentação é uma fraude? http://neuroph.sourceforge.net/
  • 138. p: o email é spam? p: essa movimentação é uma fraude? p: qualquer pergunta sim/não como antes? http://neuroph.sourceforge.net/
  • 140. dia valor loja 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO
  • 141. dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO
  • 142. o que é isso? dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO
  • 143. o que é isso? dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE alimentação 30 5 BUTECO
  • 144. o que é isso? dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR profissional 30 149 CAELUM 1 499 FACULDADE alimentação 30 5 BUTECO
  • 145. o que é isso? dia valor loja o que é isso? 30 30 MAX PAD profissional 30 35 MUNI TR profissional 30 149 CAELUM 1 499 FACULDADE alimentação 30 5 BUTECO
  • 147. p: a movimentação 15 é entretenimento ou não? (0 ou 1)
  • 148. p: a movimentação 15 é entretenimento ou não? (0 ou 1) p: a movimentação 15 é alimentação ou não? (0 ou 1)
  • 149. p: a movimentação 15 é entretenimento ou não? (0 ou 1) p: a movimentação 15 é alimentação ou não? (0 ou 1) p: a movimentação 15 é profissional ou não? (0 ou 1)
  • 150. dia valor loja categoria 30 30 MAX PAD alimentação 30 35 MUNI TR transporte 30 149 CAELUM profissional 1 499 FACULDADE profissional 30 5 BUTECO alimentação
  • 151. dia valor loja categoria 30 30 MAX PAD alimentação 30 35 MUNI TR transporte onde estão os 30 149 CAELUM 0 e 1? profissional 1 499 FACULDADE profissional 30 5 BUTECO alimentação
  • 152. dia valor loja categoria 30 30 MAX PAD 0 30 35 MUNI TR 1 30 149 CAELUM 2 1 499 FACULDADE 2 30 5 BUTECO 0
  • 153. dia valor loja categoria 30 30 MAX PAD 0 30 35 MUNI TR 1 é 0, 1 ou 2? 30 149 CAELUM 2 1 499 FACULDADE 2 30 5 BUTECO 0
  • 154. dia valor loja categoria 30 30 MAX PAD é 30 35 MUNI TR resto 30 149 CAELUM resto 1 499 FACULDADE é 30 5 BUTECO resto
  • 155. dia valor loja categoria 30 30 MAX PAD é 30 35 MUNI TR resto é 0 ou o resto? 30 149 CAELUM 77% resto 1 499 FACULDADE é 30 5 BUTECO resto
  • 156. dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR é 30 149 CAELUM resto 1 499 FACULDADE resto 30 5 BUTECO é
  • 157. dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR é é 1 ou o resto? 30 149 CAELUM 53% resto 1 499 FACULDADE resto 30 5 BUTECO é
  • 158. dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR resto 30 149 CAELUM é 1 499 FACULDADE é 30 5 BUTECO resto
  • 159. dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR resto é 2 ou o resto? 30 149 CAELUM 64% é 1 499 FACULDADE é 30 5 BUTECO resto
  • 160. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 161. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 162. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 163. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 164. dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 165. dia valor loja label 30 30 15 0 30 35 17 0 77% 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 166. dia valor loja label 30 30 15 0 30 35 17 0 77% 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 53% 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 167. dia valor loja label 30 30 15 0 30 35 17 0 77% 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 53% 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 64% 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 168. 77% entretenimento 53% treina alimentação 64% profissional
  • 169. entretenimento treina alimentação profissional
  • 170. entretenimento entretenimento treina alimentação profissional
  • 171. entretenimento entretenimento treina alimentação você ficou esperando o outro robô aparecer né? profissional
  • 173. p: dentre as categorias A,B,C a qual categoria ele pertence?
  • 174. p: dentre as categorias A,B,C a qual categoria ele pertence? p: o aluno está motivado, desanimado, desiludido, decepcionado, contente ou malandrão?
  • 175. o aluno não terminou :(
  • 176. será que eu poderia ter ajudado ele?
  • 177. qto tempo em cada exercício?
  • 178. qto tempo em cada exercício? alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15]
  • 179. se ele termina o curso em 3 meses ou não
  • 180. se ele termina o curso em 3 meses ou não alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15]
  • 181. se ele termina o curso em 3 meses ou não alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15] labels = [1, 1, 0, 0]
  • 182. treina
  • 183. treina
  • 184. treina
  • 185. treina
  • 187. e o guilherme? guilherme = [6, 140, 25, 10]
  • 188. e o guilherme? guilherme = [6, 140, 25, 10] model.predict(Node.features(guilherme))
  • 190. SVM
  • 191. SVM
  • 193. dados fake alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15]
  • 194. dados fake alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15] labels = [1, 1, 0, 0]
  • 197. dados reais C utilizado ACERTOS NO TREINO PREVISOES COM AC 0.08! 93.18%! 85.71%
  • 198. dados reais C utilizado ACERTOS NO TREINO PREVISOES COM AC 0.08! 93.18%! 85.71% C utilizado! ! ACERTOS NO TREINO!PREVISOES 0.001! ! ! 70.45454545454545!61.90476190476190 0.04! ! ! 88.63636363636364!71.42857142857143 0.08! ! ! 93.18181818181819!85.71428571428571 0.2! ! ! 100.0! ! ! 100.0
  • 199. dados reais C utilizado ACERTOS NO TREINO PREVISOES COM AC 0.08! 93.18%! 85.71% C utilizado! ! ACERTOS NO TREINO!PREVISOES 0.001! ! ! 70.45454545454545!61.90476190476190 0.04! ! ! 88.63636363636364!71.42857142857143 0.08! ! ! 93.18181818181819!85.71428571428571 0.2! ! ! 100.0! ! ! 100.0
  • 200. SVM para classificar (0,1, ...)
  • 201. p: dentre as categorias A,B,C a qual categoria ele pertence?
  • 202. p: dentre as categorias A,B,C a qual categoria ele pertence? p: o aluno vai desistir do curso? p: essa pessoa tem perfil de terrorista?
  • 206. user id 15 ?? user id 17
  • 207. user id 15 ?? user id 17 user id 15 ?==? user id 17
  • 208. user id 15 ?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397
  • 209. user id 15 ?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397 dificuldade != facilidade
  • 210. user id 15 ?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397 dificuldade != facilidade
  • 213. características em comum número de respostas erradas altura???
  • 214. características em comum número de respostas erradas altura??? tempo gasto
  • 215. características em comum número de respostas erradas altura??? tempo gasto número de exercícios feitos
  • 216. características em comum número de respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados
  • 217. características em comum número de respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos
  • 218. características em comum número de respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes
  • 219. características em comum número de respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes cursos
  • 220. características em comum número de respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes cursos quantidade de caracteres
  • 224. genial X X
  • 225. melhora X X
  • 226. melhora X X X
  • 227. melhora X X X X
  • 228. melhora X X X X
  • 229. melhora X X X X
  • 233. e melhora... e melhora... e melhora... e melhora...
  • 234. e melhora... e melhora... e melhora... e melhora... e melhora...
  • 235. e melhora... e melhora... e melhora... e melhora... e melhora... e melhora...
  • 236. e melhora... e melhora... e melhora... e melhora... e melhora... e melhora... e melhora...
  • 237. esses são os grupos
  • 238. grupos esperados: muitas perguntas, poucos erros, muitos erros poucas perguntas poucos erros, poucas perguntas, ajuda bastante
  • 239. grupos esperados: X muitas perguntas, poucos erros, muitos erros poucas perguntas poucos erros, poucas perguntas, ajuda bastante
  • 240. grupos esperados: X X muitas perguntas, poucos erros, muitos erros poucas perguntas poucos erros, poucas perguntas, ajuda bastante
  • 241. grupos esperados: X X muitas perguntas, poucos erros, muitos erros poucas perguntas X poucos erros, poucas perguntas, ajuda bastante
  • 244. grupos encontrados: muitas perguntas, muitos erros, poucos erros poucas perguntas
  • 245. grupos encontrados: muitas perguntas, muitos erros, poucos erros poucas perguntas muitos erros, poucas perguntas, ajuda bastante
  • 246. grupos encontrados: muitas perguntas, muitos erros, poucos erros poucas perguntas muitos erros, poucas perguntas, ajuda bastante entre outros
  • 247. p: como meus _____ se agrupam?
  • 248. p: como meus _____ se agrupam? p: como os alunos se comportam?
  • 249. p: como meus _____ se agrupam? p: como os alunos se comportam? p: como os instrutores se comportam?
  • 250. p: como meus _____ se agrupam? p: como os alunos se comportam? p: como os instrutores se comportam? p: como os exercícios se comportam?
  • 251. p: como meus clientes se agrupam?
  • 252. p: como meus clientes se agrupam? p: como meus produtos se agrupam?
  • 253. p: como meus clientes se agrupam? p: como meus produtos se agrupam? p: como minhas features se agrupam?
  • 254. p: como meus clientes se agrupam? p: como meus produtos se agrupam? p: como minhas features se agrupam? p: como os clientes usam o sistema?
  • 259. machine learning regressão linear classificadores redes neurais
  • 260. machine learning regressão linear classificadores redes neurais logistic
  • 261. machine learning regressão linear classificadores redes neurais logistic k-cluster
  • 262. a média de bugs de uma equipe é X
  • 263. a média de bugs de uma equipe é X “nessa equipe está Y” metricminer.org.br
  • 264. se usar o computador
  • 265. se usar o computador
  • 266. se usar o computador não dirija
  • 267. se beber não dirija
  • 268. se beber não dirija
  • 269. se ler, não dirija
  • 270. se ler, não dirija
  • 271. se falar, não dirija
  • 272. se falar, não dirija
  • 283. detectando... margem de erro
  • 284.
  • 285. o que você quer saber sobre um cliente?
  • 286. o que você quer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo?
  • 287. o que você quer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam?
  • 288. o que você quer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam? como seus itens se agrupam?
  • 289. o que você quer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam? como seus itens se agrupam? quando o cliente fará algo?
  • 290.
  • 292. nós respondemos 2 levante as suas

Hinweis der Redaktion

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. \n
  58. \n
  59. \n
  60. \n
  61. \n
  62. \n
  63. \n
  64. \n
  65. \n
  66. \n
  67. \n
  68. \n
  69. \n
  70. \n
  71. \n
  72. \n
  73. \n
  74. \n
  75. \n
  76. \n
  77. \n
  78. \n
  79. \n
  80. \n
  81. \n
  82. \n
  83. \n
  84. \n
  85. \n
  86. \n
  87. \n
  88. \n
  89. \n
  90. \n
  91. \n
  92. \n
  93. \n
  94. \n
  95. \n
  96. \n
  97. \n
  98. \n
  99. \n
  100. \n
  101. \n
  102. \n
  103. \n
  104. \n
  105. \n
  106. \n
  107. \n
  108. \n
  109. \n
  110. \n
  111. \n
  112. \n
  113. \n
  114. \n
  115. \n
  116. \n
  117. \n
  118. \n
  119. \n
  120. \n
  121. \n
  122. \n
  123. \n
  124. \n
  125. \n
  126. \n
  127. \n
  128. \n
  129. \n
  130. \n
  131. \n
  132. \n
  133. \n
  134. \n
  135. \n
  136. \n
  137. \n
  138. \n
  139. \n
  140. \n
  141. \n
  142. \n
  143. \n
  144. \n
  145. \n
  146. \n
  147. \n
  148. \n
  149. \n
  150. \n
  151. \n
  152. \n
  153. \n
  154. \n
  155. \n
  156. \n
  157. \n
  158. \n
  159. \n
  160. \n
  161. \n
  162. \n
  163. \n
  164. \n
  165. \n
  166. \n
  167. \n
  168. \n
  169. \n
  170. \n
  171. \n
  172. \n
  173. \n
  174. \n
  175. \n
  176. \n
  177. \n
  178. \n
  179. \n
  180. \n
  181. \n
  182. \n
  183. \n
  184. \n
  185. \n
  186. \n
  187. \n
  188. \n
  189. \n
  190. \n
  191. \n
  192. \n
  193. \n
  194. \n
  195. \n
  196. \n
  197. \n
  198. \n
  199. \n
  200. \n
  201. \n
  202. \n
  203. \n
  204. \n
  205. \n
  206. \n
  207. \n
  208. \n
  209. \n
  210. \n
  211. \n
  212. \n
  213. \n
  214. \n
  215. \n
  216. \n
  217. \n
  218. \n
  219. \n
  220. \n
  221. \n
  222. \n
  223. \n
  224. \n
  225. \n
  226. \n
  227. \n
  228. \n
  229. \n
  230. \n
  231. \n
  232. \n
  233. \n
  234. \n
  235. \n
  236. \n
  237. \n
  238. \n
  239. \n
  240. \n
  241. \n
  242. \n
  243. \n
  244. \n
  245. \n
  246. \n
  247. \n
  248. \n
  249. \n
  250. \n
  251. \n
  252. \n
  253. \n
  254. \n
  255. \n
  256. \n
  257. \n
  258. \n
  259. \n
  260. \n
  261. \n
  262. \n
  263. \n
  264. \n
  265. \n
  266. \n
  267. \n
  268. \n
  269. \n
  270. \n
  271. \n
  272. \n
  273. \n
  274. \n
  275. \n
  276. \n
  277. \n
  278. \n
  279. \n
  280. \n
  281. \n
  282. \n
  283. \n
  284. \n
  285. \n