3. Antes de aprender un lenguaje de programación
VAS A INVERTIR MUCHO TIEMPODebes preguntarte cuál es
el objetivo de dicho
aprendizaje
PIENSA EN UN OBJETIVO CONCRETO
BUSCA EN INTERNET
#vamostalegon
6. #vamostalegon
EXTRACT DATA
Los datos raramente
están en la misma
fuente
TRANSFORM
DATA
Al juntar datos de
diversas fuentes,
estos están en
diferentes formatos
LOAD DATA
Para hacer informes
o compartir lo
analizado.
A QUÉ DEDICAMOS MÁS TIEMPO
ETL
7. Python
¿Por qué hay tanto interés
en Python?
#vamostalegon
● ES UN LENGUAJE FÁCIL DE APRENDER SI YA SABES PROGRAMAR:
CÓDIGO FÁCIL DE LEER (PARA PROGRAMADORES)
● PUEDES PROGRAMAR BAJO EL PARADIGMA DE LA ORIENTACIÓN A
OBJETOS O UTILIZAR PROGRAMACIÓN ESTRUCTURADA
● LAS MEJORES LIBRERÍAS DE DEEPLEARNING ESTÁN EN PYTHON
(KERAS)
● FUNCIONA EN MULTITUD DE ENTORNOS
8. R
¿Por qué elegir R?
#vamostalegon
● ES UN LENGUAJE PARA NO PROGRAMADORES
● TIENE TIDYVERSE (DPLYR)
● ES FÁCIL DE USAR SI NO ERES UN PROGRAMADOR
● SI QUIERES PROFUNDIZAR, PUEDES HACER LO MISMO QUE PUEDES
HACER EN PYTHON
● ES MÁS FÁCIL QUE EXCEL (A VECES)
12. DPLYR
“Dplyr es la gramática de la manipulación de datos”
Se basa en 5 verbos + 1.
#vamostalegon
13. DPLYR
Los 5 verbos + 1
mutate() -> Añade columnas con “métricas calculadas”.
select() -> Selecciona columnas por su nombre.
filter() -> Selecciona datos en función de su valor.
summarise() -> Devuelve un sumario de los datos.
arrange() -> Ordena las filas.
group_by() -> Agrupa el contenido en función de sus valores.
#vamostalegon
21. "You can't port dplyr into
python, it would be
unpythonic. It would be
like vegetarian bacon - it
doesn't satisfy anyone."
@hadleywickham
#vamostalegon
22. R ES MEJOR QUE PYTHON
(Si no sabes programar)
Elige bien lo que quieres
aprender, te llevará años
CONCLUSIONES
#vamostalegon
Investiga antes:
TODO ESTÁ EN INTERNET
23. ENLACES DE UTILIDAD
RSTUDIO: https://www.rstudio.com/products/rstudio/download/
PAQUETES
TYDIVERSE: https://www.tidyverse.org
APIs GOOGLE: http://code.markedmondson.me/r-packages/
IMPRESCINDIBLES: https://support.rstudio.com/hc/en-us/articles/201057987-Quick-list-
of-useful-R-packages
https://stackoverflow.com/
APRENDER
DATACAMP: https://www.datacamp.com