Este documento resume los aspectos legales del data scraping. Explica que el scraping de datos no es ilegal en sí mismo, pero su uso puede vulnerar las leyes si no se tiene cuidado. Detalla posibles problemas legales como violar términos y condiciones, extraer datos protegidos por derechos de autor, recopilar datos personales sin consentimiento, o causar daños a un sitio web. Concluye que es importante considerar el uso planificado de los datos, revisar términos y condiciones, y asegurarse de no infringir leyes de propiedad intelectual
2. ¿Qué es Términos y Condiciones?
Prestamos servicios legales en nuevas
tecnologías. Por ejemplo, comercio electrónico,
protección de datos, marcas y la vertiente legal de
cualquier proyecto tecnológico.
In English too!
3. ¿Qué es Términos y Condiciones?
¡También tenemos un Legal LAB! Y allí
hemos escrapeado por ejemplo miles de
términos y condiciones. Para saber cómo y
cuándo cambian
9. Índice
1. Tres ideas previas
2. Precedentes judiciales
3. Cuestiones legales
❖ Términos y condiciones
❖ Propiedad intelectual
❖ Datos personales
❖ Otros
4. Conclusiones
@tyc_es
10. Tres ideas previas
1.- ¿Qué es web scraping?
Software para extraer de forma automatizada los
datos de un sitio web, simulando la navegación
de un humano
@tyc_es
11. Tres ideas previas
2.- ¿Es legal un web scraper?
Obviamente sí, no es más que un instrumento. La
tecnología en sí no es ilegal, su uso sí puede serlo
@tyc_es
12. Tres ideas previas
3.- Hoy es pieza clave, y lo será más
Por razones económicas, sociales e incluso políticas,
vivimos en la era del dato y su valor es obvio
@tyc_es
15. Precedentes judiciales
En Europa, Ryanair en 2008-2009
Su campaña contra las agencias online o, como
los denominó: “los parásitos del sector”
@tyc_es
16. Precedentes judiciales
En Europa, caso Fixtures Marketing
En relación a los calendarios de fútbol de la Liga
escocesa e inglesa y si podían ser protegidos como obra
@tyc_es
17. Precedentes judiciales
En Europa, caso Football Dataco vs Yahoo! UK
En relación a si Yahoo podía escrapear los calendarios
de la Premier League y mostrarlos en su web
@tyc_es
23. Términos y condiciones
Cláusula habitual
“Se prohíbe el uso de cualquier sistema automatizado o software
para extraer datos de este sitio web para fines comerciales.”
@tyc_es
25. Términos y condiciones
¿Por tanto, usar un web scraper vulnera esas
condiciones?
¿Debería responder por un incumplimiento
contractual?
@tyc_es
26. Términos y condiciones
Uso personal o no comercial
Si el uso es no comercial o personal,
normalmente no debería dar problema
@tyc_es
27. Términos y condiciones
Uso comercial
Definitivamente debe verse el caso concreto, ya
que podría haber vulneración, pero hay algunas
pautas básicas…
@tyc_es
28. Términos y condiciones
Uso comercial
❖ Necesitas una “aceptación” de las condiciones
❖ El acceso y uso de la web por el bot no basta
❖ No equivale a un “derecho de admisión digital”
@tyc_es
29. Términos y condiciones
¿Cómo puede el servicio protegerse y convertir
el scraping en vulneración?
❖ Adoptar medidas tecnológicas apropiadas
❖ Exigir la aceptación de condiciones para
acceder al sitio o los datos
@tyc_es
30. Términos y condiciones
El poder del servicio
@tyc_es
En todo caso, si el servicio considera que se han
vulnerado las condiciones legales, sin duda va a
cerrarte el acceso al mismo
37. Propiedad intelectual
Pero de los datos se puede crear una
estructura original que haya
implicado una inversión sustancial
@tyc_es
38. Propiedad intelectual
Generando una base de datos que por los
recursos invertidos para su obtención,
verificación o presentación, sea protegible
@tyc_es
39. Propiedad intelectual
Aunque el criterio jurisprudencial es bastante
estricto, a efectos de considerar protegible una
base de datos | Casos Ryanair, Football
Dataco o Yahoo UK
@tyc_es
40. Propiedad intelectual
Por tanto, el scraping de una base de datos
protegida por la propiedad intelectual sí
puede suponer un lío legal
@tyc_es
41. Propiedad intelectual
En todo caso, luego habrá que ver el carácter
sustancial o no de la utilización de los datos
scrapeados
@tyc_es
43. Datos personales
Si vas a escrapear datos personales, el RGPD
quiere hablar contigo :p
@tyc_es
44. Datos personales
Primer problema, ¿qué es un dato personal?
Con el RGPD, metadatos o identificadores
numéricos asociables a una persona son datos
personales
@tyc_es
45. Datos personales
Segundo problema, ¿sobre qué base legal los
recojo? Consentimiento, un contrato, interés
legítimo u otros. Sea como sea, el
consentimiento no es la única opción
@tyc_es
46. Datos personales
Tercer problema, ¿medidas de seguridad?
Cómo cifro los datos, los debo anonimizar o
solo seudonimizar, durante cuánto tiempo los
conservo…
@tyc_es
47. Datos personales
Cuarto problema, ¿para qué los uso? Muchas
veces se escrapean datos con una finalidad y
meses o años después se descubre otra utilidad
@tyc_es
48. Datos personales
Quinto problema, ¿el scraping implica algún
perfilado o tratamiento automatizado? Por
ejemplo, para detectar un fraude bancario o en
un proceso de compra
@tyc_es
49. Otros
❖ Competencia desleal
❖ Intrusión informática no autorizada
❖ Consumo de recursos
❖ Pérdida de ingresos por publicidad
❖ Daños informáticos
@tyc_es
51. Conclusiones
❖ Importancia del uso (personal/comercial) que se hará de los datos
escrapeados
❖ Los términos y condiciones deben leerse; muchas veces no supondrán
incumplimiento contractual pero sí pérdida de acceso al dato
❖ Se puede estar escrapeando una base de datos protegida por la propiedad
intelectual
❖ Mucho ojo cuando se extraen y gestionan datos de carácter personal, en
especial con el RGPD mediante
❖ No conviene escrapear datos públicos sin autorización
❖ El scraping no debe sobrecargar técnicamente los servicios y equipos de
quien lo sufre
@tyc_es