Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Fernando Puente
Fernando PuenteCOO/IT Consultant um Embajador de marca de Raiola Networks
Protege a tu rey
Defiende tu contenido de amenazas,
scraping, IA o malos actores
FERNANDO PUENTE
Content is King
“El contenido es de donde espero que se
obtenga el dinero real en Internet”
Bill Gates (January 3, 1996)
Fernando Puente
Informático de vocación y de profesión, formador ocasional
y un enamorado de comer y beber.
● Embajador de marca de Raiola Networks
● Profesor Curso Superior de Periodismo Deportivo
● Consultor especializado en Web Performance
@fpuenteonline
linkedin.com/in/fpuente/
Protegiendo el contenido
Solución
Legal y sencilla
Detallar en los términos y
condiciones de uso las
Condiciones Generales y las
responsabilidades derivadas del
acceso y la utilización de sus
contenidos
Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos
son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de
explotación de los mismos en cualquier forma y en especial, los derechos de reproducción,
distribución, comunicación pública y transformación, de acuerdo con la legislación española y de
la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo
relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por
terceros), que habilita a un uso personal y no comercial de la propia información por parte de
los Usuarios.
TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su
caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros.
Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación
pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o
modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera
reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines
comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así
mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de
imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la
técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las
responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la
LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a
terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad
informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede
licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual
y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente,
con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o
modificación de los contenidos y de cualquier otro elemento.
Protege tu contenido de
visitantes
Humanos
Deshabilitar menú contextual (click derecho)
* Usuarios avanzados pueden acceder al contenido
* Posibilidad de usar plugins del repositorio
Deshabilitar selección de texto
* Usuarios avanzados pueden acceder al contenido
Estrategias de protección adicional
● Marcas de agua y/o copyright en contenido multimedia
● Metadatos en imágenes
● Muro de pago/Paywall
● Registro de usuario o modelo freemium
● Generar el contenido dinámicamente (Javascript)
● Acceso condicional al contenido (restringir por usuario,
zona geográfica o número de visitas/páginas)
* SEO y UX pueden verse afectados de manera importante
* Metadatos y marcas de agua pueden ser eliminadas
Protección ante traducciones de la página
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protección ante traducciones de elementos
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protege tu contenido de
visitantes
No solo SEOcotillas
Qué buscan las herramientas SEO
● Enlazado interno/externo
● Estructura web
● Palabras clave
● Datos sensibles o de negocio
● Contenido
Protección anti-competencia
● Eliminar feeds de contenido/Crear feeds incompletos
● Bloquear/moderar comentarios
● Marcas de agua en imágenes
● Habilitar la protección de hotlink
● Deshabilitar incrustado como iframe
* Hotlink puede afectar al contenido compartido en medios fuera de la web
Bloquear competencia (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Reforzar la seguridad de tu sitio
● Proveedor de hosting de confianza
● Certificado de seguridad
● WordPress y componentes actualizados
● Capas adicionales de seguridad (plugin, WAF, htaccess…)
● Política de roles, usuarios y contraseñas
● Entornos de test y producción (actualizaciones y cambios)
● En general, buenas prácticas
En último caso
● Publicar un aviso de eliminación DMCA (Digital
Millennium Copyright Act)
● Solicitar retirada de contenido por infracciones de derechos
de autor en buscadores
Protege tu contenido de
enlaces dañinos
Disavow links
Desautorizar enlaces
1. Identificar (fraudulentos, artificiales o de baja calidad)
2. Crear lista de enlaces a desautorizar
3. Subir lista por buscador:
https://search.google.com/search-console/disavow-links
Protege tu contenido de
visitantes
No humanos
Estrategias anti-scraping
● Reglas específicas en archivo robots.txt
● Filtrar user-agent
● Bloquear servidores por IP
● Añadir Completely Automated Public Turing test to
tell Computers and Humans Apart (aka CAPTCHA)
● Colocar «honeypots»
● Desativar feed
● Bloquear REST API
Proteger el sitio de scrapeadores (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Desactivar el feed
Proteger acceso a WordPress REST API
Protege tu contenido de
redes sociales
Difusión
Proteger cómo compartir el contenido
● Marcas de agua y/o copyright en contenido multimedia
● Metadata y etiquetas Open Graph falsas
● Bloqueo, contenido erróneo o redirección para bots
(facebookexternalhit, Twitterbot, TelegramBot,
LinkedInBot…)
* SEO puede verse afectado de manera importante
Protege tu contenido de
motores de búsqueda
Invisibilidad
Proteger el sitio de ser rastreado e indexado
* Cualquier contenido, no solo HTML
Proteger el sitio de ser indexado
* Solo HTML
Proteger cada página de ser almacenada
* Solo HTML
* Aplica a la caché de Google
Protege tu contenido de la
Inteligencia Artificial
Base de conocimiento
Proteger del entrenamiento
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
varios modelos LLM utilizando Common Crawl)
* Puede cambiar en el futuro
Proteger del entrenamiento (nuevo)
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
OpenAI’s web crawler)
* https://platform.openai.com/docs/gptbot (agosto/2023)
Proteger del acceso
* Sólo usado por los plugins de ChatGPT para acceso (live query), no
entrenamiento
* Puede cambiar en el futuro
¿La mejor defensa es un
buen ataque?
Gracias
1 von 38

Recomendados

Redes sociales nov. 2011 [tanoira cassagne] von
Redes sociales nov. 2011  [tanoira cassagne]Redes sociales nov. 2011  [tanoira cassagne]
Redes sociales nov. 2011 [tanoira cassagne]juanpozzo
517 views36 Folien
Contenidos creados por usuarios en Redes Sociales. Cuestiones Jurídicas von
Contenidos creados por usuarios en Redes Sociales. Cuestiones JurídicasContenidos creados por usuarios en Redes Sociales. Cuestiones Jurídicas
Contenidos creados por usuarios en Redes Sociales. Cuestiones JurídicasJesús Martín Calvo
335 views12 Folien
Derechos de los usuarios de redes sociales von
Derechos de los usuarios de redes socialesDerechos de los usuarios de redes sociales
Derechos de los usuarios de redes socialesAbanlex
504 views12 Folien
Privacidad en Internet von
Privacidad en InternetPrivacidad en Internet
Privacidad en InternetJose Manuel Ortega Candel
181 views3 Folien
Clase 4 tecno i- 2019 von
Clase 4  tecno i- 2019Clase 4  tecno i- 2019
Clase 4 tecno i- 2019Viviana Mercedes Ponce
845 views60 Folien
Clase 4 tecno i- 2018 von
Clase 4  tecno i- 2018Clase 4  tecno i- 2018
Clase 4 tecno i- 2018Viviana Mercedes Ponce
466 views54 Folien

Más contenido relacionado

Similar a Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Que es la ley sopa von
Que es la ley sopaQue es la ley sopa
Que es la ley sopagero31
85 views1 Folie
Aviso Legal von
Aviso LegalAviso Legal
Aviso Legalaurapark
172 views8 Folien
Comunicación Web y Social Media von
Comunicación Web y Social MediaComunicación Web y Social Media
Comunicación Web y Social MediaLucila Voces de Barro
160 views22 Folien
Terminos y condiciones de uso von
Terminos y condiciones de usoTerminos y condiciones de uso
Terminos y condiciones de usoPortal Educativo Colombia Aprende
214 views6 Folien
Banner von
BannerBanner
BannerLeiidy Siierra Torres
121 views7 Folien
Web 2.0 von
Web 2.0Web 2.0
Web 2.0Angelica Mendoza
193 views4 Folien

Similar a Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores(20)

Que es la ley sopa von gero31
Que es la ley sopaQue es la ley sopa
Que es la ley sopa
gero3185 views
Aviso Legal von aurapark
Aviso LegalAviso Legal
Aviso Legal
aurapark172 views
El derecho a la privacidad del usuario en relación a las políticas de uso von Software Guru
 El derecho a la privacidad del usuario en relación a las políticas de uso El derecho a la privacidad del usuario en relación a las políticas de uso
El derecho a la privacidad del usuario en relación a las políticas de uso
Software Guru673 views
Blogueras Barcelona Aspectos Legales von AvaticAbogados
Blogueras Barcelona Aspectos LegalesBlogueras Barcelona Aspectos Legales
Blogueras Barcelona Aspectos Legales
AvaticAbogados606 views
propuesta tecica y economica.pdf von jorge977764
propuesta tecica y economica.pdfpropuesta tecica y economica.pdf
propuesta tecica y economica.pdf
jorge977764136 views
Taller SEO. Asier Barainka von andalucialab
Taller SEO. Asier BarainkaTaller SEO. Asier Barainka
Taller SEO. Asier Barainka
andalucialab469 views

Más de Fernando Puente

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto… von
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…Fernando Puente
57 views21 Folien
Qué es y para que sirve la carga condicional von
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicionalFernando Puente
41 views33 Folien
Optimiza tus webs a bajo costo - WCVenezuela2021 von
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021Fernando Puente
104 views20 Folien
WordPress y cómo llegar al 50% de Internet von
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de InternetFernando Puente
79 views30 Folien
Mitos y realidades sobre el WPO en WordPress von
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPressFernando Puente
285 views35 Folien
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress von
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressFernando Puente
371 views41 Folien

Más de Fernando Puente(20)

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto… von Fernando Puente
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
Fernando Puente57 views
Qué es y para que sirve la carga condicional von Fernando Puente
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicional
Fernando Puente41 views
Optimiza tus webs a bajo costo - WCVenezuela2021 von Fernando Puente
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021
Fernando Puente104 views
WordPress y cómo llegar al 50% de Internet von Fernando Puente
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de Internet
Fernando Puente79 views
Mitos y realidades sobre el WPO en WordPress von Fernando Puente
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPress
Fernando Puente285 views
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress von Fernando Puente
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
Fernando Puente371 views
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019 von Fernando Puente
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
Fernando Puente129 views
Tipologías de migración - WordCamp Valencia 2019 von Fernando Puente
Tipologías de migración - WordCamp Valencia 2019Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019
Fernando Puente472 views
Básicos para medir tu web - Taller de iniciación von Fernando Puente
Básicos para medir tu web - Taller de iniciaciónBásicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciación
Fernando Puente136 views
Primeros pasos con WPO: aprende a analizar tu web - Taller von Fernando Puente
Primeros pasos con WPO: aprende a analizar tu web - TallerPrimeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - Taller
Fernando Puente252 views
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos! von Fernando Puente
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Fernando Puente446 views
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ... von Fernando Puente
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
Fernando Puente827 views
Retos de WordPress para llegar al 50% de Internet von Fernando Puente
Retos de WordPress para llegar al 50% de Internet Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet
Fernando Puente563 views
Taller WPO - Carga condicional de plugins von Fernando Puente
Taller WPO - Carga condicional de pluginsTaller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de plugins
Fernando Puente66.2K views
Extender la funcionalidad de WordPress von Fernando Puente
Extender la funcionalidad de WordPressExtender la funcionalidad de WordPress
Extender la funcionalidad de WordPress
Fernando Puente319 views
Niveles de escalado para WordPress von Fernando Puente
Niveles de escalado para WordPressNiveles de escalado para WordPress
Niveles de escalado para WordPress
Fernando Puente277 views
WordPress - Oportunidades laborales von Fernando Puente
WordPress - Oportunidades laboralesWordPress - Oportunidades laborales
WordPress - Oportunidades laborales
Fernando Puente239 views

Último

asistente administrativo.pptx von
asistente administrativo.pptxasistente administrativo.pptx
asistente administrativo.pptxariadnefj02
5 views7 Folien
El Mal Uso Del Internet.pptx von
El Mal Uso Del Internet.pptxEl Mal Uso Del Internet.pptx
El Mal Uso Del Internet.pptxjeshuahernandezbuelv
10 views3 Folien
ANALISIS FICHA 1 Y FICHA 2 (2).pdf von
ANALISIS FICHA 1 Y FICHA 2 (2).pdfANALISIS FICHA 1 Y FICHA 2 (2).pdf
ANALISIS FICHA 1 Y FICHA 2 (2).pdfLauraSofiaCardonaSol
6 views16 Folien
trabajo de investigacion de formatos.docx von
trabajo de investigacion de formatos.docxtrabajo de investigacion de formatos.docx
trabajo de investigacion de formatos.docxariadnefj02
5 views12 Folien
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf von
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdfRECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdfKaterinGL
6 views14 Folien
CICLO DE VIDA DE UN DOCUMENTO.docx von
CICLO DE VIDA DE UN DOCUMENTO.docxCICLO DE VIDA DE UN DOCUMENTO.docx
CICLO DE VIDA DE UN DOCUMENTO.docxMarianaDelRocioAlvan
5 views5 Folien

Último(20)

asistente administrativo.pptx von ariadnefj02
asistente administrativo.pptxasistente administrativo.pptx
asistente administrativo.pptx
ariadnefj025 views
trabajo de investigacion de formatos.docx von ariadnefj02
trabajo de investigacion de formatos.docxtrabajo de investigacion de formatos.docx
trabajo de investigacion de formatos.docx
ariadnefj025 views
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf von KaterinGL
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdfRECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf
KaterinGL6 views
EXPRESIONES ALGEBRAICAS.pptx von durannakay7
EXPRESIONES ALGEBRAICAS.pptxEXPRESIONES ALGEBRAICAS.pptx
EXPRESIONES ALGEBRAICAS.pptx
durannakay710 views
El Mejor Buscador en la Web del Mundo.pdf von gfmb504
El Mejor Buscador en la Web del Mundo.pdfEl Mejor Buscador en la Web del Mundo.pdf
El Mejor Buscador en la Web del Mundo.pdf
gfmb5047 views
El internet de las cosas.pptx von canek4
El internet de las cosas.pptxEl internet de las cosas.pptx
El internet de las cosas.pptx
canek45 views
textoargumentativosobrelabasura-230327011758-bd48ae2d.docx von LauraSofiaCardonaSol
textoargumentativosobrelabasura-230327011758-bd48ae2d.docxtextoargumentativosobrelabasura-230327011758-bd48ae2d.docx
textoargumentativosobrelabasura-230327011758-bd48ae2d.docx
SALETHE ROMINA MINAYA CADILLO.pdf von 73027547
SALETHE ROMINA MINAYA CADILLO.pdfSALETHE ROMINA MINAYA CADILLO.pdf
SALETHE ROMINA MINAYA CADILLO.pdf
730275476 views

Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

  • 1. Protege a tu rey Defiende tu contenido de amenazas, scraping, IA o malos actores FERNANDO PUENTE
  • 2. Content is King “El contenido es de donde espero que se obtenga el dinero real en Internet” Bill Gates (January 3, 1996)
  • 3. Fernando Puente Informático de vocación y de profesión, formador ocasional y un enamorado de comer y beber. ● Embajador de marca de Raiola Networks ● Profesor Curso Superior de Periodismo Deportivo ● Consultor especializado en Web Performance @fpuenteonline linkedin.com/in/fpuente/
  • 6. Detallar en los términos y condiciones de uso las Condiciones Generales y las responsabilidades derivadas del acceso y la utilización de sus contenidos
  • 7. Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de explotación de los mismos en cualquier forma y en especial, los derechos de reproducción, distribución, comunicación pública y transformación, de acuerdo con la legislación española y de la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por terceros), que habilita a un uso personal y no comercial de la propia información por parte de los Usuarios. TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros. Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente, con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o modificación de los contenidos y de cualquier otro elemento.
  • 8. Protege tu contenido de visitantes Humanos
  • 9. Deshabilitar menú contextual (click derecho) * Usuarios avanzados pueden acceder al contenido * Posibilidad de usar plugins del repositorio
  • 10. Deshabilitar selección de texto * Usuarios avanzados pueden acceder al contenido
  • 11. Estrategias de protección adicional ● Marcas de agua y/o copyright en contenido multimedia ● Metadatos en imágenes ● Muro de pago/Paywall ● Registro de usuario o modelo freemium ● Generar el contenido dinámicamente (Javascript) ● Acceso condicional al contenido (restringir por usuario, zona geográfica o número de visitas/páginas) * SEO y UX pueden verse afectados de manera importante * Metadatos y marcas de agua pueden ser eliminadas
  • 12. Protección ante traducciones de la página * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 13. Protección ante traducciones de elementos * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 14. Protege tu contenido de visitantes No solo SEOcotillas
  • 15. Qué buscan las herramientas SEO ● Enlazado interno/externo ● Estructura web ● Palabras clave ● Datos sensibles o de negocio ● Contenido
  • 16. Protección anti-competencia ● Eliminar feeds de contenido/Crear feeds incompletos ● Bloquear/moderar comentarios ● Marcas de agua en imágenes ● Habilitar la protección de hotlink ● Deshabilitar incrustado como iframe * Hotlink puede afectar al contenido compartido en medios fuera de la web
  • 17. Bloquear competencia (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 18. Reforzar la seguridad de tu sitio ● Proveedor de hosting de confianza ● Certificado de seguridad ● WordPress y componentes actualizados ● Capas adicionales de seguridad (plugin, WAF, htaccess…) ● Política de roles, usuarios y contraseñas ● Entornos de test y producción (actualizaciones y cambios) ● En general, buenas prácticas
  • 19. En último caso ● Publicar un aviso de eliminación DMCA (Digital Millennium Copyright Act) ● Solicitar retirada de contenido por infracciones de derechos de autor en buscadores
  • 20. Protege tu contenido de enlaces dañinos Disavow links
  • 21. Desautorizar enlaces 1. Identificar (fraudulentos, artificiales o de baja calidad) 2. Crear lista de enlaces a desautorizar 3. Subir lista por buscador: https://search.google.com/search-console/disavow-links
  • 22. Protege tu contenido de visitantes No humanos
  • 23. Estrategias anti-scraping ● Reglas específicas en archivo robots.txt ● Filtrar user-agent ● Bloquear servidores por IP ● Añadir Completely Automated Public Turing test to tell Computers and Humans Apart (aka CAPTCHA) ● Colocar «honeypots» ● Desativar feed ● Bloquear REST API
  • 24. Proteger el sitio de scrapeadores (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 26. Proteger acceso a WordPress REST API
  • 27. Protege tu contenido de redes sociales Difusión
  • 28. Proteger cómo compartir el contenido ● Marcas de agua y/o copyright en contenido multimedia ● Metadata y etiquetas Open Graph falsas ● Bloqueo, contenido erróneo o redirección para bots (facebookexternalhit, Twitterbot, TelegramBot, LinkedInBot…) * SEO puede verse afectado de manera importante
  • 29. Protege tu contenido de motores de búsqueda Invisibilidad
  • 30. Proteger el sitio de ser rastreado e indexado * Cualquier contenido, no solo HTML
  • 31. Proteger el sitio de ser indexado * Solo HTML
  • 32. Proteger cada página de ser almacenada * Solo HTML * Aplica a la caché de Google
  • 33. Protege tu contenido de la Inteligencia Artificial Base de conocimiento
  • 34. Proteger del entrenamiento * No funciona en todos los modelos de entrenamiento (ejemplo basado en varios modelos LLM utilizando Common Crawl) * Puede cambiar en el futuro
  • 35. Proteger del entrenamiento (nuevo) * No funciona en todos los modelos de entrenamiento (ejemplo basado en OpenAI’s web crawler) * https://platform.openai.com/docs/gptbot (agosto/2023)
  • 36. Proteger del acceso * Sólo usado por los plugins de ChatGPT para acceso (live query), no entrenamiento * Puede cambiar en el futuro
  • 37. ¿La mejor defensa es un buen ataque?