SlideShare ist ein Scribd-Unternehmen logo
1 von 46
Downloaden Sie, um offline zu lesen
Webspam
  Dirk Haun
www.geeklog.net
Geeklog, Spam & ich
• Geeklog:
  ‣ seit Januar 2002
  ‣ als Maintainer seit
    Anfang(?) 2004

• Spam-Problem:
  ‣ seit Mitte 2004
  ‣ Ende 2004: Poker-
    Spam
Agenda


• Was ist Webspam?
• Gegenmaßnahmen
• Aussichten
Arten von Webspam


• Kommentarspam
• Trackbackspam
• Referrerspam
• subtilere Formen
Kommentarspam


• Kommentare
• Forum
• Gästebuch
Very good site...

 Hi all!

 [url=...]100% Free Lesbian Video[/url]
 [url=...]Lesbian Teen[/url]
 [url=...]Asian Teen Lesbian[/url]
 [url=...]Mature Lesbian[/url]
 [url=...]Woman Naked Pussy Lesbian[/url]
 [url=...]Shemale Lesbian Sex Vidoes[/url]
 [url=...]Skinny Lesbian Girls Having Sex[/url]
 [url=...]Teen Blonde Lesbian[/url]
 [url=...]Twins Sisters Video Lesbian[/url]
 [url=...]xxx Free Lesbian Movie[/url]




Das Übliche eben ...
[url=.../index.html]underground sex[/url]
 [url=.../page=2.html]underlolitas[/url]
 [url=.../page=3.html]underpants[/url]
 [url=.../page=4.html]underwater erotica[/url]
 [url=.../page=5.html]underwater fucking[/url]
 [url=.../page=12.html]underwear models[/url]
 [url=.../page=13.html]undies[/url]
 [url=.../page=14.html]uniform porn[/url]
 [url=.../page=15.html]uniform sex[/url]
 [url=.../page=16.html]unique baby boys names
 [/url]
 [url=.../page=23.html]united airlines tickets
 flights[/url]
 [url=.../page=490.html]wellbutrin xl[/url]
 [url=.../page=491.html]wellness dog food[/url]



Ein Spam für alles
This Website contains sexually-oriented adult
  content which may include visual images and
  verbal descriptions of nude adults, adults
  engaging in sexual acts, and other audio and
  visual materials of a sexually-explicit nature.

  Permission to enter this Website and to view
  and download its contents is strictly limited
  only to consenting adults who affirm that the
  following conditions apply:

  1. That you are at least 18 years of age or
  older, and that you are voluntarily choosing
  to view and access such sexually-explicit (...)




Spam mit Disclaimer
Wikispam


• jeder kann Einträge
  ändern, also auch
  Spammer

• Spam oft in älteren
  Revisionen versteckt
Trackbackspam

• beliebte Funktion in
  Blogs: Site-
  übergreifende
  Kommentare

• XML-RPC, definiertes
  Protokoll

• ähnlich: Pingback
  (nur URL)
Referrerspam


• gefälschte Verweise
• in Blogs früher oft
  direkt angezeigt

• sonst eher unsichtbar
  im Webserver-Logfile
66.49.223.233 - - [02/Jun/2007:04:11:07 -0400] quot;GET /
forum/viewtopic.php?showtopic=73271 HTTP/1.1quot; 403 26
quot;http://www.kzcarinsurance.info/12868-71-0.htmlquot; quot;Mozilla/
4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot;

216.185.128.200 - - [02/Jun/2007:04:37:01 -0400] quot;GET /
forum/viewtopic.php?showtopic=21070 HTTP/1.1quot; 200
18384 quot;http://www.kzcarinsurance.info/38645-71-0.htmlquot;
quot;Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot;

66.49.223.233 - - [02/Jun/2007:05:02:14 -0400] quot;GET /
forum/viewtopic.php?showtopic=68994 HTTP/1.1quot; 403 26
quot;http://www.kzcarinsurance.info/62898-71-0.htmlquot; quot;Mozilla/
4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot;

216.185.128.200 - - [02/Jun/2007:09:00:23 -0400] quot;GET /
article.php/To-do_20050606 HTTP/1.1quot; 200 20169 quot;http://
www.kzcarinsurance.info/224400-71-0.htmlquot; quot;Mozilla/4.0
(compatible; MSIE 6.0; Windows NT 5.1)quot;




  Referrerspam
Subtilere Spamformen

• Profilspam
  ‣ Mitgliederliste in
    Foren

• vorgebliche On-Topic
  Beiträge

  ‣ Lob, Witze,
    harmlose Fragen
Stumbled onto geeklog.info for the
  first time today looks like
  someplace I needed to find a while
  ago.

  Just went from a slow dial up
  system to at DSL so I don't have
  to wait several minutes for a
  picture to arrive



Harmloses Posting ...
Stumbled onto geeklog.info for the first time today
 looks li[url=http://webmeds.iespana.es/amoxicilin]
 k[/url][url=http://webmeds.iespana.es/rogaine]e[/
 url] [url=http://webmeds.iespana.es/seroquel]s[/
 url][url=http://webmeds.iespana.es/oxycontin]o[/
 url][url=http://webmeds.iespana.es/oxycodone]m[/
 url][url=http://webmeds.iespana.es/viagra]e[/url]
 [url=http://webmeds.iespana.es/celebrix]p[/url]
 [url=http://webmeds.iespana.es/welbutrin]l[/url]
 [url=http://webmeds.iespana.es/stop-smoking]a[/
 url][url=http://webmeds.iespana.es/quit-smoking]c
 [/url][url=http://webmeds.iespana.es/skelaxin]e[/
 url] [url=http://webmeds.iespana.es/atenolol]I[/
 url] [url=http://webmeds.iespana.es/fluconazole]n[/
 url][url=http://webmeds.iespana.es/diflucan]e[/url]
 [url=http://webmeds.iespana.es/ciales]e[/url]
 [url=http://webmeds.iespana.es/xanex]d[/url]
 [url=http://webmeds.iespana.es/aciclovir]e[/url]

... oder auch nicht.
 [url=http://webmeds.iespana.es/adderol]d[/url]
Motivation


• Pagerank
• Clickthroughs
• Testspam
Pagerank


• kaum noch
  quot;Massenspamquot; für
  eine URL

• zeitintensiv
• Spam oft auf ältere
  Einträge
Clickthroughs
• Besucher auf eine Site
  locken

  ‣ Verkauf, Werbung,
    Partnerprogramm

• Wegwerfdomains
  ‣ Redirects
• Wegwerf-URLs
  ‣ alte Foren, etc.
Wofür wird gespammt?
                      24.-31.03.2007 (356 Spamposts)


    Pillen                                             137

      Sex                                      102

 Finanzen             23

 Software        13

 Ringtones       11

 Sonstiges                           70

             0                 50               100          150
Wofür wird gespammt?

                  Sonstiges
                    20%



   Pillen
    38%                Ringtones
                          3%
                        Software
                           4%
                       Finanzen
                          6%




            Sex
            29%
Vergleich: E-Mail-Spam


• Schlüsselwörter nicht
  quot;obfuscatedquot; (V14gr4)

• kein Aktienspam
  (Zeitfaktor)

• kein Bilderspam
Wie wird gespammt?
• Spambots
  ‣ gekaperte PCs oder
    Webserver

  ‣ Bulletproof Hosting
  ‣ offene Proxies
• manueller Spam:
  Einzelfälle

• Auftragsspam
I am amazed by the skills of some people here

#file=D:XRumerfreewebtown-general.txt




            Oops ...
I am amazed by the skills of some people here

 Hi..!! everyone!

 This is my first post on Yours site. Thank you in
 [url=http://www.freewebtown.com/topweb/louis-
 vuitton]a[/url](...)[url=http://
 www.freewebtown.com/topweb/credit-equity-home-
 line].[/url]
 I am From Canada
 Nice day is it today, but I have a question for all...

 In first , how i post message to PM...???

 Thank you very much!
 Mark. G..!!




... so war's gedacht
XRumer
I offer you the services in advertising in internet: (...)

  3. Forum spam.
  Opportunities of posting:
  - Registration at a forum with editing a profile of the user
  - Dispatch on the forums supporting a guest input
  - Notices on e-mail about answers at a forum or private messages
  - the Opportunity of registration without posting (increases PR Google)

  On the ending of dispatch you receive the report on the done work -
  direct references to your announcement.

  The prices for mass dispatch on forums:

  2)1000 forums - $35/1000
  3)4000-6000 forums - $33/1000
  4)7000-9000 forums - $31/1000
  5)10000-13000 forums - $30/1000
  5)20000 forums and more - $20/1000

  Total of Russian forums - 40.000
  Amount of English-speaking forums - 70.000




Wir spammen für Sie
Agenda


• Was ist Webspam?
• Gegenmaßnahmen
• Aussichten
IP-Adressen

• IP sperren
  ‣ dynamische IPs
  ‣ Bulletproof Hosting
• Speedlimit
  ‣ nur gegen einzelne
    IP-Adressen
Wortfilter


• erstaunlich effektiv      viagra
• Themen- und               xanax
  sprachenabhängig       specialist
• Vorsicht vor False        phentermine
  Positives                 tramadol
Moderation


• Zeitaufwendig
• volle Moderations-
  Queue

• Mischformen: erstes
  Posting moderieren
Registrierung
• nur angemeldete User
  dürfen posten

  ‣ und wieviele User
    schreckt man
    damit ab?

• OpenID
• Automatische
  Registrierung durch
  Bots
CAPTCHA
• Versuch, Mensch und
  Maschine zu
  unterscheiden

  ‣ nicht notwendiger-
    weise als Grafik!

• oft für Menschen ein
  Problem

• Wettrüsten
  ‣ PWNtcha
Blacklisten: manuell

• manuell verwaltet:
  zeitaufwendig

  ‣ MT-Blacklist (RIP)
  ‣ spam-merge
    ✴ MoinMoin,
       TWiki,
       MediaWiki
Blacklisten: automatisch

• dynamisch
• gehäuftes Auftreten
  von URLs

• zentralisiert
  ‣ Akismet
  ‣ SLV
Erkennen von Spambots

• Bad Behavior
  ‣ bekannte Bots
  ‣ HTTP-Requests
• Project Honeypot
  ‣ dynamische IP-
    Blacklist
Abuse-Reports


• Arbeits- und
  zeitaufwendig

• geringe Erfolgsrate
• fehlendes
  Bewusstsein seitens
  der Hoster und ISPs
rel=quot;nofollowquot;
• Links mit diesem
  Attribute werden
  nicht gewertet

• gemeinsame Initiative
  der großen
  Suchmaschinen

• als quot;Ende von
  Webspamquot; gefeiert

• hat genau gar nichts
  gebracht
Beispiel: Spam-X
• Spamfilter in Geeklog
• modular, erweiterbar
  ‣ neue Module für
     die neuen Tricks
     der Spammer

  ‣ neue Module für
     neue Services

• Nachteil: nur ja/nein-
  Entscheidung
Agenda


• Was ist Webspam?
• Gegenmaßnahmen
• Aussichten
R.I.P. - Erste Erfolge


• Trackbackspam
  ‣ durch technische
    Maßnahmen

• Referrerspam
  ‣ mangels Erfolg
Stand der Dinge
• ein Großteil kann
  leicht gefiltert werden

• der Rest macht aber
  zunehmend Probleme

  ‣ Gesamtmenge
    Spam nimmt zu

• eine gewisse Menge
  an Spam wird es
  immer geben
Lösungen?

• jedenfalls nicht
  CAPTCHA

  ‣ oder zumindest
     nicht als Grafiken

  ‣ Erkennen von
     Bilderspam in E-
     Mails wird helfen,
     CAPTCHAs zu
     knacken
Lösungen?

• Bayes-Filter?
  ‣ Wer will den
    trainieren?

• Benutzerfreundliche
  Lösungen gesucht!

• zentrale Systeme zu
  grobmaschig
Lösungen?

• Kooperation?
  ‣ nur in Ansätzen
  ‣ quot;Spam ist kein
     Problem (mehr)quot;

• Wo sind eigentlich die
  kommerziellen
  Anbieter?
Ressourcen

• Webspam allgemein
  ‣ spamhuntress.com
• Wiki-Spam
  ‣ chongqed.org
• (M)ein Blog
  ‣ spam.tinyweb.net
Credits

• Photos via flickr.com,
  thanks to: freezelight,
  Hopkinsii, striatic, chotda,
  lagiuspo, It'sGreg, lorZ, YnR,
  kevinthoule, acagamic, R80o
  (Mark Strozier), Kevin,
  loungerie, brappy!,
  ^Sandra^, longwayround,
  sheeshoo, Orgasmic kmlz,
  awinn233, teotwawki,
  Hugo*, rofanator, gyst,
  Gigglejuice, manuki




Tipp: Bilder und Stichwörter sind verlinkt!

Weitere ähnliche Inhalte

Mehr von Dirk Haun

Reverse Bildersuche mit TinEye
Reverse Bildersuche mit TinEyeReverse Bildersuche mit TinEye
Reverse Bildersuche mit TinEyeDirk Haun
 
Braindump - How to leave your Knowledge when leaving your Job
Braindump - How to leave your Knowledge when leaving your JobBraindump - How to leave your Knowledge when leaving your Job
Braindump - How to leave your Knowledge when leaving your JobDirk Haun
 
Vorsicht, Kamera!
Vorsicht, Kamera!Vorsicht, Kamera!
Vorsicht, Kamera!Dirk Haun
 
Vorsicht Kamera!
Vorsicht Kamera!Vorsicht Kamera!
Vorsicht Kamera!Dirk Haun
 
Botschaften optimieren für Erinnerung und Verbreitung
Botschaften optimieren für Erinnerung und VerbreitungBotschaften optimieren für Erinnerung und Verbreitung
Botschaften optimieren für Erinnerung und VerbreitungDirk Haun
 
Smile, you're on camera!
Smile, you're on camera!Smile, you're on camera!
Smile, you're on camera!Dirk Haun
 
What's our Status?
What's our Status?What's our Status?
What's our Status?Dirk Haun
 
What's our Status?
What's our Status?What's our Status?
What's our Status?Dirk Haun
 
Open Source is good for you
Open Source is good for youOpen Source is good for you
Open Source is good for youDirk Haun
 
Is C going the way of the Dodo?
Is C going the way of the Dodo?Is C going the way of the Dodo?
Is C going the way of the Dodo?Dirk Haun
 
Google Summer of Code 2012
Google Summer of Code 2012Google Summer of Code 2012
Google Summer of Code 2012Dirk Haun
 
Geeklog: The secure CMS.
Geeklog: The secure CMS.Geeklog: The secure CMS.
Geeklog: The secure CMS.Dirk Haun
 
Continuous Integration in der Praxis
Continuous Integration in der PraxisContinuous Integration in der Praxis
Continuous Integration in der PraxisDirk Haun
 
Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...
Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...
Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...Dirk Haun
 
Continuous Integration - Does it scale?
Continuous Integration - Does it scale?Continuous Integration - Does it scale?
Continuous Integration - Does it scale?Dirk Haun
 
Google Summer of Code 2011 (English)
Google Summer of Code 2011 (English)Google Summer of Code 2011 (English)
Google Summer of Code 2011 (English)Dirk Haun
 
Google Summer of Code 2011 (German)
Google Summer of Code 2011 (German)Google Summer of Code 2011 (German)
Google Summer of Code 2011 (German)Dirk Haun
 
Apple iPad als Reisebegleiter
Apple iPad als ReisebegleiterApple iPad als Reisebegleiter
Apple iPad als ReisebegleiterDirk Haun
 
Verteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der PraxisVerteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der PraxisDirk Haun
 
Verteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der PraxisVerteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der PraxisDirk Haun
 

Mehr von Dirk Haun (20)

Reverse Bildersuche mit TinEye
Reverse Bildersuche mit TinEyeReverse Bildersuche mit TinEye
Reverse Bildersuche mit TinEye
 
Braindump - How to leave your Knowledge when leaving your Job
Braindump - How to leave your Knowledge when leaving your JobBraindump - How to leave your Knowledge when leaving your Job
Braindump - How to leave your Knowledge when leaving your Job
 
Vorsicht, Kamera!
Vorsicht, Kamera!Vorsicht, Kamera!
Vorsicht, Kamera!
 
Vorsicht Kamera!
Vorsicht Kamera!Vorsicht Kamera!
Vorsicht Kamera!
 
Botschaften optimieren für Erinnerung und Verbreitung
Botschaften optimieren für Erinnerung und VerbreitungBotschaften optimieren für Erinnerung und Verbreitung
Botschaften optimieren für Erinnerung und Verbreitung
 
Smile, you're on camera!
Smile, you're on camera!Smile, you're on camera!
Smile, you're on camera!
 
What's our Status?
What's our Status?What's our Status?
What's our Status?
 
What's our Status?
What's our Status?What's our Status?
What's our Status?
 
Open Source is good for you
Open Source is good for youOpen Source is good for you
Open Source is good for you
 
Is C going the way of the Dodo?
Is C going the way of the Dodo?Is C going the way of the Dodo?
Is C going the way of the Dodo?
 
Google Summer of Code 2012
Google Summer of Code 2012Google Summer of Code 2012
Google Summer of Code 2012
 
Geeklog: The secure CMS.
Geeklog: The secure CMS.Geeklog: The secure CMS.
Geeklog: The secure CMS.
 
Continuous Integration in der Praxis
Continuous Integration in der PraxisContinuous Integration in der Praxis
Continuous Integration in der Praxis
 
Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...
Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...
Google Summer of Code: Neue Mitstreiter mit Geld (und T-Shirts) gewinnen - kl...
 
Continuous Integration - Does it scale?
Continuous Integration - Does it scale?Continuous Integration - Does it scale?
Continuous Integration - Does it scale?
 
Google Summer of Code 2011 (English)
Google Summer of Code 2011 (English)Google Summer of Code 2011 (English)
Google Summer of Code 2011 (English)
 
Google Summer of Code 2011 (German)
Google Summer of Code 2011 (German)Google Summer of Code 2011 (German)
Google Summer of Code 2011 (German)
 
Apple iPad als Reisebegleiter
Apple iPad als ReisebegleiterApple iPad als Reisebegleiter
Apple iPad als Reisebegleiter
 
Verteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der PraxisVerteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der Praxis
 
Verteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der PraxisVerteilte Versionskontrolle in der Praxis
Verteilte Versionskontrolle in der Praxis
 

Webspam (German Version)

  • 1. Webspam Dirk Haun www.geeklog.net
  • 2. Geeklog, Spam & ich • Geeklog: ‣ seit Januar 2002 ‣ als Maintainer seit Anfang(?) 2004 • Spam-Problem: ‣ seit Mitte 2004 ‣ Ende 2004: Poker- Spam
  • 3. Agenda • Was ist Webspam? • Gegenmaßnahmen • Aussichten
  • 4. Arten von Webspam • Kommentarspam • Trackbackspam • Referrerspam • subtilere Formen
  • 6. Very good site... Hi all! [url=...]100% Free Lesbian Video[/url] [url=...]Lesbian Teen[/url] [url=...]Asian Teen Lesbian[/url] [url=...]Mature Lesbian[/url] [url=...]Woman Naked Pussy Lesbian[/url] [url=...]Shemale Lesbian Sex Vidoes[/url] [url=...]Skinny Lesbian Girls Having Sex[/url] [url=...]Teen Blonde Lesbian[/url] [url=...]Twins Sisters Video Lesbian[/url] [url=...]xxx Free Lesbian Movie[/url] Das Übliche eben ...
  • 7. [url=.../index.html]underground sex[/url] [url=.../page=2.html]underlolitas[/url] [url=.../page=3.html]underpants[/url] [url=.../page=4.html]underwater erotica[/url] [url=.../page=5.html]underwater fucking[/url] [url=.../page=12.html]underwear models[/url] [url=.../page=13.html]undies[/url] [url=.../page=14.html]uniform porn[/url] [url=.../page=15.html]uniform sex[/url] [url=.../page=16.html]unique baby boys names [/url] [url=.../page=23.html]united airlines tickets flights[/url] [url=.../page=490.html]wellbutrin xl[/url] [url=.../page=491.html]wellness dog food[/url] Ein Spam für alles
  • 8. This Website contains sexually-oriented adult content which may include visual images and verbal descriptions of nude adults, adults engaging in sexual acts, and other audio and visual materials of a sexually-explicit nature. Permission to enter this Website and to view and download its contents is strictly limited only to consenting adults who affirm that the following conditions apply: 1. That you are at least 18 years of age or older, and that you are voluntarily choosing to view and access such sexually-explicit (...) Spam mit Disclaimer
  • 9. Wikispam • jeder kann Einträge ändern, also auch Spammer • Spam oft in älteren Revisionen versteckt
  • 10. Trackbackspam • beliebte Funktion in Blogs: Site- übergreifende Kommentare • XML-RPC, definiertes Protokoll • ähnlich: Pingback (nur URL)
  • 11. Referrerspam • gefälschte Verweise • in Blogs früher oft direkt angezeigt • sonst eher unsichtbar im Webserver-Logfile
  • 12. 66.49.223.233 - - [02/Jun/2007:04:11:07 -0400] quot;GET / forum/viewtopic.php?showtopic=73271 HTTP/1.1quot; 403 26 quot;http://www.kzcarinsurance.info/12868-71-0.htmlquot; quot;Mozilla/ 4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot; 216.185.128.200 - - [02/Jun/2007:04:37:01 -0400] quot;GET / forum/viewtopic.php?showtopic=21070 HTTP/1.1quot; 200 18384 quot;http://www.kzcarinsurance.info/38645-71-0.htmlquot; quot;Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot; 66.49.223.233 - - [02/Jun/2007:05:02:14 -0400] quot;GET / forum/viewtopic.php?showtopic=68994 HTTP/1.1quot; 403 26 quot;http://www.kzcarinsurance.info/62898-71-0.htmlquot; quot;Mozilla/ 4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot; 216.185.128.200 - - [02/Jun/2007:09:00:23 -0400] quot;GET / article.php/To-do_20050606 HTTP/1.1quot; 200 20169 quot;http:// www.kzcarinsurance.info/224400-71-0.htmlquot; quot;Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)quot; Referrerspam
  • 13. Subtilere Spamformen • Profilspam ‣ Mitgliederliste in Foren • vorgebliche On-Topic Beiträge ‣ Lob, Witze, harmlose Fragen
  • 14. Stumbled onto geeklog.info for the first time today looks like someplace I needed to find a while ago. Just went from a slow dial up system to at DSL so I don't have to wait several minutes for a picture to arrive Harmloses Posting ...
  • 15. Stumbled onto geeklog.info for the first time today looks li[url=http://webmeds.iespana.es/amoxicilin] k[/url][url=http://webmeds.iespana.es/rogaine]e[/ url] [url=http://webmeds.iespana.es/seroquel]s[/ url][url=http://webmeds.iespana.es/oxycontin]o[/ url][url=http://webmeds.iespana.es/oxycodone]m[/ url][url=http://webmeds.iespana.es/viagra]e[/url] [url=http://webmeds.iespana.es/celebrix]p[/url] [url=http://webmeds.iespana.es/welbutrin]l[/url] [url=http://webmeds.iespana.es/stop-smoking]a[/ url][url=http://webmeds.iespana.es/quit-smoking]c [/url][url=http://webmeds.iespana.es/skelaxin]e[/ url] [url=http://webmeds.iespana.es/atenolol]I[/ url] [url=http://webmeds.iespana.es/fluconazole]n[/ url][url=http://webmeds.iespana.es/diflucan]e[/url] [url=http://webmeds.iespana.es/ciales]e[/url] [url=http://webmeds.iespana.es/xanex]d[/url] [url=http://webmeds.iespana.es/aciclovir]e[/url] ... oder auch nicht. [url=http://webmeds.iespana.es/adderol]d[/url]
  • 17. Pagerank • kaum noch quot;Massenspamquot; für eine URL • zeitintensiv • Spam oft auf ältere Einträge
  • 18. Clickthroughs • Besucher auf eine Site locken ‣ Verkauf, Werbung, Partnerprogramm • Wegwerfdomains ‣ Redirects • Wegwerf-URLs ‣ alte Foren, etc.
  • 19. Wofür wird gespammt? 24.-31.03.2007 (356 Spamposts) Pillen 137 Sex 102 Finanzen 23 Software 13 Ringtones 11 Sonstiges 70 0 50 100 150
  • 20. Wofür wird gespammt? Sonstiges 20% Pillen 38% Ringtones 3% Software 4% Finanzen 6% Sex 29%
  • 21. Vergleich: E-Mail-Spam • Schlüsselwörter nicht quot;obfuscatedquot; (V14gr4) • kein Aktienspam (Zeitfaktor) • kein Bilderspam
  • 22. Wie wird gespammt? • Spambots ‣ gekaperte PCs oder Webserver ‣ Bulletproof Hosting ‣ offene Proxies • manueller Spam: Einzelfälle • Auftragsspam
  • 23. I am amazed by the skills of some people here #file=D:XRumerfreewebtown-general.txt Oops ...
  • 24. I am amazed by the skills of some people here Hi..!! everyone! This is my first post on Yours site. Thank you in [url=http://www.freewebtown.com/topweb/louis- vuitton]a[/url](...)[url=http:// www.freewebtown.com/topweb/credit-equity-home- line].[/url] I am From Canada Nice day is it today, but I have a question for all... In first , how i post message to PM...??? Thank you very much! Mark. G..!! ... so war's gedacht
  • 26. I offer you the services in advertising in internet: (...) 3. Forum spam. Opportunities of posting: - Registration at a forum with editing a profile of the user - Dispatch on the forums supporting a guest input - Notices on e-mail about answers at a forum or private messages - the Opportunity of registration without posting (increases PR Google) On the ending of dispatch you receive the report on the done work - direct references to your announcement. The prices for mass dispatch on forums: 2)1000 forums - $35/1000 3)4000-6000 forums - $33/1000 4)7000-9000 forums - $31/1000 5)10000-13000 forums - $30/1000 5)20000 forums and more - $20/1000 Total of Russian forums - 40.000 Amount of English-speaking forums - 70.000 Wir spammen für Sie
  • 27. Agenda • Was ist Webspam? • Gegenmaßnahmen • Aussichten
  • 28. IP-Adressen • IP sperren ‣ dynamische IPs ‣ Bulletproof Hosting • Speedlimit ‣ nur gegen einzelne IP-Adressen
  • 29. Wortfilter • erstaunlich effektiv viagra • Themen- und xanax sprachenabhängig specialist • Vorsicht vor False phentermine Positives tramadol
  • 30. Moderation • Zeitaufwendig • volle Moderations- Queue • Mischformen: erstes Posting moderieren
  • 31. Registrierung • nur angemeldete User dürfen posten ‣ und wieviele User schreckt man damit ab? • OpenID • Automatische Registrierung durch Bots
  • 32. CAPTCHA • Versuch, Mensch und Maschine zu unterscheiden ‣ nicht notwendiger- weise als Grafik! • oft für Menschen ein Problem • Wettrüsten ‣ PWNtcha
  • 33. Blacklisten: manuell • manuell verwaltet: zeitaufwendig ‣ MT-Blacklist (RIP) ‣ spam-merge ✴ MoinMoin, TWiki, MediaWiki
  • 34. Blacklisten: automatisch • dynamisch • gehäuftes Auftreten von URLs • zentralisiert ‣ Akismet ‣ SLV
  • 35. Erkennen von Spambots • Bad Behavior ‣ bekannte Bots ‣ HTTP-Requests • Project Honeypot ‣ dynamische IP- Blacklist
  • 36. Abuse-Reports • Arbeits- und zeitaufwendig • geringe Erfolgsrate • fehlendes Bewusstsein seitens der Hoster und ISPs
  • 37. rel=quot;nofollowquot; • Links mit diesem Attribute werden nicht gewertet • gemeinsame Initiative der großen Suchmaschinen • als quot;Ende von Webspamquot; gefeiert • hat genau gar nichts gebracht
  • 38. Beispiel: Spam-X • Spamfilter in Geeklog • modular, erweiterbar ‣ neue Module für die neuen Tricks der Spammer ‣ neue Module für neue Services • Nachteil: nur ja/nein- Entscheidung
  • 39. Agenda • Was ist Webspam? • Gegenmaßnahmen • Aussichten
  • 40. R.I.P. - Erste Erfolge • Trackbackspam ‣ durch technische Maßnahmen • Referrerspam ‣ mangels Erfolg
  • 41. Stand der Dinge • ein Großteil kann leicht gefiltert werden • der Rest macht aber zunehmend Probleme ‣ Gesamtmenge Spam nimmt zu • eine gewisse Menge an Spam wird es immer geben
  • 42. Lösungen? • jedenfalls nicht CAPTCHA ‣ oder zumindest nicht als Grafiken ‣ Erkennen von Bilderspam in E- Mails wird helfen, CAPTCHAs zu knacken
  • 43. Lösungen? • Bayes-Filter? ‣ Wer will den trainieren? • Benutzerfreundliche Lösungen gesucht! • zentrale Systeme zu grobmaschig
  • 44. Lösungen? • Kooperation? ‣ nur in Ansätzen ‣ quot;Spam ist kein Problem (mehr)quot; • Wo sind eigentlich die kommerziellen Anbieter?
  • 45. Ressourcen • Webspam allgemein ‣ spamhuntress.com • Wiki-Spam ‣ chongqed.org • (M)ein Blog ‣ spam.tinyweb.net
  • 46. Credits • Photos via flickr.com, thanks to: freezelight, Hopkinsii, striatic, chotda, lagiuspo, It'sGreg, lorZ, YnR, kevinthoule, acagamic, R80o (Mark Strozier), Kevin, loungerie, brappy!, ^Sandra^, longwayround, sheeshoo, Orgasmic kmlz, awinn233, teotwawki, Hugo*, rofanator, gyst, Gigglejuice, manuki Tipp: Bilder und Stichwörter sind verlinkt!