#Moca 12 - #fail - was beim monitoring regelmäßig schief läuft
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

#Moca 12 - #fail - was beim monitoring regelmäßig schief läuft

am

  • 2,201 Views

Vortrag auf dem Monitoringcamp 2012 in Hamburg am 09.11.2012

Vortrag auf dem Monitoringcamp 2012 in Hamburg am 09.11.2012

Statistiken

Views

Gesamtviews
2,201
Views auf SlideShare
1,667
Views einbetten
534

Actions

Gefällt mir
10
Downloads
14
Kommentare
0

7 Einbettungen 534

http://kommunikation-zweinull.de 236
http://www.3c-blog.de 145
http://www.scoop.it 120
https://twitter.com 11
http://3c-dialog.de 11
http://www.mentormob.com 9
http://www.lessonpaths.com 2
Mehr ...

Zugänglichkeit

Kategorien

Details hochladen

Uploaded via as Adobe PDF

Benutzerrechte

© Alle Rechte vorbehalten

Report content

Als unangemessen gemeldet Als unangemessen melden
Als unangemessen melden

Wählen Sie Ihren Grund, warum Sie diese Präsentation als unangemessen melden.

Löschen
  • Full Name Full Name Comment goes here.
    Sind Sie sicher, dass Sie...
    Ihre Nachricht erscheint hier
    Processing...
Kommentar posten
Kommentar bearbeiten

#Moca 12 - #fail - was beim monitoring regelmäßig schief läuft Presentation Transcript

  • 1. #Fail - Was beim Monitoring verlässlich schief geht & wo noch Hoffnung bestehtPatrick BunkGründertwitter.com/uberMetrics Tel: 030-609857500facebook.com/uberMetrics Patrick.Bunk@uberMetrics-Technologies.com
  • 2. uberUns§  Spin-Off der Humboldt-Universität zu Berlin§  15 Mitarbeiter (11 Entwickler 4 Rest)§  Kernkompetenzen: §  Entwicklung hochskalierbarer Text-Mining-Plattform §  Entwicklung von Algorithmen zur automatischen Strukturierung von Nachrichten uberMetrics Technologies GmbH, Rosenthaler Str. 34/35, 10178 Berlin, contact@ubermetrics.com, +49 30 609857500, Twitter: @ubermetrics
  • 3. #Fail/Sources/" Warum findet ihr das nicht?§  Social Networks (Facebook, G+, Ning, XING, LinkedIn)§  Blogs (Blogger, LiveJournal, Wordpress, etc)§  Microblogs (Twitter, Tumblr)§  Foren (4chan, gulli.com, reddit, xda-developers)§  Verbraucherportale (dooyoo, ciao, qype, gutefrage)§  Video (youtube, vimeo, sevenload, clipfish)§  Foto (flickr, 500px, photobucket, SmugMug)§  News (SpiegelOnline, Bild.de, Heise)§  Obskure selbstgeschrieben HTML-Monster und das Nachrichten-Konzept (DavidGegenGoliath)
  • 4. Abdeckung fixen?§  neue Quellen entdecken http://de.guttenplag.wikia.com/wiki/GuttenPlag_Wiki§  bekannte & relevante Quellen hinzufügen §  keywordunabhängig Quellen monitoren? §  Facebook Fanpages, Twitter Accounts, wichtige Blogs §  RSS-Feeds §  API-Integration (z.B. Tumblr, Google+, Pinterest) §  Crawler schreiben §  Achtung: TOS, Logins und robots.txt http://www.nytimes.com/robots.txt http://tagesschau.de/robots.txt
  • 5. Volumen§  Associated Press 1/Minute§  Forenposts 5.560/Minute§  Blogeinträge 45.800/Minute§  Tweets 277.777/Minute§  Facebook Posts 694.400/Minute
  • 6. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords
  • 7. #Fail/Textextraction/Scope"Warum ist das ein Treffer?"
  • 8. Textextraction
  • 9. #Fail/Textextraction/SEOSpam"
  • 10. #Fail/Textextraction/News"Spaß mit Google News
  • 11. "Keywords, Textextraktion, TopKeywords"
  • 12. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen, Länder, Geolocation
  • 13. #Fail/Filter/Sprachen Länder & Geolocation
  • 14. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen, Länder, Geolocation§  Medienkanäle
  • 15. #Fail/Filter/Segmentation"
  • 16. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen, Länder, Geolocation§  Medienkanäle§  #Fail/Filter/Sentiment§  Relevanz-Filter
  • 17. #Fail/Filter/Winning/10k+" §  Was mache ich mit 10.000 Treffern im Monat? §  Variante 1 – 500 Posts/Tag klassifizieren §  Variante 1a – jemanden dafür bezahlen §  Variante 2 – nur “relevante” Posts lesen §  Variante 2a – nur relevante Texte lesen (Relevance Score) §  Variante 2b – nur relevante Domains (PI, definiertes Set) §  Variante 2c – Author als Filter (Blog, Follower, etc) §  Variante 2d – Backlinks (Fail/SEO,ContentOnly-Backlinks)
  • 18. #Fail/Filter/Winning/10k+"
  • 19. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen , Länder, Geolocation§  Medienkanäle§  #Fail/Filter/Sentiment§  Relevanz§  Domains (Besucher/Monat, PI)§  Autoren§  Netzwerk-Struktur§  (Teil)-Duplikate
  • 20. #Fail/Filter/Syndication" " Was sind eigentlich Duplikate"& wie sollen wir damit umgehen?" " Ein Beispiel"
  • 21. Qualitäten der Filter" Duplikate"
  • 22. Slideshare.net/ubermetrics