• Gefällt mir
#Moca 12 - #fail - was beim monitoring regelmäßig schief läuft
Nächste SlideShare
Wird geladen in ...5
×

#Moca 12 - #fail - was beim monitoring regelmäßig schief läuft

  • 1,741 Views
Hochgeladen am

Vortrag auf dem Monitoringcamp 2012 in Hamburg am 09.11.2012

Vortrag auf dem Monitoringcamp 2012 in Hamburg am 09.11.2012

Mehr in: Business
  • Full Name Full Name Comment goes here.
    Sind Sie sicher, dass Sie...
    Ihre Nachricht erscheint hier
    Hinterlassen Sie den ersten Kommentar
Keine Downloads

Views

Gesamtviews
1,741
Bei Slideshare
0
Aus Einbettungen
0
Anzahl an Einbettungen
6

Aktionen

Geteilt
Downloads
14
Kommentare
0
Gefällt mir
10

Einbettungen 0

No embeds

Inhalte melden

Als unangemessen gemeldet Als unangemessen melden
Als unangemessen melden

Wählen Sie Ihren Grund, warum Sie diese Präsentation als unangemessen melden.

Löschen
    No notes for slide

Transcript

  • 1. #Fail - Was beim Monitoring verlässlich schief geht & wo noch Hoffnung bestehtPatrick BunkGründertwitter.com/uberMetrics Tel: 030-609857500facebook.com/uberMetrics Patrick.Bunk@uberMetrics-Technologies.com
  • 2. uberUns§  Spin-Off der Humboldt-Universität zu Berlin§  15 Mitarbeiter (11 Entwickler 4 Rest)§  Kernkompetenzen: §  Entwicklung hochskalierbarer Text-Mining-Plattform §  Entwicklung von Algorithmen zur automatischen Strukturierung von Nachrichten uberMetrics Technologies GmbH, Rosenthaler Str. 34/35, 10178 Berlin, contact@ubermetrics.com, +49 30 609857500, Twitter: @ubermetrics
  • 3. #Fail/Sources/" Warum findet ihr das nicht?§  Social Networks (Facebook, G+, Ning, XING, LinkedIn)§  Blogs (Blogger, LiveJournal, Wordpress, etc)§  Microblogs (Twitter, Tumblr)§  Foren (4chan, gulli.com, reddit, xda-developers)§  Verbraucherportale (dooyoo, ciao, qype, gutefrage)§  Video (youtube, vimeo, sevenload, clipfish)§  Foto (flickr, 500px, photobucket, SmugMug)§  News (SpiegelOnline, Bild.de, Heise)§  Obskure selbstgeschrieben HTML-Monster und das Nachrichten-Konzept (DavidGegenGoliath)
  • 4. Abdeckung fixen?§  neue Quellen entdecken http://de.guttenplag.wikia.com/wiki/GuttenPlag_Wiki§  bekannte & relevante Quellen hinzufügen §  keywordunabhängig Quellen monitoren? §  Facebook Fanpages, Twitter Accounts, wichtige Blogs §  RSS-Feeds §  API-Integration (z.B. Tumblr, Google+, Pinterest) §  Crawler schreiben §  Achtung: TOS, Logins und robots.txt http://www.nytimes.com/robots.txt http://tagesschau.de/robots.txt
  • 5. Volumen§  Associated Press 1/Minute§  Forenposts 5.560/Minute§  Blogeinträge 45.800/Minute§  Tweets 277.777/Minute§  Facebook Posts 694.400/Minute
  • 6. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords
  • 7. #Fail/Textextraction/Scope"Warum ist das ein Treffer?"
  • 8. Textextraction
  • 9. #Fail/Textextraction/SEOSpam"
  • 10. #Fail/Textextraction/News"Spaß mit Google News
  • 11. "Keywords, Textextraktion, TopKeywords"
  • 12. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen, Länder, Geolocation
  • 13. #Fail/Filter/Sprachen Länder & Geolocation
  • 14. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen, Länder, Geolocation§  Medienkanäle
  • 15. #Fail/Filter/Segmentation"
  • 16. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen, Länder, Geolocation§  Medienkanäle§  #Fail/Filter/Sentiment§  Relevanz-Filter
  • 17. #Fail/Filter/Winning/10k+" §  Was mache ich mit 10.000 Treffern im Monat? §  Variante 1 – 500 Posts/Tag klassifizieren §  Variante 1a – jemanden dafür bezahlen §  Variante 2 – nur “relevante” Posts lesen §  Variante 2a – nur relevante Texte lesen (Relevance Score) §  Variante 2b – nur relevante Domains (PI, definiertes Set) §  Variante 2c – Author als Filter (Blog, Follower, etc) §  Variante 2d – Backlinks (Fail/SEO,ContentOnly-Backlinks)
  • 18. #Fail/Filter/Winning/10k+"
  • 19. #Fail/Filter - Volumen" sinnvolle Filter definieren!§  Keywords und Top Keywords§  Sprachen , Länder, Geolocation§  Medienkanäle§  #Fail/Filter/Sentiment§  Relevanz§  Domains (Besucher/Monat, PI)§  Autoren§  Netzwerk-Struktur§  (Teil)-Duplikate
  • 20. #Fail/Filter/Syndication" " Was sind eigentlich Duplikate"& wie sollen wir damit umgehen?" " Ein Beispiel"
  • 21. Qualitäten der Filter" Duplikate"
  • 22. Slideshare.net/ubermetrics