hands-on workshop:
  coding for data-
    journalism
einsteigerfreundliche Software-Tools für
   die Beschaffung und Präse...
urs@opendata-network.org




http://opendata-network.org/
upcoming:
Open Data Hackday
http://opendata.hackday.net/
17. & 18. April 2010 (morgen! hier!)



Open Democracy Camp
http:...
3 Beispiele:
Daten mit ruby
aus dem web
scrapen

Werte mit den
Google Chart Tools
visualisieren

Netzwerke mit
Gephi
visua...
• dynamische Skriptsprache
• leicht zu erlernen & ausdrucksstark
• http://www.ruby-lang.org/
• sudo apt-get install ruby i...
lets roll:




 Demo
tagesschau:




          Text aus einer
            HTML-Seite
             extrahiert 
tagesschau_fuer_nerds.rb




                           Demo
next step:




       HTML                      extrahierter    CSV
http://de.eurosport.yahoo.com
     /fussball/bundeslig...
fussball.rb
fussball.rb




zeilen = Array = [zeile, zeile, zeile, zeile]
Zeile für Zeile
fussball.rb
Ergebnis




       HTML                     extrahierter    CSV
http://de.eurosport.yahoo.com
     /fussball/bundesliga/ ...
Nebeneinkünfte
       Stufe 1 für 1000 bis 3500 Euro,
       Stufe 2 für 3500 bis 7000 Euro,
       Stufe 3 für alles ab 7...
Strategie:
1.
Alle Biografie-URLs
ermitteln

2.
Angaben zu Jobs
auslesen

3.
Tabelle erstellen
1. Alle Biografie-URLs
2a. Name und Partei auslesen
2b. Nebeneinkünfte auslesen
3. Tabelle erstellen
lokale Kopien erstellen
    mit SiteSucker
Nebeneinkünfte




    Demo
Google Chart Tools
        http://chart.apis.google.com/chart?
chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World




<img bor...
Google Chart Tools

        http://chart.apis.google.com/chart?
chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World

Bildgröße ...
Beispiele:
Google Visualization API




Javascript auf der Seite statt IMG-src-URL
Gephi
interactive visualization and exploration for graphes
Graph-Input-File (zB. gml)
Creator "ODN workshop"
graph
[
  node
  [
    id 1                  edge
    label "DoingIt Inc...
Gephi




Demo
Hands-on: Coding for Data-Journalism
Nächste SlideShare
Wird geladen in …5
×

Hands-on: Coding for Data-Journalism

5.330 Aufrufe

Veröffentlicht am

Wer sich mit Data Driven Journalism beschäftigt, sieht sich bei der
Recherche und bei der Vermittlung seiner Inhalte oft vor zusätzliche
Herausforderungen gestellt: Was tun, wenn die brisanten Daten zwar
veröffentlicht sind, aber in einer Form vorliegen, die eine
Weiterverarbeitung unmöglich macht? Und, wie kann ich meine Ergebnisse
ohne viel Aufwand ansprechend graphisch online Präsentieren.

In diesem Praxis-Workshop soll es einerseits darum gehen, wie man mit
der einsteigerfreundlichen Programmiersprache “ruby” Skripte zum
“Scrapen” (Einsammeln) von Daten erstellt. Andererseits werden einfach
nutzbare online-Visualisierungstools vorgestellt. Diagramme aus
aufbereiteten Datensätzen lassen sich damit direkt, z.B. ins eigene Blog
einbinden.

mehr:

http://re-publica.de/10/event-list/hands-on-workshop-coding-for-data-journalism/

Hands-on: Coding for Data-Journalism

  1. 1. hands-on workshop: coding for data- journalism einsteigerfreundliche Software-Tools für die Beschaffung und Präsentation relevanter Daten
  2. 2. urs@opendata-network.org http://opendata-network.org/
  3. 3. upcoming: Open Data Hackday http://opendata.hackday.net/ 17. & 18. April 2010 (morgen! hier!) Open Democracy Camp http://tinyurl.com/opend 8. & 9. Mai - Berlin - (new thinking store?) Daten-Journalismus in der Praxis heute 17h - Blauer Saal - Lorenz Matzat
  4. 4. 3 Beispiele: Daten mit ruby aus dem web scrapen Werte mit den Google Chart Tools visualisieren Netzwerke mit Gephi visualisieren
  5. 5. • dynamische Skriptsprache • leicht zu erlernen & ausdrucksstark • http://www.ruby-lang.org/ • sudo apt-get install ruby irb ri rdoc rubygems • sudo gem install nokogiri (Scraping-Library)
  6. 6. lets roll: Demo
  7. 7. tagesschau: Text aus einer HTML-Seite extrahiert 
  8. 8. tagesschau_fuer_nerds.rb Demo
  9. 9. next step: HTML extrahierter CSV http://de.eurosport.yahoo.com /fussball/bundesliga/ Text Tabelle
  10. 10. fussball.rb
  11. 11. fussball.rb zeilen = Array = [zeile, zeile, zeile, zeile]
  12. 12. Zeile für Zeile
  13. 13. fussball.rb
  14. 14. Ergebnis HTML extrahierter CSV http://de.eurosport.yahoo.com /fussball/bundesliga/ Text Tabelle
  15. 15. Nebeneinkünfte Stufe 1 für 1000 bis 3500 Euro, Stufe 2 für 3500 bis 7000 Euro, Stufe 3 für alles ab 7000 Euro. Die Stufen werden je nach Job monatlich oder jährlich ausgewiesen. Wer unter 1000 Euro im Monat oder 10.000 Euro im Jahr bleibt, muss nichts melden; solche Tätigkeiten werden ohne Stufen-Angabe vermerkt
  16. 16. Strategie: 1. Alle Biografie-URLs ermitteln 2. Angaben zu Jobs auslesen 3. Tabelle erstellen
  17. 17. 1. Alle Biografie-URLs
  18. 18. 2a. Name und Partei auslesen
  19. 19. 2b. Nebeneinkünfte auslesen
  20. 20. 3. Tabelle erstellen
  21. 21. lokale Kopien erstellen mit SiteSucker
  22. 22. Nebeneinkünfte Demo
  23. 23. Google Chart Tools http://chart.apis.google.com/chart? chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World <img border="1" src="http://chart.apis.google.com/chart?chs=250x100&amp;chd=t: 60,40&amp;cht=p3&amp;chl=Hello|World" alt="Yellow pie chart">
  24. 24. Google Chart Tools http://chart.apis.google.com/chart? chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World Bildgröße Werte Chart-Typ Legende
  25. 25. Beispiele:
  26. 26. Google Visualization API Javascript auf der Seite statt IMG-src-URL
  27. 27. Gephi interactive visualization and exploration for graphes
  28. 28. Graph-Input-File (zB. gml) Creator "ODN workshop" graph [ node [ id 1 edge label "DoingIt Inc" [ ] source 2 node target 1 [ ] id 2 edge label "Proxy Inc." [ ] source 3 target 1 ]
  29. 29. Gephi Demo

×