Aufbereitung von OSM Daten für GIS
Modellierungen und Analysen
Martin Loidl | martin.loidl@sbg.ac.at
mit Stefan Krampe, Bernhard Zagel und Gernot Pucher
AGIT_2014
Salzburg, 02.07.2014
@gicycle_
gicycle.wordpress.com
2
www.naviki.org [26.06.2014]
3
OSM
Anwend-
ung
Analyse
 Direkter Zugriff auf Datenbasis: z.B. Routing auf Basis
vorhandener Attribute in OSM Datenbank
4
Bingmaps
www.naviki.org
[26.06.2014]
5
OSM [27.06.2014]
highway = service
access = permissive
surface = paved
highway = primary
name = Alpenstraße
maxspeed = 50
highway = service
highway = residential
name = Hellbrunner Straße
maxspeed = 30
 Geometrische Qualität von OSM ist gut
 Für viele Anwendungen (z.B. Karten) ausreichend!
 Meist Gegenstand in Qualitätsbewertung (z.B. Länge des Wegnetzes
im Vergleich zu Referenzdatensatz, z.B. Jackson et al. 2013)
 Attributive Qualität ist sehr unterschiedlich
 Beeinträchtigung bei komplexeren Analysen (z.B. Routing)
 In Qualitätsbewertungen seltener explizit adressiert (Ausnahme z.B.
Graser et al. 2013)
Qualität
6
7
OSM
Anwend-
ung
Analyse
Prüfung
Korrektur
Modellierung
Analyse
 Bei Analysen kein direkter Zugriff auf Datenbasis, sondern
vorgeschalten Prüfung, Korrektur und Modellierung
 Bewertung der
Eignung von Straßen
für Radverkehr
 Segmentgenaue
Bewertungsroutine
 OSM Extrakt Sommer
2013
 ~ 1.000 km Netzlänge
 ~ 5.200 Segmente
(ways)
Kontext
8
Bayern Salzburg
OpenStreetMap
9
Node Way
Relation
Key = Value
Tag
Highway IS NOT Null
Teil des Wegnetzes.
Weitere Spezifikation
mittels zusätzlicher Tags
 Durch „offenes/informelles“ Datenmodell
systemimmanente Implikationen
 Attributive Lücken
 Attributive Fehler
 Attributive Heterogenität
 Teil einer attributiven Qualitätsbewertung von OSM Daten
 Übertragbar auf andere Daten
Implikationen
10
 Mangelnde Vollständigkeit von Attributen
 Für kartographische Darstellung reicht oftmals
Straßenkategorie
 highway = *
 Auswirkung auf Analyse abhängig von Anwendungsfall
 Beispiel Bewertung Radverkehrseignung Informationen zur
Infrastruktur wichtig (Art der Radinfrastruktur, Breite, Belagsart usw.)
 Geometrisch immer weniger weiße Flecken ... auf
Attributebene schon!
 Werkzeuge zur attributiven Verdichtung, z.B. www.kort.ch
Attributive Lücken
11
12
 Beseitigung attributiver Lücken in crowd-sourced Data
 Communtiy Aktivität
 Schätzung
 Schätzung bei funktionalen Abhängigkeiten
 Bei flächendeckenden Modellierungs-/Analyseansätze oftmals
ausreichend
Attributive Lücken
13
highway = motorway
surface = …
14
def function(maxspeed, access, bicycle, foot, highway, motorcar, ref, tracktype, Speed):
if (highway == "residential" or highway == "living_street" or highway == "tertiary") and (access
== " " or access == "designated" or access == "destination" or access == "yes"):
return 50
elif highway == "cycleway" or highway == "footway" or bicycle == "yes" or bicycle == "designated"
or foot == "yes" or foot == "designated" or foot == "official" or foot == "permissive":
return 0
elif (highway == "track" or highway == "path" or highway == "unclassified") and bicycle != "no"
and foot != "no" and motorcar != "yes" and (tracktype == "grade3" or tracktype == "grade4" or
tracktype == "grade5"):
return 0
elif highway == "motorway":
return 130
elif highway == "motorway_link":
return 100
elif highway == "primary_link":
return 80
elif access == "no" or motorcar == "no" or highway == "steps":
return 0
elif motorcar == "agricultural" or highway == "path" or (highway == "track" and access != "no"):
return 10
elif highway == "living_street" or (highway == "service" and access == "private") or (highway ==
"residential" and access == "private") or (highway == "construction" and tracktype != None):
return 20
elif highway == "service":
return 30
usw.
Schätzung der Geschwindigkeit
mittels funktional abhängiger
Attribute
 Bei Erfassung von Tags können Inkonsistenzen und/oder
Fehler passieren nicht auf OSM beschränkt!
 Individuelle Prüfung, lokales Wissen
 Community Aktivität
 Systematische Prüfroutinen
 Systematische Prüf- und Korrekturroutinen nur bei
ausreichender Anzahl an Tags möglich!
 Einzelfehler können nicht systematisch detektiert werden
Attributive Fehler
15
Attributive Fehler
 Falscher Tag
 Fehler nur bedingt durch
Prüfroutine detektierbar
 Detektion & Korrektur durch
 Analyseergebnisse +
Ortskenntnis
16
highway = cycleway
OSM Wiki
Attributive Fehler
17
 Inkonsistenz durch Prüfroutine detektierbar
 Korrektur durch
 Funktional abhängige Tags
 Angrenzende Segmente
 Ground truthing / Orthophoto
 Attributive Heterogenität = direkte Folge der Konzeption von
OSM Community Mitglieder haben maximale Freiheit bei
Attribuierung von Objekten (Reflektion persönlicher Prioritäten)
 Beispiel baulich getrennter, Geh- und Radweg entlang von
Bundesstraßen
Attributive Heterogenität
18
highway = footway
bicycle = designated
highway = cycleway
foot = designated
highway = path
bicycle = designated
foot = designated
highway = path
access = no
bicycle = yes
foot = yes
 Keine Frage von richtig/falsch aber Auswirkung auf
Modellierung und Analyse
19
 Berücksichtigung attributiver Heterogenität
1. Prüfung ob Varianten korrekt sind (OSM Wiki)
2. Bildung abgeleiteter Attribute
Attributive Heterogenität
20
highway = footway
bicycle = designated
highway = cycleway
foot = designated
highway = path
bicycle = designated
foot = designated
highway = path
access = no
bicycle = yes
foot = yes
Baulich getrennter Geh- und Radweg
Workflow
21
OSM
Anwend-
ung
Prüf-
routinen
Korrektur-
routinen
Modellier-
ung
Analyse
 Attributive Lücken
 Attributive Fehler
 Attributive Heterogenität
22
23
 OSM als Ressource für Analysen wertvoll
 „Mehr als schöne Karten“
 Durch Prüf-/Korrekturroutinen und Modellierung bessere (plausiblere)
Analyseergebnisse
 Einfluss der Datenqualität und -charakteristik auf Analyse kann
gemindert werden
 Qualitätsbewertung: Attribute!
Resumé
24
www.radlkarte.eu Do, 3.7. 11:00
Pressegespräch Radlkarte @
AGIT/TraffiCon Stand
DO, 3.7. 14:00
Vortrag GI-Forum
Follow on Twitter
@gicycle_
and Wordpress
gicycle.wordpress.com

AGIT2014: OSM data preparation for better analysis results.

  • 1.
    Aufbereitung von OSMDaten für GIS Modellierungen und Analysen Martin Loidl | martin.loidl@sbg.ac.at mit Stefan Krampe, Bernhard Zagel und Gernot Pucher AGIT_2014 Salzburg, 02.07.2014 @gicycle_ gicycle.wordpress.com
  • 2.
  • 3.
    3 OSM Anwend- ung Analyse  Direkter Zugriffauf Datenbasis: z.B. Routing auf Basis vorhandener Attribute in OSM Datenbank
  • 4.
  • 5.
    5 OSM [27.06.2014] highway =service access = permissive surface = paved highway = primary name = Alpenstraße maxspeed = 50 highway = service highway = residential name = Hellbrunner Straße maxspeed = 30
  • 6.
     Geometrische Qualitätvon OSM ist gut  Für viele Anwendungen (z.B. Karten) ausreichend!  Meist Gegenstand in Qualitätsbewertung (z.B. Länge des Wegnetzes im Vergleich zu Referenzdatensatz, z.B. Jackson et al. 2013)  Attributive Qualität ist sehr unterschiedlich  Beeinträchtigung bei komplexeren Analysen (z.B. Routing)  In Qualitätsbewertungen seltener explizit adressiert (Ausnahme z.B. Graser et al. 2013) Qualität 6
  • 7.
    7 OSM Anwend- ung Analyse Prüfung Korrektur Modellierung Analyse  Bei Analysenkein direkter Zugriff auf Datenbasis, sondern vorgeschalten Prüfung, Korrektur und Modellierung
  • 8.
     Bewertung der Eignungvon Straßen für Radverkehr  Segmentgenaue Bewertungsroutine  OSM Extrakt Sommer 2013  ~ 1.000 km Netzlänge  ~ 5.200 Segmente (ways) Kontext 8 Bayern Salzburg
  • 9.
    OpenStreetMap 9 Node Way Relation Key =Value Tag Highway IS NOT Null Teil des Wegnetzes. Weitere Spezifikation mittels zusätzlicher Tags
  • 10.
     Durch „offenes/informelles“Datenmodell systemimmanente Implikationen  Attributive Lücken  Attributive Fehler  Attributive Heterogenität  Teil einer attributiven Qualitätsbewertung von OSM Daten  Übertragbar auf andere Daten Implikationen 10
  • 11.
     Mangelnde Vollständigkeitvon Attributen  Für kartographische Darstellung reicht oftmals Straßenkategorie  highway = *  Auswirkung auf Analyse abhängig von Anwendungsfall  Beispiel Bewertung Radverkehrseignung Informationen zur Infrastruktur wichtig (Art der Radinfrastruktur, Breite, Belagsart usw.)  Geometrisch immer weniger weiße Flecken ... auf Attributebene schon!  Werkzeuge zur attributiven Verdichtung, z.B. www.kort.ch Attributive Lücken 11
  • 12.
  • 13.
     Beseitigung attributiverLücken in crowd-sourced Data  Communtiy Aktivität  Schätzung  Schätzung bei funktionalen Abhängigkeiten  Bei flächendeckenden Modellierungs-/Analyseansätze oftmals ausreichend Attributive Lücken 13 highway = motorway surface = …
  • 14.
    14 def function(maxspeed, access,bicycle, foot, highway, motorcar, ref, tracktype, Speed): if (highway == "residential" or highway == "living_street" or highway == "tertiary") and (access == " " or access == "designated" or access == "destination" or access == "yes"): return 50 elif highway == "cycleway" or highway == "footway" or bicycle == "yes" or bicycle == "designated" or foot == "yes" or foot == "designated" or foot == "official" or foot == "permissive": return 0 elif (highway == "track" or highway == "path" or highway == "unclassified") and bicycle != "no" and foot != "no" and motorcar != "yes" and (tracktype == "grade3" or tracktype == "grade4" or tracktype == "grade5"): return 0 elif highway == "motorway": return 130 elif highway == "motorway_link": return 100 elif highway == "primary_link": return 80 elif access == "no" or motorcar == "no" or highway == "steps": return 0 elif motorcar == "agricultural" or highway == "path" or (highway == "track" and access != "no"): return 10 elif highway == "living_street" or (highway == "service" and access == "private") or (highway == "residential" and access == "private") or (highway == "construction" and tracktype != None): return 20 elif highway == "service": return 30 usw. Schätzung der Geschwindigkeit mittels funktional abhängiger Attribute
  • 15.
     Bei Erfassungvon Tags können Inkonsistenzen und/oder Fehler passieren nicht auf OSM beschränkt!  Individuelle Prüfung, lokales Wissen  Community Aktivität  Systematische Prüfroutinen  Systematische Prüf- und Korrekturroutinen nur bei ausreichender Anzahl an Tags möglich!  Einzelfehler können nicht systematisch detektiert werden Attributive Fehler 15
  • 16.
    Attributive Fehler  FalscherTag  Fehler nur bedingt durch Prüfroutine detektierbar  Detektion & Korrektur durch  Analyseergebnisse + Ortskenntnis 16 highway = cycleway OSM Wiki
  • 17.
    Attributive Fehler 17  Inkonsistenzdurch Prüfroutine detektierbar  Korrektur durch  Funktional abhängige Tags  Angrenzende Segmente  Ground truthing / Orthophoto
  • 18.
     Attributive Heterogenität= direkte Folge der Konzeption von OSM Community Mitglieder haben maximale Freiheit bei Attribuierung von Objekten (Reflektion persönlicher Prioritäten)  Beispiel baulich getrennter, Geh- und Radweg entlang von Bundesstraßen Attributive Heterogenität 18 highway = footway bicycle = designated highway = cycleway foot = designated highway = path bicycle = designated foot = designated highway = path access = no bicycle = yes foot = yes  Keine Frage von richtig/falsch aber Auswirkung auf Modellierung und Analyse
  • 19.
  • 20.
     Berücksichtigung attributiverHeterogenität 1. Prüfung ob Varianten korrekt sind (OSM Wiki) 2. Bildung abgeleiteter Attribute Attributive Heterogenität 20 highway = footway bicycle = designated highway = cycleway foot = designated highway = path bicycle = designated foot = designated highway = path access = no bicycle = yes foot = yes Baulich getrennter Geh- und Radweg
  • 21.
  • 22.
  • 23.
  • 24.
     OSM alsRessource für Analysen wertvoll  „Mehr als schöne Karten“  Durch Prüf-/Korrekturroutinen und Modellierung bessere (plausiblere) Analyseergebnisse  Einfluss der Datenqualität und -charakteristik auf Analyse kann gemindert werden  Qualitätsbewertung: Attribute! Resumé 24 www.radlkarte.eu Do, 3.7. 11:00 Pressegespräch Radlkarte @ AGIT/TraffiCon Stand DO, 3.7. 14:00 Vortrag GI-Forum Follow on Twitter @gicycle_ and Wordpress gicycle.wordpress.com