Räumliche Analyse & Visualisierung von Mietpreisdaten für Immobilienportale
- 2. 2/33DGFK
© schernthanner·ifg·uni·potsdam 2016
1. Status quo der Mietpreisanalyse und -Visualisierung
2. Räumliche Analysen als Alternative
3. Geovisualisierung als Alternative
4. Zusammenfassung
Inhalt
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 9. 9/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Wie kommen die dargestellten Preise zustande ?
Immobilienportale betreiben unterschiedliche statistische Analysen ihrer
Angebotsdaten
Immobilienindizes sind ein Geschäftsfeld vieler Portale
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 10. 10/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Hedonische Regression
Nicht-räumliches Standardverfahren
Funktioneller Zusammenhang zwischen zwischen
Immobilienpreis p und und Immobilieneigenschaften x
Preis wird über intrinsischen Werte einer Immobilie und deren
Verfügbarkeit berechnet
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 11. 11/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Abbildung modellierter Preise auf
fachfremd gewählten räumlichen
Bezugseinheiten abgebildet
Postleitzahlen
Stadtteilgrenzen
Von den Portalen eingeführte
Nachbarschaften
Infas Nachbarschaften:
Deutschlandweit 75 000
Nachbarschaften,
basierend auf ehemaligen
Stimmbezirken (Infas,
2012)
Zillow neighborhoods
Hedonische Regression
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 12. 12/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Bekannte Maklerweisheit:
Genau drei Dinge bei einer Immobilie sind
wichtig:
1. die Lage, 2. die Lage und 3. die Lage
(Stroisch, 2010)
„Nichtbeachtung von Tobler´s 1st law of
geography:
"Everything is related to everything else, but
near things are more related than distant things
(Tobler, 1970).“
Erhebliche Defizite in der Analyse und Visualisierung
von Mietpreisen bei Immobilienportalen
Wo bleibt die Lage ?
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 13. 13/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Verfahrensidentifizierung und Methodenevaluierung
Räumliche Alternativen ?
Vorverarbeitung Maschinelles Lernen Räumliche
Schätzverfahren
Geovisualisierung
Autokorrelationstests:
Morans I/ Gearys C/
Getis-Ord Gi
Random Forest Trees Geographisch
gewichtete
Regression
Grid Maps
Hauptkomponenten-
analyse
Künstliche Neuronale
Netze
Ordinary Kriging Webkarten mit Map
APIs und Java Script
Kartenbibliotheken
Random Forest Trees Kriging with external
drift
Cloudbasierte
Geovisualisierungen
Ordinary Cokriging
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 14. 14/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Quantitative Datenquelle
Einmalige „Big Data“ Datenquelle
Alle auf Immobilienscout 24 gelisteten
Mietangebote der Stadt Potsdam von
01/2004 bis 09/2013: 80% Marktabdeckung
Multivariater Datensatz: 74.098 geokodierte
Angebote
64 immobilienspezifischen Variablen
Zusätzlich: 5 45-minütige Interviews mit
Immobilienmarktexperten
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 15. 15/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Ordinary Kriging
Räumliche-geostatistische
Interpolationsmethode
Verbreitet in den Geowissenschaften
Daniel D. Krige (1951)
entwickelte das Verfahren.
Einsatz im Bergbaubereich
Kaum Anwendungen in
Mietpreisschätzung
Räumlicher Zusammenhang über die
Abstandsvektoren Angebotspunkte
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 16. 16/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Ordinary Kriging – Validierung
Potsdam
1319 Angebote
1. Quartal 2013
3 Kriging Verfahren und 3
Parameter in 5000 Modelläufen
Validierung im Vergleich zum
hedonischen Standardverfahren
5-fache Kreuzvalidierung und
Ableitung der Gütemaße
Mean Error, RMSE / Fehler in %
/ Rechenzeit
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 17. 17/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Ordinary Kriging
Das einfachste Kriging Verfahren Ordinary Kriging war allen
komplexeren und dem hedonischen Verfahren in allen
Modelläufen überlegen
30 ha
Infas Geodaten
Geometrie
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 18. 18/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Random Forest Trees
Der von Breiman (2001) entwickelte Algorithmus "Random
Forest" (RF) ist eine Weiterentwicklung herkömmlicher
einfacher Entscheidungsbäume
Die "Entscheidung" über das endgültige Resultat eines
Random Forest Modells wird über eine Anzahl an willkürlich
gewachsenen Entscheidungsbäumen bestimmt
Nur wenige Studien zur Mietpeisschätzung nutzen Random
Forest Trees
Quelle: Imperial College London
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 19. 19/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Random Forest Trees
Anwendung zur Sekundärvariablenwahl und zur Mietpreisschätzung
als Regressionsmodell an exemplarischen Datensatz aus 1. Quartal
2013 Untersuchungsraum Potsdam mit 1319 Objekten.
Vorteil des Verfahrens Kann mit kategoriale Variablen angewendet
werden
Variablenauswahl
Einteilung in Training und Testdaten
70% Test / 15% Training / 15% „Out of the bag“
Modellläufe 100 – 500 Bäume
Validierung: MSE / lnMSE%/
Node Impurity
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 21. 21/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Grid Maps
Darstellung thematischer Sachverhalte auf Rasterzellen
Vorreiter US Zensus Büro
Irregulär geformte US Zensusblöcke wurden in
Rasterzellen umgewandelt
Statistik Austria stellt Bevölkerungs-, Arbeitsmarkt-,
Gebäudestatisken in 100 m bis 10 km Grid dar
Größere Vergleichbarkeit gegenüber Raumbezug auf
administrativer Ebene (Trainor, 2010)
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 23. 23/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Was ist die ideale Zellengröße für eine Mietpreiskarte?
Methodik des Gridmapping
Filterung
von (Wohn-)
Gebäudeblöcken:
Overpass API
Angebotsdistanz,
Punktdichte
& Grundfläche
von Wohngebäuden
Zellgrößen (m) Maßstab Zoomstufe in Webmap /
OpenStreetMap
110 1: 70 000 13
75 1: 35 000 und 1: 15 000 14 und 15
>= 50 >= 1:8000 >= 16
20 -50 Nur zur Berechnung /
feinmaschige Grids
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
- 24. 24/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Mietpreiskarten – Prototyp
Zoomstufe 13 /1: 35.000
Filterung nach Urban Atlas
Mietpreiskarte Status
Quo des Portals
Immobilienscout 24
Zoomstufe 13
1: 36.000
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
- 25. 25/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Mietpreiskarte IS 24
Zoomstufe 15
1: 14.400
Infas Geodaten
Neighboorhood
Mietpreiskarten –
Prototyp:
Zoomstufe 16
1: 13.000
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
- 31. 31/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Zusammenfassung
Erstmalige umfassende Erhebung des raumanalytischen
und geovisuellen Status Quo von Immobilienportalen
Kriging Verfahren, Random Forest Trees und
Gridmapping Ansätze stellen eine deutliche Verbesserung
des Status Quo da und zeigen die wahre Preisverteilung
im Raum
Weiterer Forschungsbedarf:
Methodentransfer
Kombination von Verfahren des maschinellen Lernens
mit Geostatistischen Verfahren
Generalized additive modells
Zielgruppenstudien
....
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 32. 32/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Publikationen & Vorträge
Schernthanner, H. & L. Tyrallová (2010). FOS-GIS und Immobilienportale als Instrumente der
Wohnungsmarktanalyse. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte Geoinformatik 2010. Beiträge
zum 22. AGIT-Symposium Salzburg, 7-9 Jul 2010. Universität Salzburg. Heidelberg.
Schernthanner, H. (2012) Spatial analysis, forecasting and simulation of urban apartment rental markets. Vortrag
auf Einladung an das Department Landschaftsökologie / Computational Landscape Ecology des UFZ
(Umweltforschungszentrum), Leipzig.
Schernthanner, H. & H. Asche (2012).Geosimulation of Urban Housing Market Conditions: A Preliminary
Investigation. eds. REAL-CORP 2012, Proc. 17th International Conference on Urban Planning, Regional Development
in the Information Society. Wien, Austria 14-26 May 2012.
Schernthanner,H. (2012) Gastteilnahme am Expertengremium Potsdam 22, im Auftrag der
Stadtverordnetenversammlung der Stadt Potsdam, zur Untersuchung des Kostenanstiegs im Wohnen:
http://potsdam22.de
Scheele, L. & Schernthanner, H. (2014). Eine räumliche Alternative der Modellierung und Darstellung von
Immobilienpreisen für Immobilienportale. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte
Geoinformatik 2014. Beiträge zum 26. AGIT-Symposium Salzburg, 2-4 Jul 2014. Universität Salzburg. Heidelberg.
[ONLINE]
Schernthanner, H. (2015): The spatial estimation of appartment rents: A brief introduction, Vortrag im Rahmen von
#Maptime Berlin
Schernthanner, H. (2015). Untersuchungen zur räumlichen Analyse und Visualisierung von Mietpreisdaten für
Immobilienportale. XII, 134 Bl. : graph. Darst. Potsdam, Univ., Diss., 2015
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
- 33. 33/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Angebotsmieten Relevanz
Angebotsmieten geben die aktuelle Marktlage wieder sind von der
Aussagekraft Neuvertragsmieten gleich zu setzen
Sie spiegeln in angemessener Weise die aktuelle Marktlage wieder
(BBSR, 2014)
Datensätze wie der vorliegende sagen jedoch nichts darüber aus, ob
die Wohnungen nach der Veröffentlichung im Immobilienportal
tatsächlich vermietet wurden
- 34. 34/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Experteninterviews Experten
5 Experten in 45-minütigen teilstandardisierten, qualitativen Interviews
mit Interviewleitfragen:
Peter Ache: Autor Immobilienmarktbericht Deutschland
Jörn-Michael Westphal: Geschäftsführer der städtischen
Immobiliengesellschaft Pro Potsdam
Jan Hebecker: LeiterAnalytics Insight Data, IS 24
Arne Schwarz: Leiter Produktmanagment Immobilienbewertung IS
24
Lars Holger Wilke: Head Automated Real Estate Evaluation, IS24
- 35. 35/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Experteninterviews Themen- und Problemfelder
Immobilienpreis-
karten
Immobilienpreismodellieru
ng
Daten Angebotskarten
Fachfremd
verwendete
Grenzen
Fachfremd verwendete
Grenzen
Hedonische
Regressionsm
odelle
Datenschutz Pin/Marker
Problematik
Legende
Datenpräprozessierung Daten
Homogenisier
-ung
Zusätzliche
Informationsebe-
nen
Datendifferenzierung
Dichteschwankungen Open Data Indikatoren basierte,
distanzabhängige
Suche
Visualisierung
der Distanzen
Lagemodellierung
Ableitung Bestandspreis
- 36. 36/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Anwendung Künstliche Neuronale Netzwerke
Daten werden im Verhältnis 70% / 15%/ 15% von Test,- Trainings, und
Validierungsdaten unterteilt.
Für Antwort vom neuronalen Netz nutzt man die Variablen:
Verweildauer der Anzeige / Wohnfläche / Baujahr / Objektalter /
Zimmeranzahl und Etage
Validierungsmaß Pseudo R²: mit 0,192 sehr gering und großer Fehler
an den zu schätzenden Punkten
- 37. 37/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Interpolation
Interpolation =„Die Ermittlung eines unbekannten Funktionswertes zu
einem Argument, das zwischen zwei Argumenten mit bekannten
Funktionswerten (Stützwerten) liegt“ (Geoinformatik-Service, 2002)
Versuch Attributwerte an Punkten ohne Messergebnisse zu schätzen
Schätzung aus Stützpunkten = Punkte mit bekannten Messwerten.
“In real estate analysis, the kriging method is used to create
interpolated maps or continuous maps ”
Anselin, L. (1998). GIS research infrastructure for spatial analysis of real estate markets.
Journal of Housing Research, 9(1), 113-133.
- 40. 40/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Map APIs
Unter Webkarte wird in dieser Arbeit eine webbasierte, graphische
Repräsentierung eines Datenmodells verstanden.
Präsentationskarten, in denen ein digitaler Datenbestand durch
Attribuierung mit graphischen Merkmalen sichtbar gemacht wird.
Map APIs sind JavaScript-Bibliotheken, die Funktionalitäten zur
Interaktion mit der Kartengrafik bereitstellen und die Integration
von Karteninhalten von Kartenservern (meist Tiled Map Services)
ermöglichen.
„Tiled Map Serving“ beruht dabei auf zwei Lösungsansätzen der
webbasierten Kartenbereitstellung (Peterson, 2014):
Ajax und Map Tiles
- 41. 41/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Angebotsmieten Einflussfaktoren neben Lage (für Sekundärvariablenauswahl)
RF PCA Schnittmenge
mit Potsdam 22 Faktoren
Baujahr Baujahr Baujahr
Einbauküche Etage Zimmeranzahl
Wohnfläche Objektalter Einbauküche
Zimmeranzahl Verweildauer der Anzeige Etage
Etage Wohnfläche Wohnfläche
- 42. 42/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Räumliche Statistik und Kartendarstellung von Portalen
Immobilienport
al
(Räumliche) Statistik Kartendarstellung von
Immobilienpreisen
Zillow.com Hedonisches Regressionsmodell: Zillow
Price Estimate.
Pin Map der Angebotspreise.
Listendarstellung geschätzter
Preise
Trulia.com Hedonisches Regressionsmodell:
Monitoring von Miet- und Kaufpreisen
Pin map von Miet- und
Kaufpreisen
Homes.yahoo.c
om
Keine Angaben Pin map von Miet- und
Kaufpreisen
Immobilienscout
24.de
Hedonisches Regressionsmodell: IMX Mapping geschätzter Miet- und
Kaupreise gemappt auf
willkürliche geographischen
Bezugseinheit
Immowelt.de Keine Angaben Pin Map
Immonet.de Keine Angaben Keine Kartenansicht
Homegate.ch Hedonisches Regressionsmodell:
Mietindex
Pin Map
- 43. 43/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Method Nugget Partial sill Range Funct. RMSE t (sec)
OK 0.001 0.1 700 Exp 0.788 45.480
OK 0.001 0.1 600 Exp 0.789 50.440
OK 0.001 0.095 600 Exp 0.789 60.030
KED 0.001 0.06 200 Exp 1.069 40.250
OCK 1100 Sph 1.207 34350.4