1/33DGFK
© schernthanner·ifg·uni·potsdam 2016
DGFK|5.4.16
DGFK: Kartographisches Kolloquium
Räumliche Analyse & Visualisierung von Mietpreisdaten für Immobilienportale
Harald Schernthanner|Geoinformatik |IfG
2/33DGFK
© schernthanner·ifg·uni·potsdam 2016
1. Status quo der Mietpreisanalyse und -Visualisierung
2. Räumliche Analysen als Alternative3. Geovisualisierung als Alternative4. Zusammenfassung
Inhalt
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
3/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Stellen Sie sich vor, Sie suchen eine Mietwohnung ?
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
4/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Zehlendorf 9,27 €/m²|Potsdams Innenstadt 8-10 €/m²?
Quelle: Wirtschaftswoche
Quelle: Immonet
Quelle: Immobilienscout24
Quelle: Immonet
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
5/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Mietpreise >13€/m² in ganz Salzburg ?
Quelle: Willhaben.at
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
6/33DGFK
© schernthanner·ifg·uni·potsdam 20161. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
1900 US$ für eine 1-Zimmerwohung in ganz Manhattan?
Quelle: Immonet
Quelle: Trulia
7/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Anteil am Warenkorb - Kaltmiete 21% - Warmmiete 31%- Mieterquote: 48 %
Relevanz von Mietpreisen ?
8/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Research ?? Mittelwert / Median Hedonische
Regression
Status quo der Prozesskette
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
9/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Wie kommen die dargestellten Preise zustande ? Immobilienportale betreiben unterschiedliche statistische Analysen ihrer
Angebotsdaten Immobilienindizes sind ein Geschäftsfeld vieler Portale
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
10/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Hedonische Regression Nicht-räumliches Standardverfahren Funktioneller Zusammenhang zwischen zwischen
Immobilienpreis p und und Immobilieneigenschaften x Preis wird über intrinsischen Werte einer Immobilie und
deren Verfügbarkeit berechnet
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
11/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Abbildung modellierter Preise auf fachfremd gewählten räumlichen Bezugseinheiten abgebildet Postleitzahlen Stadtteilgrenzen Von den Portalen
eingeführte Nachbarschaften
Infas Nachbarschaften: Deutschlandweit 75 000
Nachbarschaften, basierend auf ehemaligen Stimmbezirken (Infas, 2012)
Zillow neighborhoods
Hedonische Regression
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
12/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Bekannte Maklerweisheit: Genau drei Dinge bei einer Immobilie sind
wichtig: 1. die Lage, 2. die Lage und 3. die Lage
(Stroisch, 2010) „Nichtbeachtung von Tobler´s 1st law of
geography: "Everything is related to everything else,
but near things are more related than distant things (Tobler, 1970).“
Erhebliche Defizite in der Analyse und Visualisierung von Mietpreisen bei Immobilienportalen
Wo bleibt die Lage ?
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
13/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Verfahrensidentifizierung und Methodenevaluierung
Räumliche Alternativen ?
Vorverarbeitung Maschinelles Lernen
Räumliche Schätzverfahren
Geovisualisierung
Autokorrelationstests:Morans I/ Gearys C/ Getis-Ord Gi
Random Forest Trees
Geographisch gewichtete Regression
Grid Maps
Hauptkomponenten-analyse
Künstliche Neuronale Netze
Ordinary Kriging Webkarten mit Map APIs und Java Script Kartenbibliotheken
Random Forest Trees Kriging with external drift
Cloudbasierte Geovisualisierungen
Ordinary Cokriging
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
14/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Quantitative Datenquelle Einmalige „Big Data“ Datenquelle Alle auf Immobilienscout 24 gelisteten
Mietangebote der Stadt Potsdam von 01/2004 bis 09/2013: 80% Marktabdeckung
Multivariater Datensatz: 74.098 geokodierte Angebote
64 immobilienspezifischen Variablen Zusätzlich: 5 45-minütige Interviews
mit Immobilienmarktexperten
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
15/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Ordinary Kriging Räumliche-geostatistische
Interpolationsmethode Verbreitet in den
Geowissenschaften Daniel D. Krige (1951)
entwickelte das Verfahren. Einsatz im Bergbaubereich
Kaum Anwendungen in Mietpreisschätzung
Räumlicher Zusammenhang über die Abstandsvektoren Angebotspunkte
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
16/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Ordinary Kriging – Validierung
Potsdam1319 Angebote1. Quartal 2013
3 Kriging Verfahren und 3 Parameter in 5000 Modelläufen
Validierung im Vergleich zum hedonischen Standardverfahren
5-fache Kreuzvalidierung und Ableitung der Gütemaße
Mean Error, RMSE / Fehler in % / Rechenzeit
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
17/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Ordinary Kriging Das einfachste Kriging Verfahren Ordinary Kriging war
allen komplexeren und dem hedonischen Verfahren in allen Modelläufen überlegen
30 ha Infas GeodatenGeometrie
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
18/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Random Forest Trees Der von Breiman (2001) entwickelte Algorithmus
"Random Forest" (RF) ist eine Weiterentwicklung herkömmlicher einfacher Entscheidungsbäume
Die "Entscheidung" über das endgültige Resultat eines Random Forest Modells wird über eine Anzahl an willkürlich gewachsenen Entscheidungsbäumen bestimmt
Nur wenige Studien zur Mietpeisschätzung nutzen Random Forest Trees
Quelle: Imperial College London
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
19/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Random Forest Trees
Anwendung zur Sekundärvariablenwahl und zur Mietpreisschätzung als Regressionsmodell an exemplarischen Datensatz aus 1. Quartal 2013 Untersuchungsraum Potsdam mit 1319 Objekten.
Vorteil des Verfahrens Kann mit kategoriale Variablen angewendet werden
Variablenauswahl Einteilung in Training und Testdaten70% Test / 15% Training / 15% „Out of the bag“
Modellläufe 100 – 500 Bäume Validierung: MSE / lnMSE%/ Node Impurity
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
20/33DGFK
© schernthanner·ifg·uni·potsdam 2016
n tree
150 350 400 300 450 250 500 200 100
MSE 1,1385 1,1391 1,1392 1,1397 1,1404 1,1407 1,1412 1,1436 1,1508
Random Forest Trees
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
21/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Grid Maps Darstellung thematischer Sachverhalte auf
Rasterzellen Vorreiter US Zensus Büro
Irregulär geformte US Zensusblöcke wurden in Rasterzellen umgewandelt
Statistik Austria stellt Bevölkerungs-, Arbeitsmarkt-, Gebäudestatisken in 100 m bis 10 km Grid dar
Größere Vergleichbarkeit gegenüber Raumbezug auf administrativer Ebene (Trainor, 2010)
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
22/33DGFK
© schernthanner·ifg·uni·potsdam 2016
23/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Was ist die ideale Zellengröße für eine Mietpreiskarte? Methodik des Gridmapping
Filterung von (Wohn-)
Gebäudeblöcken: Overpass API
Angebotsdistanz,Punktdichte
& Grundfläche von Wohngebäuden
Zellgrößen (m) Maßstab Zoomstufe in Webmap / OpenStreetMap
110 1: 70 000 13
75 1: 35 000 und 1: 15 000 14 und 15
>= 50 >= 1:8000 >= 16
20 -50 Nur zur Berechnung / feinmaschige Grids
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
24/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Mietpreiskarten – Prototyp Zoomstufe 13 /1: 35.000 Filterung nach Urban Atlas
Mietpreiskarte Status Quo des Portals Immobilienscout 24
Zoomstufe 13 1: 36.000 1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
25/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Mietpreiskarte IS 24 Zoomstufe 15 1: 14.400 Infas Geodaten
Neighboorhood
Mietpreiskarten – Prototyp:
Zoomstufe 16 1: 13.000
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
26/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Mietpreiskarten: Prototyp und Status Quo:
Zoomstufe 18 & 18 1: 4500
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
Grid Maps
27/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Gebäudescharfe Mietpreisschätzdarstellung in Carto DB
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
28/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Thematische 2,5-dimensionale Darstellung (OSM Buildings)
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
29/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Hexabins zur Visualisierung von Immobilienangeboten
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
30/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Maßstabsabhängige Skalierung von Gridzellen mit leaflet.js
Quelle: Marius Humpert, ifg 2016
31/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Zusammenfassung
Erstmalige umfassende Erhebung des raumanalytischen und geovisuellen Status Quo von Immobilienportalen
Kriging Verfahren, Random Forest Trees und Gridmapping Ansätze stellen eine deutliche Verbesserung des Status Quo da und zeigen die wahre Preisverteilung im Raum
Weiterer Forschungsbedarf: Methodentransfer Kombination von Verfahren des maschinellen
Lernens mit Geostatistischen Verfahren Generalized additive modells Zielgruppenstudien ....
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
32/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Publikationen & Vorträge
Schernthanner, H. & L. Tyrallová (2010). FOS-GIS und Immobilienportale als Instrumente der Wohnungsmarktanalyse. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte Geoinformatik 2010. Beiträge zum 22. AGIT-Symposium Salzburg, 7-9 Jul 2010. Universität Salzburg. Heidelberg.
Schernthanner, H. (2012) Spatial analysis, forecasting and simulation of urban apartment rental markets. Vortrag auf Einladung an das Department Landschaftsökologie / Computational Landscape Ecology des UFZ (Umweltforschungszentrum), Leipzig.
Schernthanner, H. & H. Asche (2012).Geosimulation of Urban Housing Market Conditions: A Preliminary Investigation. eds. REAL-CORP 2012, Proc. 17th International Conference on Urban Planning, Regional Development in the Information Society. Wien, Austria 14-26 May 2012.
Schernthanner,H. (2012) Gastteilnahme am Expertengremium Potsdam 22, im Auftrag der Stadtverordnetenversammlung der Stadt Potsdam, zur Untersuchung des Kostenanstiegs im Wohnen: http://potsdam22.de
Scheele, L. & Schernthanner, H. (2014). Eine räumliche Alternative der Modellierung und Darstellung von Immobilienpreisen für Immobilienportale. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte Geoinformatik 2014. Beiträge zum 26. AGIT-Symposium Salzburg, 2-4 Jul 2014. Universität Salzburg. Heidelberg. [ONLINE]
Schernthanner, H. (2015): The spatial estimation of appartment rents: A brief introduction, Vortrag im Rahmen von #Maptime Berlin
Schernthanner, H. (2015). Untersuchungen zur räumlichen Analyse und Visualisierung von Mietpreisdaten für Immobilienportale. XII, 134 Bl. : graph. Darst. Potsdam, Univ., Diss., 2015
1. Status quo | 2. Räumliche Analysen | 3. Geovisualisierung | 4. Zusammenfassung
33/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Angebotsmieten Relevanz
Angebotsmieten geben die aktuelle Marktlage wieder sind von der Aussagekraft Neuvertragsmieten gleich zu setzen
Sie spiegeln in angemessener Weise die aktuelle Marktlage wieder (BBSR, 2014)
Datensätze wie der vorliegende sagen jedoch nichts darüber aus, ob die Wohnungen nach der Veröffentlichung im Immobilienportal tatsächlich vermietet wurden
34/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Experteninterviews Experten
5 Experten in 45-minütigen teilstandardisierten, qualitativen Interviews mit Interviewleitfragen: Peter Ache: Autor Immobilienmarktbericht Deutschland Jörn-Michael Westphal: Geschäftsführer der städtischen
Immobiliengesellschaft Pro Potsdam Jan Hebecker: LeiterAnalytics Insight Data, IS 24 Arne Schwarz: Leiter Produktmanagment
Immobilienbewertung IS 24 Lars Holger Wilke: Head Automated Real Estate
Evaluation, IS24
35/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Experteninterviews Themen- und Problemfelder Immobilienpreis-karten
Immobilienpreismodellierung
Daten Angebotskarten
Fachfremd verwendete Grenzen
Fachfremd verwendete Grenzen
Hedonische Regressionsmodelle
Datenschutz
Pin/Marker Problematik
Legende
Datenpräprozessierung DatenHomogenisier-ung
Zusätzliche Informationsebe-nen
Datendifferenzierung
Dichteschwankungen Open Data
Indikatoren basierte, distanzabhängige Suche
Visualisierung der Distanzen
Lagemodellierung
Ableitung Bestandspreis
36/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Anwendung Künstliche Neuronale Netzwerke
Daten werden im Verhältnis 70% / 15%/ 15% von Test,- Trainings, und Validierungsdaten unterteilt.
Für Antwort vom neuronalen Netz nutzt man die Variablen: Verweildauer der Anzeige / Wohnfläche / Baujahr / Objektalter / Zimmeranzahl und Etage
Validierungsmaß Pseudo R²: mit 0,192 sehr gering und großer Fehler an den zu schätzenden Punkten
37/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Interpolation
Interpolation =„Die Ermittlung eines unbekannten Funktionswertes zu einem Argument, das zwischen zwei Argumenten mit bekannten Funktionswerten (Stützwerten) liegt“ (Geoinformatik-Service, 2002)
Versuch Attributwerte an Punkten ohne Messergebnisse zu schätzen
Schätzung aus Stützpunkten = Punkte mit bekannten Messwerten.
“In real estate analysis, the kriging method is used to create interpolated maps or continuous maps ”
Anselin, L. (1998). GIS research infrastructure for spatial analysis of real estate markets. Journal of Housing Research, 9(1), 113-133.
38/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Umsetzungsoptionen 1 + 2
39/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Umsetzungsoptionen 3
40/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Map APIs
Unter Webkarte wird in dieser Arbeit eine webbasierte, graphische Repräsentierung eines Datenmodells verstanden.
Präsentationskarten, in denen ein digitaler Datenbestand durch Attribuierung mit graphischen Merkmalen sichtbar gemacht wird.
Map APIs sind JavaScript-Bibliotheken, die Funktionalitäten zur Interaktion mit der Kartengrafik bereitstellen und die Integration von Karteninhalten von Kartenservern (meist Tiled Map Services) ermöglichen.
„Tiled Map Serving“ beruht dabei auf zwei Lösungsansätzen der webbasierten Kartenbereitstellung (Peterson, 2014): Ajax und Map Tiles
41/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Angebotsmieten Einflussfaktoren neben Lage (für Sekundärvariablenauswahl)
RF PCA Schnittmenge mit Potsdam 22 Faktoren
Baujahr Baujahr Baujahr
Einbauküche Etage Zimmeranzahl
Wohnfläche Objektalter Einbauküche
Zimmeranzahl Verweildauer der Anzeige Etage
Etage Wohnfläche Wohnfläche
42/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Räumliche Statistik und Kartendarstellung von PortalenImmobilienp
ortal(Räumliche) Statistik Kartendarstellung von
Immobilienpreisen
Zillow.com Hedonisches Regressionsmodell: Zillow Price Estimate.
Pin Map der Angebotspreise. Listendarstellung geschätzter Preise
Trulia.com Hedonisches Regressionsmodell: Monitoring von Miet- und Kaufpreisen
Pin map von Miet- und Kaufpreisen
Homes.yahoo.com
Keine Angaben Pin map von Miet- und Kaufpreisen
Immobilienscout24.de
Hedonisches Regressionsmodell: IMX Mapping geschätzter Miet- und Kaupreise gemappt auf willkürliche geographischen Bezugseinheit
Immowelt.de Keine Angaben Pin Map
Immonet.de Keine Angaben Keine Kartenansicht
Homegate.ch Hedonisches Regressionsmodell: Mietindex
Pin Map
43/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Method Nugget Partial sill
Range Funct.
RMSE t (sec)
OK 0.001 0.1 700 Exp 0.788 45.480
OK 0.001 0.1 600 Exp 0.789 50.440
OK 0.001 0.095 600 Exp 0.789 60.030
KED 0.001 0.06 200 Exp 1.069 40.250
OCK 1100 Sph 1.207 34350.4
44/33DGFK
© schernthanner·ifg·uni·potsdam 2016
Fragen? Kritik? Anregungen?
Kontakt: [email protected]
Autor: Harald Schernthanner| IfG 2016