SlideShare ist ein Scribd-Unternehmen logo
1 von 160
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einführung in SPSS
Wintersemester 2007 / 2008
Dipl.-WiInf.(FH) Christian Reinboth
Einführung in SPSS
TestenBeschreiben
Darstellen Erkennen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Überblick
● Zu meiner Person
● Zu diesem Kurs
● Was ist Marktforschung ?
● Warum Marktforschung studieren ?
● Grundbegriffe der Statistik
● Methoden der Datengewinnung
● Verschiedene Skalenniveaus
● SPSS-Ansichten & Dateitypen
● Eine Verteilung überblicken
● Grafische Darstellungsformen
● Balken- und Kreisdiagramme
● Histogramme
● Stem-and-Leaf-Plots
● Box-Plots
● Streudiagramme
● Streudiagramm-Matrizen
● Lagemaße
● Arithmetisches Mittel
● Median & Quartile
● Modus
● Streuungsmaße
● Varianz
● Standardabweichung
● Interquartilsabstand
● Spannweite
● Verteilungsmaße
● Ausreißeranalyse
● Leverage-Effekt
● Umgang mit Ausreißern
● Identifikation von Ausreißern
● Test auf Normalverteilung
● Test auf Homoskedastizität
● Verteilungstypen
● Binomialverteilung
● Hypergeometrische Verteilung
● Poissonverteilung
● Stetige Gleichverteilung
● Exponentialverteilung
● Normalverteilung
● Daten bearbeiten mit SPSS
● Fälle sortieren
● Fälle auswählen
● Fälle gewichten
● Der Wahrscheinlichkeitsbegriff
● Grundlagen der Kombinatorik
● Satz von Bayes
● Vorschau auf die VTR MaFo
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zu meiner Person
● Christian Reinboth (geb. 1980)
● 2005: Diplom-Wirtschaftsinformatiker (FH)
● Seit 2005 Lehraufträge für VTR Marktforschung,
SPSS, Info-Management, MIS/BIS, und HTML
● 2006: Mitbegründer der HarzOptics GmbH
Wissenschaftliches An-Institut der HS Harz
Schwerpunkt: Optik-Forschung & Entwicklung
● Forschungspreis 2006 der IHK Magdeburg
● Seit 2006 EU-Koordinator der Hochschule Harz
● Seit 2007 Studium der regenerativen Energietechnik
Innovations- und Gründungszentrum
Raum B05 – HarzOptics GmbH
Tel: 03943 – 935 – 615
E-Mail: creinboth@hs-harz.de
WWW: http://creinboth.hs-harz.de
Di. 18.00 – 20.00 Uhr
Mi. 18.00 – 20.00 Uhr
...oder nach Vereinbarung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
HarzOptics GmbH
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
HarzOptics GmbH
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
HarzOptics GmbH
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
HarzOptics GmbH
http://www.harzoptics.de
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zu diesem Kurs
● 2 SWS = 16 Vorlesungen á 90 Minuten
● Vorbereitung auf die VTR Marktforschung
● Kursziele:
● Erlernung der Grundlagen der Arbeit mit SPSS
● Wiederholung wesentlicher Inhalte von Statistik I & II
● Umsetzung von Berechnungen aus Statistik I & II in SPSS
● Der Kurs endet mit einer Klausur über 60 Minuten am PC
● Fragebögen, Interviews, Gruppendiskussionen
● Online-Marktforschung
● Explorative Datenanalyse
● Multiple Regression
● Varianzanalyse
● Faktorenanalyse
● Clusteranalyse
● Korrespondenzanalyse
● Answer Tree-Verfahren
● (Conjoint-Analyse)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Wiederholungskurs Statistik
● Die Einführung in SPSS ist teilweise auch ein Wiederholungskurs für Statistik I & II
● Grundbegriffe der Statistik
● Stetige und diskrete Daten
● Methoden der Datengewinnung
● Unterscheidung der Skalenniveaus
● Grafische Darstellungsformen
● Empirische Verteilungsfunktion
● Lage- & Streumaße
● Kombinatorik
● Häufigkeitstabellen
● Lineare Regression
● Stetige & diskrete Verteilungen
● Konfidenzintervalle & Tests
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Empfohlene Literatur
SPSS 14
Felix Brosius
Mitp-Verlag
ISBN: 3826616340
SPSS-Programmierung
Felix Brosius
Mitp-Verlag
ISBN: 3826614151
SDA mit SPSS
Janssen & Laatz
Springer-Verlag
ISBN: 3540239308
Statistik mit SPSS
Diel & Staufenbiel
Verlag Dietmar Klotz
ISBN: 3880744610
http://marktforschung.wikia.com
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Marktforschungs-Wiki
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Was ist Marktforschung?
● Die Marktforschung ist der Bestandteil des Unternehmens, der es mit der Außenwelt verbindet
● Marktforschung wird betrieben um:
● Grundwissen über Finanz-, Arbeits-, Beschaffungs- und Absatzmärkte zu schaffen
● Unsicherheiten über tatsächliche und zukünftige Zustände zu beseitigen
● Folgen von Handlungsalternativen einschätzbar zu machen (Planspiele)
● den Grad der Zielerreichung bei laufenden Vorhaben zu überprüfen
● den Informationsfluss zwischen Unternehmen und Außenwelt zu verbessern
● Der Marktforschungsprozess läuft in fünf Phasen ab:
● Definitionsphase: Formulierung der Fragestellung und Erstellung des Forschungsdesigns
● Designphase: Festlegung der Informationsquellen (primär/sekundär) und der Erhebungsmethoden
● Datengewinnungsphase: Durchführung von Beobachtungen, Befragungen und Experimenten
● Datenanalysephase: Datenbereinigung, Kodierung, Auswertung und Ergebnisinterpretation
● Dokumentationsphase: Erstellung des Forschungsberichts und Präsentation der Ergebnisse
● Im Rahmen dieser Veranstaltung wird insbesondere auf die Datenanalysephase eingegangen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Warum Marktforschung studieren?
● Trotz der allgemein angespannten Wirtschaftslage in
Deutschland und der EU steigen die Umsätze der
Marktforschung kontinuierlich an
● Die Marktforschung ist damit eine der wenigen
stabilen Wachstumsbrachen überhaupt
● Die Anforderungen an die Marktforschung und
damit auch die Marktforscher wachsen ständig
● Ein aktueller Produktlebenszyklus im Konsum-
güterbereich ist auf knapp sechs Monate begrenzt
● Etwa 80% des Gewinns werden bereits in den ersten
zwei Monaten erzielt
● Informationen über Kunden und Märkte müssen
daher immer zeitnaher beschafft werden können
● Nur so kann auf kurzfristige Entwicklungen
überhaupt noch reagiert werden
● Diese Situation verlangt nach gut ausgebildeten
Fachkräften, welche die theoretischen Grundlagen
der Marktforschung beherrschen und in der Lage
sind, schnelle und akkurate Ergebnisse zu liefern
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zur Arbeit mit SPSS
● SPSS = Statistical Package for Social Sciences (ursprüngliche Bedeutung)
● Weltweit verwendete Statistik-Software (die erste Version erschien 1968)
● Informationen unter http://www.spss.com
● Schlüssel für den SPSS-Arbeits- und Übungsraum 4.114 im Dekanat W
● Kostenlose Alternativen für Studierende: Statistiklabor, OpenOffice
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Weitere Statistik-Software
● Das Statistiklabor
● Kostenfreie SPSS-ähnliche Software
● Entwickelt von der Freien Universität Berlin
● Basiert auf der statistischen Programmiersprache R
● Um eigene in R geschriebene Programme erweiterbar
● Auch für den kommerziellen Einsatz freie Software
● Homepage: http://www.statistiklabor.de
● SAS
● Weltweit nach SPSS meistgenutzte Statistik-Software
● Software in C und Java kann eingebunden werden
● Homepage: http://www.sas.com/offices/europe/germany
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Weitere Statistik-Software
● NSDStat Pro
● In Deutschland durch die GESIS vertrieben
(Gesellschaft soz.wiss. Infrastruktureinrich.)
● Fast vollständige SPSS-Funktionalität
● Homepage: http://www.gesis.org
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Der Aufbau von SPSS
● Bei SPSS handelt es sich um sogenannte modulare Software
● Einzelne Softwaremodule können frei miteinander kombiniert werden
● Die Grundlage bildet das SPSS BASE-Modul (Preis: 1.300 €)
● Inhalte: Deskriptive und explorative Datenanalyse, statistische Tests
● Von herausragender praktischer Bedeutung ist auch das Modul SPSS REGRESSION
● Inhalte: Lineare und nichtlineare Regressionsanalyse, Probitanalyse
● Eine Reihe weiterer Module erweitern SPSS um spezielle Analyseverfahren
● SPSS TRENDS (lineare Zeitreihenanalyse)
● SPSS CATEGORIES (Korrespondenzanalyse)
● SPSS AMOS (Analyse linearer Strukturgleichungen)
● SPSS ANSWER TREE (Analyse von Marktsegmenten)
● SPSS CONJOINT (Berechnung von Präferenzkaufmodellen)
● SPSS MISSING VALUES (Erweiterte Analyse fehlender Werte)
● SPSS EXACT TESTS (Berechnung exakter Irrtumswahrscheinlichkeiten)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Was ist Statistik?
Wir benutzen die Statistik wie ein Betrunkener einen Laternenpfahl: Vor allem zur
Stütze unseres Standpunktes und weniger zum Beleuchten eines Sachverhalts.
- Andrew Lang
Die Lüge hat zwei Steigerungsformen: Diplomatie und Statistik.
- Marcel Achard
Ich stehe Statistiken etwas skeptisch gegenüber. Denn laut Statistik
haben ein Millionär und ein armer Kerl jeder eine halbe Million.
- Franklin D. Roosevelt
Statistics: the mathematical theory of ignorance.
- Morris Kline
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grundbegriffe der Statistik
● Statistische Einheit = Objekte, an denen die interessierenden Größen erfasst werden (Merkmalsträger)
● Grundgesamtheit = Menge aller für die Fragestellung relevanten statistischen Einheiten (Population)
● Teilgesamtheit = Teilmenge der Grundgesamtheit (Teilpopulation)
● Stichprobe = Tatsächlich untersuchte Teilmenge der Grundgesamtheit
● Merkmal = Interessierende Größe der statistischen Einheit (Variable)
● Ausprägung = Konkreter Merkmalswert einer statistischen Einheit
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Methoden der Datengewinnung
Frage: Wie sollen Daten gewonnen werden?
Primär-
statistisch
Sekundär-
statistisch
Tertiär-
statistisch
Methodik Ablauf Umfang
Experiment
Erfassung
Beobachtung
Befragung
mündlich
schriftlich
Querschnitt
Längsschnitt
Vollerhebung
Teilerhebung
willkürlich
zufällig
bewusst
● Einfache Zufallsst.
● Geschichtete Zufallsst.
● Klumpenst.
● Quotenauswahl
● Konzentrationsverf.
● Ausw. typischer Fälle
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Skalenniveaus
● Nominalskala
● Daten sind lediglich Bezeichnungen ohne mögliche Rangordnung
● Festgestellt werden kann nur Gleichheit oder Ungleichheit
● Beispiele: Kontonummern, Telefonnummern, Geschlecht
● Ordinalskala
● Daten können in eine Rangordnung gebracht werden
● Abstände zwischen den Daten sind aber nicht interpretierbar
● Beispiele: Schulnoten, Präferenzrangfolgen
● Intervallskala
● Daten können in eine Rangordnung gebracht werden
● Abstände zwischen den Daten sind interpretierbar
● Beispiele: Temperatur in Celsius oder Fahrenheit
● Verhältnisskala
● Wie Intervallskala, nur mit absolutem Nullpunkt
● Beispiele: Temperatur in Kelvin, Zeit, Geld
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Skalenniveaus
Daten
Nominalskala Ordinalskala
Kardinalskala
metrische Skala
Intervallskala
(kein natürlicher Nullpunkt)
Verhältnisskala
(natürlicher Nullpunkt)
● es existiert keine Rangordnung
● Beispiele:
● Geschlecht
● Studiengang
● Telefonnummer
● Familienstand
● es existiert eine Rangordnung
● die Abstände innerhalb dieser
Rangordnung sind nicht interpretierbar
● Beispiele:
● Schulnoten
● Steuerklassen
● Erdbebenskala
● alle Arten von Präferenzurteilen
● es existiert eine Rangordnung
● die Abstände sind interpretierbar
● Beispiele:
● Abstand in cm
● Zeitdauer in sek
● Preis in €
häufbar
nicht
häufbar
meist diskret
meist diskret
meist stetig
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Die SPSS-Datenansicht
Statistische Einheit
(Fall; Person...)
Ausprägungen
(Merkmalswerte)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Die SPSS-Variablenansicht
Skalenniveaus
(Meßniveaus)
Merkmale &
Merkmalsbezeichner
Platzhalter für
fehlende Werte
Labels für diskrete
Merkmalsausprägungen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Wichtige SPSS-Menübefehle
● Datei
● Erstellen, Öffnen & Importieren von Daten
● Ausdrucken kompletter Datensätze
● Bearbeiten
● Löschen, Kopieren & Einfügen von Daten
● Optionen > SPSS-Grundeinstellungen
● Ansicht
● Ein- und Ausblenden von Symbolleisten
● Einstellung von Schriftart und -größe
● Anzeigen von Labels/Werten
● Daten
● Einfügen von Variablen & Fällen
● Sortieren & Transponieren von Fällen
● Zusammenfügen von SPSS-Dateien
● Fälle zur Analyse auswählen
● Fälle für die Analyse gewichten
● Transformieren
● Umkodieren in selbe/neue Variable
● Analysieren & Grafiken
● Statistische & grafische SPSS-Analyseverfahren
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
SPSS-Dateitypen
● Datendateien - *.sav
● Datendateien enthalten die zu analysierenden Daten
● Die Datenstruktur ähnelt der einer Tabellenkalkulation
● Datenimport aus anderen Programmen (z.B. Excel) möglich
● Ausgabedateien *.spo
● Analyseergebnisse werden in Ausgabedateien geschrieben
● Es können mehrere Ausgabedateien gleichzeitig offen sein
● Erfolgreiche Analysen können permanent gesichert werden
● Sytaxdateien *.sps
● SPSS-Verfahren können auch selbst programmiert werden
● Ein selbsterstelltes Programme wird als Syntax gespeichert
● SPSS-Programmierung ist nicht Bestandteil dieses Kurses
● Skriptdateien *.sbs
● SPSS-Skripte werden mit Microsoft Visual Basic programmiert
● Auch die VB-Programmierung ist nicht Bestandteil dieses Kurses
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Unser Beispieldatensatz: Merkmale
● Geschlecht (geschl) – numerisch, 0 Dezimalstellen, 2 Wertelabels, nominales Meßniveau
● Einkommen (einkom) – numerisch, 2 Dezimalstellen, keine Wertelabels, metrisches Meßniveau
● Studienjahre (studj) – numerisch, 0 Dezimalstellen, keine Wertelabels, metrisches Meßniveau
● Krankentage (kranktg) – numerisch, 0 Dezimalstellen, keine Wertelabels, metrisches Meßniveau
● Jobzufriedenheit (jobzufr) – numerisch, 0 Dezimalstellen, 2 Wertelabels, nominales Meßniveau
● Alle anderen Merkmalseigenschaften sind im Rahmen dieser Einführung uninteressant und können ignoriert werden
Bitte legen Sie diese Merkmale nun in einem leeren Datenblatt an
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Unser Beispieldatensatz: Ausprägungen
Bitte tragen Sie diese Ausprägungen nun in Ihr Datenblatt ein
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zu Beginn einer Datenanalyse...
● ...ist es sinnvoll, einen Überblick über die vorliegenden Daten zu bekommen
● Darstellung von Lage und Verteilung der Werte – gibt es Auffälligkeiten in den Daten?
● Lagemaße: arithmetisches Mittel, Median, Perzentile, Modus
● Streumaße: Spannweite, Interquartilsabstand, Varianz, Standardabweichung
● Grafische Darstellung: Balken-, Kreis-, Stabdiagramm, Stem-and-Leaf, Histogramm, Box-Plot...
● Lassen sich extrem große oder kleine Werte (Ausreißer) in den Daten identifizieren?
● Sind außergewöhnliche Umstände oder Fehler die Ursache?
● Verzerren die Ausreißer die Ergebnisse der Datenanalyse?
● Ist es möglich, sie aus der weiteren Analyse auszuschließen?
● Erfüllen die vorliegenden Daten alle Voraussetzungen für weiterführende Analyseverfahren?
● Liegt eine Normalverteilung vor?
● Liegt eine Gleichheit der Varianzen vor? (Homoskedastizität)
● Welche Tests und Untersuchungen in eine solche explorative Datenanalyse gehören, ist nicht definitiv festgelegt
● Je nach der Art der Daten sowie der nachfolgenden Verfahren sind geeignete Teilelemente auszuwählen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Eine Verteilung überblicken
Frage: Wie sieht die vorliegende Verteilung aus?
Grafisch
Lagemaße
Streuungsmaße
Aufbaumaße
Balkendiagramme, Kreisdiagramme, Histogramme,
Säulendiagramme, Box-Plots, Stem-and-Leaf-Diagramme....
Arithmetisches Mittel, Getrimmtes arithmetisches Mittel, Median,
Perzentilwerte, Modus, Geometrisches Mittel, Harmonisches Mittel
Varianz, Standardabweichung, Variationskoeffizient,
Spannweite, Interquartilsabstand, 5-Werte-Zusammenfassung
Momentenkoeffizient der Schiefe,
Quartilskoeffizient der Schiefe, Kurtosis
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grafische Darstellung univariater Daten
Darstellungsformen
● Diskrete Merkmale
● Wenig Ausprägungen
● Stetige Merkmale
● Viele Ausprägungen
Stabdiagramm
Säulendiagramm
Balkendiagramm
Kreisdiagramm
Stem & Leaf
Histogramm
Box-Plot
P-P- & Q-Q-Plots
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Balken- und Kreisdiagramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Säulen- und Balkendiagramme
● Säulen- und Balkendiagramme eigenen sich primär für diskrete Merkmale mit einer geringen Anzahl an Ausprägungen
● Stetige Merkmale müssen vor der Darstellung klassiert werden, damit diese interpretierbar wird
● SPSS ermöglicht die grafische Darstellung sowohl der absoluten als auch der relativen Häufigkeiten im Diagramm
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Kreisdiagramme
● Ebenso wie Säulen- und Balkendiagramme sind Kreisdiagramme primär für diskrete Merkmalsverteilungen geeignet
● Bei stetigen Merkmalen ist eine Klassierung für die grafische Darstellung unbedingt erforderlich
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Balkendiagramm erstellen (1)
Grafiken > Galerie
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Balkendiagramm erstellen (2)
Grafiken > Galerie
Grafiken > Balkendiagramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Kreisdiagramm erstellen (1)
Grafiken > Galerie
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Kreisdiagramm erstellen (2)
Grafiken > Galerie
Grafiken > Kreisdiagramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Box-Plots und Histogramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grafik: Histogramme
● Ein Histogramm stellt die Häufigkeitsverteilung der Werte einer intervallskalierten Variablen dar
● Dabei wird von nach der Größe geordneten Daten ausgegangen, die in n Klassen aufgeteilt werden, welche
theoretisch nicht die gleiche Breite besitzen müssen (SPSS erstellt Histogramme stets mit gleichbreiten Klassen)
● Über jeder Klasse wird ein Rechteck konstruiert, dessen Flächeninhalt sich proportional zur absoluten bzw.
relativen Häufigkeit der jeweiligen Klasse verhält (je nach Anlage des Histogramms)
● Die Form der Darstellung eignet sich primär für stetige Merkmale mit einer großen Anzahl an Ausprägungen
● Bei der Erstellung von Histogrammen mit SPSS ist zu beachten, dass maximal 21 Klassen gebildet werden können
● Außerdem kann eine Normalverteilungskurve in das Histogramm eingeblendet werden, aus der abgelesen werden kann, wie
eine Normalverteilung bei Daten mit gleichem Mittelwert und gleicher Streuung aussehen würde (Voraussetzungsprüfung)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Histogramm erstellen
Grafiken > Galerie
Grafiken > Histogramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Box-Plots
● Box-Plots bieten einen direkten Verteilungsüberblick und eignen sich insbesondere zum Verteilungsvergleich
● Sie stellen sowohl Lage als auch Streuung der Verteilung dar und dienen zudem der Identifikation von Ausreißern
Median
Unteres Quartil
Oberes Quartil
*
Ausreißer
Extremer Wert
Ausreißer
Kleinster nicht-extremer Wert
Größter nicht-extremer Wert
27
16
42
IQR4 IQR7 IQR
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Box-Plots
● Aus der Lage des Medians innerhalb eines Box-Plots läßt sich die Form der Verteilung ablesen
Symmetrische Verteilung
Linkssteile Verteilung
Rechtssteile Verteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Box-Plots
● Sollen mehrere Verteilungen bzw. mehrere überschneidungsfreie Gruppen (beispielsweise männliche und weibliche
Angestellte) innerhalb einer Verteilung miteinander verglichen werden, lassen sich Box-Plots nebeneinander darstellen
● Weitergehende Vergleiche sind über gruppierte Box-Plots möglich, d.h. es erfolgt eine Aufteilung anhand mehr als nur
eines Merkmals (beispielsweise anhand des Geschlechts und des Minderheitenstatus, wodurch sich vier Gruppen ergeben)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einen Box-Plot erstellen (1)
Grafiken > Galerie
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einen Box-Plot erstellen (2)
Grafiken > Galerie
Grafiken > Box-Plot
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einen Box-Plot erstellen (3)
Grafiken > Galerie
Grafiken > Box-Plot
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Stem-and-Leaf-Plots und Streudiagramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Stem-and-Leaf-Plots
● Stem-and-Leaf-Plots (Stamm-Blatt-Diagramme) eignen sich ebenfalls zur Darstellung stetiger Merkmale
● Der große Vorteil gegenüber jeder anderen grafischen Darstellungsform ist, dass die Originaldaten
(bis zu einer gewissen Genauigkeit) noch aus dem Diagramm abgelesen werden können
● Das Diagramm ist ähnlich aufgebaut wie ein seitlich gekipptes Histogramm, d.h. flächenproportional
● Der Stamm besteht in der Regel aus der ersten Ziffer, die Blätter aus der jeweils folgenden (Rundungen)
● Sehr große oder sehr kleine Zahlen können auf- bzw. abgerundet oder als Extremwerte ausgewiesen werden
● Stem-and-Leaf-Plots können auch genutzt werden, um zwei Verteilungen miteinander zu vergleichen
1 | 1 1 1 2 2 3 4 5 7 7
2 | 2 2 4
3 | 3 3 3 4 5 8 8
4 | 1 2 9 9 9 9
2 Extremes
Stem width: 10
Each leaf: 1 case(s)
Datensatz A Datensatz B
8 8 8 3 2 | 1 | 1 1 1 2 2 3 4 5 7 7
2 1 | 2 | 2 2 4
9 5 4 43 3 | 3 | 3 3 3 4 5 8 8
4 3 3 2 1 | 4 | 1 2 9 9 9 9
3 Extremes 2 Extremes
Stem width: 10
Each leaf: 1 case(s)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einen Stem-and-Leaf-Plot erstellen
Analysieren
> Deskriptive Statistiken
> Explorative Datenanalyse
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grafische Darstellung multivariater Daten
Darstellungsformen
Bivariate Darstellung Mehr als zwei Variablen
2-D-Streudiagramm
Profildiagramme
Andrew's Fourier
Chernoff-Gesichter
3-D-Streudiagramm
Streudiagramm-Matrix
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Streudiagramme
● Streudiagramme stellen die gemeinsame Verteilung der Werte zweier Variablen (bzw. dreier Variablen in einem
3-D-Streudiagramm) dar, indem die entsprechenden Werte beider Variablen gegeneinander abgetragen werden
● Die Lage und Verteilung der Wertepaare ermöglicht Rückschlüsse auf mögliche Zusammenhänge
● Beispiel: Treten in der Tendenz große Werte der einen Variablen gepaart mit großen Werten der anderen Variablen
auf, so kann ein positiver Zusammenhang vermutet werden (beispielsweise bei Werbeausgaben und Verkaufszahlen)
● Ein gefundener Zusammenhang kann nicht in eine bestimmte Richtung interpretiert werden, d.h. aus der Grafik
ist nicht abzulesen, ob Variable A Variable B beeinflusst oder umgekehrt, bzw. ob ein Scheinzusammenhang besteht
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Streudiagramm erstellen (1)
Grafiken > Galerie
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Streudiagramm erstellen (2)
Grafiken > Galerie
Grafiken > Streudiagramm
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Streudiagramm-Matrix
● Liegt ein multivariater Fall vor, d.h. sollen für mehrere Variablenpaare jeweils gemeinsame Verteilungen dargestellt werden,
ist statt einer Reihe bivariater Streudiagramme ein gemeinsames Streudiagramm in Form einer Matrix sinnvoll
● Eine Streudiagramm-Matrix erlaubt den schnellen Überblick über die Vielzahl aller denkbaren Paarverteilungen
und gestattet das rasche Auffinden symmetrischer oder anderweitig auffälliger Einzel-Streudiagramme
● Jedes Streudiagramm taucht zweimal in der Matrix auf (einmal oberhalb und einmal unterhalb der Hauptdiagonalen), wobei die
jeweiligen Achsen der Diagramme miteinander vertauscht sind (Gehalt <> Anfangsgehalt; Anfangsgehalt <> Gehalt)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Eine Streudiagramm-Matrix erstellen (1)
Grafiken > Galerie
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Eine Streudiagramm-Matrix erstellen (2)
Grafiken > Galerie
Grafiken > Streudiagramm
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Lagemaße / Maße der zentralen Tendenz
Daten
Nominalskala Ordinalskala
Kardinalskala
metrische Skala
Modus Median
Quantile
Quartile
Perzentile
Intervallskala
(kein natürlicher Nullpunkt)
Verhältnisskala
(natürlicher Nullpunkt)
geometrisches Mittel
harmonisches Mittel
arithmetisches Mittel
(inkl. gewichtem aM und getrimmten aM)
Lagemaße, die ein niedriges Skalenniveau
voraussetzen können problemlos auf Datensätze
eines höheren Skalenniveaus angewandt werden.
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Das arithmetische Mittel
● Das arithmetische Mittel ist das bekannteste statistische Lagemaß (Standardmittelwert)
● Es kann nur für metrisch skalierte Daten berechnet werden (Intervallskala, Verhältnisskala)
● Vorsicht: SPSS „berechnet“ das arithmetische Mittel auch für nichtmetrische Daten (Schulnoten!)
● Methodenkenntnisse des Anwenders sind daher erforderlich!
● Liegen von einem metrischen Merkmal x insgesamt n Werte vor, berechnet sich das arithmetische Mittel durch:
● Die Gesamtsumme aller Abweichungen von arithmetischen Mittel beträgt daher stets Null
● Das arithmetische Mittel ist nicht robust, d.h. sehr empfindlich gegenüber Ausreißern
● Beispiel: 1, 2, 3, 4 > (1+2+3+4) / 4 = 2,5 >>> 1, 2, 3, 50 > (1+2+3+50) / 4 = 14
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Weltweite Lebenserwartung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Der Median
● Der Median ist der Wert, der in der Mitte der geordneten Verteilung liegt
● Die Berechnung des Medians setzt mindestens ordinalskalierte Daten voraus
● Bei einer ungeraden Anzahl an Werten, wird der mittlere Wert gewählt:
● Bei einer geraden Anzahl an Werten wird das arithmetischen Mittel der beiden zentralen Werte gewählt:
● Bei klassierten Daten wird der mittlere Fall der zentralen Klasse ermittelt (unter Annahme einer Gleichverteilung)
● Der Median ist äußerst robust, d.h. er wird von Ausreißern nicht beeinflusst
● Aus diesem Grund ist er in der Regel aussagekräftiger als das arithmetische Mittel
● Beispiel: 1, 2, 3, 4, 5 > Median: 3 >>> 1, 2, 3, 4, 50 > Median: 3
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Perzentilwerte
● Perzentilwerte sind Werte, unterhalb derer ein eindeutig definierter Anteil aller Werte liegt
● Für die Berechnung der Perzentile müssen mindestens ordinalskalierte Daten vorliegen (geordnet)
● Der bekannteste Perzentilwert ist das 50%-Perzentil, welches auch als Median bezeichnet wird
● Häufig verwendet wird auch die „Vierteilung“ des Wertebereichs mit den sogenannten Quartilen:
● 25%-Perzentil (25% aller Werte liegen unterhalb dieses Wertes)
● 50%-Perzentil, Median (50% aller Werte liegen unter- bzw. oberhalb dieses Wertes)
● 75%-Perzentil (75% aller Werte liegen unterhalb dieses Wertes)
● Ebenso wie der Median, sind die Perzentile absolut robust, d.h. von Ausreißern nicht zu beeinflussen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Der Modus
● Der Modus (Modalwert) ist der in den vorliegenden Daten am häufigsten auftretende Wert
● Bei klassierten Daten ist der Modus die Klassenmitte der Klasse mit den meisten Fällen (nur gleichbreite Klassen)
● Die Berechnung des Modus ist in der Regel nur bei diskreten Daten sinnvoll (Punktwahrscheinlichkeit)
● Er wird insbesondere für nominalskalierte Merkmale gebildet, da hier kein anderes Lagemaß möglich ist
● Bei metrisch skalierten Daten können gleichbreite Klassen gebildet und darüber der Modus ermittelt werden
● Vorteil: Der Modus ist auch ohne Berechnung erkennbar und kann daher in der Praxis schnell bestimmt werden
● Nachteil: Der Modus kann nur eindeutig interpretiert werden, wenn ein einzelnes, klares Maximum vorliegt
● Sind mehrere Werte mit gleicher Häufigkeit vertreten, gibt SPSS den in der Häufigkeitstabelle zuoberst stehenden Wert an
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Lagemaße / Maße der zentralen Tendenz
● Lagemaße sind Maßzahlen, die das Zentrum einer Verteilung beschreiben
● Arithmetisches Mittel
● Sogenanntes „Standardmittel“
● Daten müssen stets metrisch skaliert sein
● Mittel ist nicht robust, d.h. empfindlich gegenüber Ausreißern
● Getrimmtes arithmetisches Mittel
● Arithmetisches Mittel nach Entfernung einiger Randdaten
● Trimmung der Daten erfolgt stets symmetrisch an beiden Rändern
● Berechnung dieses Mittels ist sinnvoll bei Ausreißern
● Median
● Der Median ist der mittlere Wert der geordneten Verteilung
● Daten müssen mindestens ordinalskaliert sein
● Für gerade und ungereade n existieren zwei Formeln
● Der Median ist äußerst robust gegenüber Ausreißern
(falls n ungerade)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Lagemaße / Maße der zentralen Tendenz
● Perzentile
● Perzentile sind eine Verallgemeinerung des Medians
● Anstelle der 50% werden beliebige andere Prozentzahlen gewählt
● In der Praxis spielen noch Quantile und Quartile eine Rolle
● Modus
● Am häufigsten auftretender Wert in den Daten
● Kann schon für nominalskalierte Werte berechnet werden
● Nur sinnvoll, wenn ein einzelnes, klares Maximum vorliegt
● Geometrisches Mittel
● Kommt bei relativen Veränderungen zum Einsatz (Raten...)
● In solchen Fällen einzig zulässiges Lagemaß
● Faktoren können unterschiedlich gewichtet werden
● Harmonisches Mittel
● Kommt bei Quotienten zum Einsatz (Geschwindigkeiten...)
● Kann analog zum geometrischen Mittel gewichtet werden
(falls np nicht ganzzahlig)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Berechnung von Lagemaßen
Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
SPSS-Analyseproblem
SPSS führt JEDE Analyse unabhängig von den Voraussetzungen durch!
Also auch die Berechnung des arithmetischen Mittels...
➔ ... aus Schulnoten
➔ ... aus Präferenzrängen
➔ ... aus Kontonummern
➔ ... aus Telefonnummern
Mit komplexeren Verfahren sind noch schlimmere „Vergehen“ denkbar!
Die fachlichen Kenntnisse der Anwender sind daher absolut entscheidend!
>>> Darum: Keine Analyse ohne Prüfung der Voraussetzungen!!
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Skalenniveaus & Interpretation
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Die Spannweite
● Die Spannweite ist der Abstand zwischen dem kleinsten (Minimum) und dem größten (Maximum) Wert im Datensatz
● Die Spannweite ist als Streuungsmaß ungenügend, da sie extrem stark von Ausreißern beeinflusst wird
● Existieren an beiden Verteilungsrändern Ausreißer, wird die Spannweite nur(!) durch diese bestimmt
● Beispiel: 1, 2, 3, 4, 5 > Spannweite: 4 >>> 1, 2, 3, 4, 50 > Spannweite: 49
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Der Interquartilsabstand
● Der Interquartilsabstand (IQR = Inter Quartile Range) ist der Abstand zwischen dem oberen und dem unteren Quartil
● Da die beiden Quartile nicht von Ausreißern beeinflusst werden können, ist der IQR deutlich robuster als die Spannweite
● Aus den Quartilen sowie Minimum und Maximum lässt sich die kompakte 5-Werte-Zusammenfassung bilden
Interquartilsabstand
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Die Varianz und die Standardabweichung
● Die Varianz (bzw. Standardabweichung) ist das gebräuchlichste Streuungsmaß
● Sie berechnet sich als Summe der quadrierten Abweichungen der Einzelwerte (Ausgleich negativer
und positiver Abweichungen) vom arithmetischen Mittel, geteilt durch die Gesamtzahl aller Werte
● Bei der Berechnung der Stichproben-Varianz (SPSS) stehen die Freiheitsgrade im Nenner:
● Die Varianz wird kleiner, je näher die Einzelwerte am arithmetischen Mittel liegen
● Sind alle Werte mit dem Mittel identisch (keine Streuung), ergibt sich eine Varianz von Null
● Bei der Interpretation des Ergebnisses ist zu beachten, dass die quadrierten Werte in die Berechnung eingehen
● Dies hat zur Folge, dass auch die Varianz in der quadrierten Einheit dimensioniert ist (also z.B. in €² statt in €)
● Zur besseren Interpretation wird häufig die Standardabweichung als Quadratwurzel der Varianz angegeben
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Streuungsmaße / Dispersionsparameter
● Streuungsmaße geben Auskunft darüber, wie stark die Daten um das Zentrum streuen
● Empirische Varianz
● Mittlere quadrierte Abweichung vom arithmetischen Mittel
● Kann daher nur für metrisch skalierte Daten berechnet werden
● Varianz ist nicht robust, d.h.empfindlich gegenüber Ausreißern
● Standardabweichung
● Durch die Quadrierung ist die Varianz schwer interpretierbar
● Sie drückt sich in Einheiten wie €² oder Stunden² aus
● Die Standardabweichung ist die positive Wurzel der Varianz
● Variationskoeffizient
● Streuungen mit unterschiedlichen Maßstäben sind nicht vergleichbar
● Beispiel: Währungsschwankungen in verschiedenen Währungen
● Ist der Mittelwert positiv, können die Daten aber normiert werden
● Der entstehende Variationskoeffizient gestattet direkte Vergleiche
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Streuungsmaße / Dispersionsparameter
● Spannweite
● Differenz zwischen größtem und kleinstem Wert
● Wenige Informationen fließen in diesen Kennwert ein
● Differenz wird massiv durch Ausreißer beeinflusst
● Interquartilsabstand (IQR)
● Abstand zwischen dem oberen und dem unteren Quartil
● Wird für den Box-Plot und die 5-Werte-Zusammenfassung benötigt
● 5-Werte-Zusammenfassung
● Hochkomprimierte Darstellung von Streuung und Lage einer Verteilung
● Besteht aus den beiden Randwerten und den drei Quartilen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Berechnung von Streuungsmaßen
Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Schiefe und Wölbung
● Verteilungen können nach Schiefe unterschieden werden:
● Symmetrische Verteilungen (spiegelbildlich)
● Linkssteile / rechtsschiefe Verteilungen
● Rechtssteile / linksschiefe Verteilungen
● Zudem kann nach der Wölbung unterschieden werden:
● Wölbungsgrad entspricht der Wölbung einer Normalverteilung
● Wölbung verläuft flacher als Wölbung einer Normalverteilung
● Wolbung verläuft spitzer als Wölbung einer Normalverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Schiefe und Wölbung
● Schiefe und Wölbung können auch in Maßzahlen ausgedrückt werden
● Momentenkoeffizient der Schiefe
● Abweichung der Verteilung von der symmetrischen Form
● Daten müssen mindestens intervallskaliert sein
● Es ergeben sich positive Werte für linkssteile Verteilungen
und negative Werte für rechtssteile Verteilungen
● Quartilskoeffizient der Schiefe
● Koeffizient wird mit den Quartilen gebildet
● Daten müssen daher lediglich ordinalskaliert sein
● Interpretation ist indentisch zum Momentenkoeffizient
● Kurtosis / Exzeß
● Abweichung der Wölbung von der einer Normalverteilung
● Es ergeben sich positive Werte für spitze Verteilungen
und negative Werte für flache Verteilungen
mit
und
mit
und
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Berechnung von Verteilungsmaßen
Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Deskriptive Verteilungsübersicht
Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Bivariate Zusammenhänge analysieren
Frage: Liegt in einem bivariaten Datensatz ein Zusammenhang vor?
grafisch nominalskaliert ordinalskaliert metrisch skaliert
Streudiagramm
Scatterplot-Matrixstetig
diskret Balkendiagramme
(gruppiert, bedingt)
Bravais-Pearson-
Korrelationskoeffizient
Konkordanzkoeffizient
nach Kendall
Rangkorrelations-
koeffizient nach Spearman
Chi²-Koeffizient
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grafische Zusammenhangsanalyse
Zweidimensionales Streudiagramm
Dreidimensionales Streudiagramm
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grafische Zusammenhangsanalyse
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Prinzip der Korrelationskoeffizienten
● Prinzip der Korrelationskoeffizienten:
● Für zwei Variablen X und Y kann ein Zusammenhang unterstellt werden, wenn sie sich gleichmäßig verändern
● Eine solche gleichmäßige Veränderung kann zwei Formen annehmen:
● Gleichsinnig = wird X größer wird Y größer; wird X kleiner wird Y kleiner
● Gegensinnig = wird X größer wird Y kleiner; wird X kleiner wird Y größer
● Entscheidende Frage: Ist eine Regelmäßigkeit in der gemeinsamen Veränderung erkennbar?
● Bei der Berechnung von Korrelationen wird nach dem Skalenniveau der Daten unterschieden:
● Nominalskalenniveau: Chi²
● Ordinalskalenniveau: Spearman, Kendall
● Metrisches Skalenniveau: Bravais-Pearson
● Grundsätzlich immer möglich ist auch eine grafische Analyse der Daten
● Hier wird nach der Art der Daten unterschieden:
● Diskrete Daten: Gruppierte Balkendiagramme, Bedingte Balkendiagramme
● Stetige Daten: Zwei- und dreidimensionale Streudiagramme, Scatterplot-Matrix
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Bravais-Pearson-Korrelationskoeffizient
● Für metrisch skalierte Merkmale wird der Bravais-Pearson-Korrelationskoeffizient berechnet
● Wichtig: Der Korrelationskoeffizient misst ausschließlich den linearen Zusammenhang zwischen zwei Variablen (!)
● Nicht-lineare Zusammenhänge werden nicht aufgedeckt, auch wenn sie stark oder sogar absolut sein sollten
● Berechnung des Koeffizienten:
● Der Koeffizient r kann Werte zwischen -1 und +1 annehmen
● Bei positiven Werten liegt ein positiver Zusammenhang vor, d.h. die Wertepaare liegen auf einer steigenden Gerade
● Bei negativen Werten liegt ein negativer Zusammenhang vor, d.h. die Wertepaare liegen auf einer fallenden Gerade
● Werte nahe Null deuten darauf hin, dass keinerlei lineare Korrelation zwischen den beiden Variablen vorliegt
● Interpretation des Betrags (!) von r:
● r = 0 = keine Korrelation
● 0 < r < 0,5 = schwache Korrelation
● 0,5 <= r < 0,8 = mittlere Korrelation
● 0,8 <= r < 1 = starke Korrelation
● r = 1 = perfekte Korrelation
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Bravais-Pearson-Korrelationskoeffizient
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Spearman-Rangkorrelationskoeffizient
● Für ordinalskalierte Merkmale bieten sich zwei Zusammenhangsmaße an:
● Der Rangkorrelationskoeffizient nach Spearman
● Der Konkordanzkoeffizient nach Kendall
● Der Rangkorrelationskoeffizient nach Spearman misst den monotonen Zusammenhang zweier Variablen
● Für die n Datenpaare werden dabei innerhalb jeder Variablen zunächst Ränge gebildet
● Die kleinste Ausprägung von X erhält den Wert 1, die zweitkleinste den Wert 2 usw.
● Für die Variable Y wird identisch vorgegangen, auch hier erhält die kleinste Ausprägung die 1 etc.
● Anschließend werden die Rangdifferenzen d der Datenpaare gebildet
● Mit diesen Differenzwerten lässt sich dann der Rangkorrelationskoeffizient berechnen
● Die Ergebnisse liegen stets zwischen -1 und +1
● p > 0 = gleichsinniger monotoner Zusammenhang (große X-Werte gehen mit großen Y-Werten einher und umgekehrt)
● p ~ 0 = es besteht kein monotoner Zusammenhang zwischen X und Y (damit kann auch kein linearer bestehen!)
● p < 0 = gegenseitiger monotoner Zusammenhang (große X-Werte gehen mit kleinen Y-Werten einher und umgekehrt)
● Die Formel liefert nur genaue Resultate, wenn keine Rangplatzbindungen (ties) vorliegen
● Haben Beobachtungen identische Werte, ordnet man allen identischen Daten den Durchschnittsrang zu
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Konkordanzkoeffizient nach Kendall
● Alternativ zu Spearmans Rho kann für ordinalskalierte Daten auch Kendalls Tau berechnet werden
● Zur Berechnung wird die Anzahl konkordanter (K) und diskordanter (D) Paare benötigt
● Zur Bestimmung der Paare wird eine der Datenreihen nach der Größe geordnet
● Anschließend wird untersucht, inwieweit sich die zweite Datenreihe „mitsortiert“ hat
● Für jedes Datenpaar aus den beiden Datenreihen (yi, yj) mit i < j gilt:
● ist yi < yj, so ist das Paar konkordant (K)
● ist yi > yj, so ist das Paar diskordant (D)
● ist yi = yj, so liegt eine Bindung vor (wird nicht mitgezählt)
● Sind alle Paare entsprechend untersucht worden, wird gerechnet:
● Auch hier gilt, dass die Formel nur Bestand hat, wenn keine Bindungen auftreten
● Einige wenige Bindungen können aber ignoriert werden, da sie das Ergebnis kaum verzerren
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Die lineare Regression
● Die Regressionsanalyse ist das flexibelste und am häufigsten eingesetzte multivariate Analyseverfahren
● Untersucht wird die Beziehung zwischen einer abhängigen und einer unabhängigen Variablen
● Sie wird verwendet um:
● Zusammenhänge quantitativ darzustellen und zu erklären (Ursachenanalyse)
● Werte der abhängigen Variablen zu prognostizieren (Wirkungsprognose)
● Beispiel: Wie verändert sich die Absatzmenge (abhängige Variable) bei Veränderungen am Produktpreis, den Werbeausgaben
oder der Anzahl der öffentlichen Verkaufsveranstaltungen (unabhängige Variablen)?
● Ergebnis des Verfahrens ist die Regressionsfunktion:
● Y = f(X) > lineare Regression (eine abhängige und eine unabhängige Variable)
● Problemfall interdependente Beziehungen:
● Beeinflusst der Bekanntheitsgrad die Absatzmenge oder beeinflusst die Absatzmenge den Bekanntheitsgrad?
● Dieses System ist nicht in einer einzelnen Gleichung erfassbar, sondern nur im Mehrgleichungsmodell
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Schätzung der Regressionsfunktion
● Der Zusammenhang zwischen den beiden Variablen im Streudiagramm ist nicht perfekt
● Beide Variablen bewegen sich jedoch tendenziell in die gleiche Richtung, ein linearer Trend ist erkennbar
● Es kommen theoretisch mehrere Geraden in Frage um den Verlauf der Punkte nachzuzeichnen
● Entscheidende Frage: Welche der möglichen Geraden beschreibt den Zusammenhang am besten?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Methode der kleinsten Quadrate
● Minimierung der Summe der Abweichungsquadrate = Methode der kleinsten Quadrate
● Auch die Methode der kleinsten Quadrate arbeitet mit den senkrechten Abständen der realen Werte von der Gerade
● Die Abstände werden jedoch quadriert, so dass sämtliche negativen Vorzeichen wegfallen
● Eine Kompensation der positiven und negativen Abstände wird dadurch vermieden
● Es wird diejenige Gerade selektiert, bei der die Summe der quadrierten Abstände minimal ist
● Durch Umformung der Zielfunktion erhält man die Parameter der Regressionsfunktion:
● Regressionskoeffizient:
● Konstantes Glied/Konstante:
● Die Gleichung der Regressionsgeraden lautet dann:
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Bestimmtheitsmaß R²
Regressionsgerade
X
Y
Yi
Xi/Yi
_
Y
Y*
_
X Xi
{Nicht erklärte
Abweichung ei
{
Erklärte
Abweichung
}Gesamte
Abweichung
Residuum
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Bestimmtheitsmaß R²
● Die Regressionsgerade gibt Zusammenhänge, die nicht perfekt linear sind, nur imperfekt wieder
● Es ist daher mit der Regressionsfunktion nur selten möglich, alle Veränderungen in Y durch die Koeffizienten zu erklären
● In der Regel wird ein Teil der Veränderungen erklärt werden können, ein anderer Teil wird unaufgeklärt bleiben
● Das Verhältnis von erklärter Streuung zur Gesamtstreuung ist ein gutes Maß für die Güte des Regressionsmodells
● Residuen werden quadriert, damit sich positive und negative Abweichungen nicht aufheben
● Berechnung des Güßtemaßes R² mit:
● TSS = Total Sum of Squares = Summe aller quadrierten Abweichungen
● ESS = Explaines Sum of Squares = Summe aller erklärten quadrierten Abweichungen
● RSS = Residual Sum of Squares = Summe aller nicht erklärten quadrierten Abweichungen
● Die Relation zwischen erklärter Streuung und Gesamtstreuung wird mit R² bezeichnet:
● Der Wert von R² gibt den Anteil der erklärten Streuung an der Gesamtstreuung wieder > Güte der Anpassung
● R² ist als prozentualer Wert zu verstehen und liegt daher stets zwischen 0 und 1
● R² = 1 > Gesamte Streuung wird erklärt, es besteht ein perfekter linearer Zusammenhang
● Je kleiner R² ausfällt, desto mehr weicht der vorliegende Fall vom linearen Zusammenhang ab
● Beachte: R² ist lediglich ein Maß für den linearen Zusammenhang, nicht für andere Zusammenhänge
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einführung in die Ausreißeranalyse
● Bei einem Ausreißer handelt es sich um einen gemessenen oder erhobenen
Wert,der nicht den Erwartungen entspricht bzw. nicht zu den restlichen
Werten der Verteilung passt
● Es existiert keine klare Definition darüber, wann ein Wert als Ausreißer
bezeichnet werden kann- beim Box-Plot z.b. werden alle Werte außerhalb
des dreifachen IQR-Bereichs um den Median als Ausreißer klassifiziert
● Es gibt drei mögliche Ursachen für das Auftreten eines Ausreißers:
● Der Ausreißer wurde durch einen verfahrenstechnischen Fehler verursacht, beispielsweise einen Fehler bei der
Dateneingabe, beim Codieren der Daten oder einen technischen Ausfall bei der Datenerfassung bzw. -speicherung
● Der Ausreißer kennzeichnet einen außergewöhnlichen Wert, beispielsweise eine einzelne aus dem Rahmen fallende
Beobachtung (der einzige befragte Millionär), die sich aber erklären lässt – mitunter können solche Ausreißer auch
ein Hinweis darauf sein, dass die Befragung falsch angelegt wurde und daher nicht repräsentativ ist
● Der Ausreißer kennzeichnet einen korrekt erfassten außergewöhnlichen Wert, für den es keinerlei Erklärung gibt
● Generell ist zwischen normalen Ausreißen und multivariaten Ausreißern zu unterscheiden:
● „Normaler“ Ausreißer = außergewöhnlich großer oder kleiner Wert (persönliches Einkommen im Millionenbereich)
● Multivariarer Ausreißer = für sich betrachtet im normalen Bereich liegende Einzelwerte, die in ihrer Kombination
quer durch die Variablen einen einzigartigen Fall ergeben (86jährige Frau mit Internetanschluss)
● Die entscheidende Frage der Ausreißeranalyse lautet: Werden die Ausreißer beibehalten oder verworfen?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Der Leverage-Effekt
Auswirkung eines Ausreißers auf den
Verlauf einer lineare Regressionsgerade
Einzelne Ausreißer können die Regressionsgerade
zu sich „hinziehen“ und das Ergebnis einer linearen
Regressionsanalyse erheblich beeinflussen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Umgang mit Ausreißern
● Wie ist nun mit den gefundenen Ausreißern umzugehen?
● Generell gibt es drei Möglichkeiten:
● Ausschluss aus der Analyse
● Eingang in die Analyse
● Kennzeichnung als fehlende Werte
● Verschiedene Überlegungen sind für die Entscheidung von Bedeutung:
● Wie ist das Auftreten der Ausreißer zu erklären?
● Handelt es sich um Eingabefehler und ist es möglich, diese zu bereinigen?
● Was sagen die Werte über Anlage und Durchführung der Erhebung aus?
● Welche Auswirkungen haben die Ausreißer auf die Ergebnisse der Datenanalyse?
● Beeinflussen sie beispielsweise den Verlauf der Regressionsgraden? (Leverage-Effekt)
● Werden die Analyseergebnisse so stark verzerrt, dass die Ausreißer entfernt werden müssen?
● Welcher Datenverlust entsteht, wenn die Ausreißer aus dem Datensatz entfernt werden?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Identifikation von Ausreißern
● Wie lassen sich Ausreißer erkennen?
Unterscheidung in Ausreißer und
extreme Werte im Box-Plot
Grafische Identifikation
von Ausreißern im
Streudiagramm
Identifikation von
Ausreißern über die
Extremwerttabelle
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Identifikation von Ausreißern (2)
Grafiken > Galerie
Grafiken > Box-Plot
Analysieren
> Deskriptive Statistiken
> Explorative Datenanalyse
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Prüfung auf Normalverteilung
● Die Gauß- oder Normalverteilung ist die wichtigste kontinuierliche Wahrscheinlichkeitsverteilung
● Die zugehörige Dichtefunktion ist
als Gaußsche Glockenkurve bekannt
● Eigenschaften:
● Dichtefunktion ist
glockenförmig und
symmetrisch
● Erwartungswert, Median
und Modus sind gleich
● Zufallsvariable hat eine
unendliche Spannweite
● Viele statistische Verfahren setzen
die Normalverteilung der Daten
in der Grundgesamtheit voraus
● Es ist daher häufig zu prüfen,
ob von einer solchen Verteilung
ausgegangen werden kann
(auch näherungsweise)
µ
Erwartungswert
Median
Modus
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Dichtefunktion der Normalverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Histogramm mit NV-Kurve
● Grafische Analyse mit Histogramm und überlagerter Normalverteilungskurve
● Die Balken des Histogramms spiegeln die Breite
der Wertebereiche wieder – da zudem für leere
Wertebereiche ein Freiraum ausgegeben wird,
kommt im Histogramm die gesamte empirische
Verteilung der Variablen zum Ausdruck
● Dies ermöglicht den direkten Vergleich mit einer
eingezeichneten theoretischen Verteilung, wie
beispielsweise der Normalverteilung
● Der Grad der Abweichung einer Normalverteilung
lässt sich auch anhand verschiedener Maßzahlen wie
Exzeß (Kurtosis) und Schiefe bestimmen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Histogramm mit NV-Kurve erstellen
Grafiken > Galerie
Grafiken > Histogramme
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Kolmogorov-Smirnov-Test
● Die Prüfung auf Vorliegen einer Normalverteilung kann auch mit einem Anpassungstests erfolgen
● In SPSS lässt sich dazu beispielsweise der Kolmogorov-Smirnov-Anpassungstest nutzen
● Der Test arbeitet mit der kumulierten empirischen und der kumulierten erwarteten Referenzverteilung
● Die maximale Differenz zwischen beiden Verteilungen wird zur Berechnung der Prüfgröße Z nach Kolmogorov-Smirnov
verwendet, mit der dann aus einer Tabelle der für einen Stichprobenumfang n kritische Wert für die maximale Differenz
bei einem gegebenen Signifikanzniveau abgelesen werden kann
● Nullhypothese H0 des SPSS-Tests: die Werte der untersuchten Variablen sind normalverteilt
● Berechnet wird die Wahrscheinlichkeit, mit der das Zurückweisen dieser Hypothese falsch ist (Signifikanzwert)
● Je größer diese Wahrscheinlichkeit ausfällt, desto eher ist von einer Normalverteilung der Werte auszugehen
● Im nebenstehenden Beispiel eines
Kolmogorov-Smirnov-Tests fällt
der Signifikanzwert mit 0,00 so
niedrig aus, dass die Annahme der
Normalverteilung zurückzuweisen ist
● Bei der Interpretation ist zu beachten,
dass es sich um einen Test auf perfekte
Normalverteilung handelt
● Anzuraten ist daher die Kombination
mit einem der grafischen Prüfverfahren
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einen K-S-A durchführen
Analysieren > Nichtparametrische Tests > K-S bei einer Stichprobe
Wie ist dieser
Signifikanzwert
zu interpretieren?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Stufen eines statistischen Tests
I. Aufstellung von Nullhypothese und Alternativhypothese sowie
Festlegung des Signifikanzniveaus und Angabe der Parametermenge
II. Festlegung einer geeigneten Prüfgröße und Bestimmung der
Testverteilung unter Annahme der Gültigkeit der Nullhypothese
III. Bestimmung des kritischen Bereichs
(linksoffen, rechtsoffen oder beidseitig)
IV. Berechnung des Wertes der Prüfgröße
V. Entscheidung und Interpretation
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Die Bedeutung des Signifikanzwerts
● Der Signifikanzwert gibt die Wahrscheinlichkeit dafür an, dass das Zurückweisen einer Nullhypothese falsch ist
● Je größer dieser Wert also ausfällt, umso wahrscheinlicher ist es, dass ein Zurückweisen der H0 ein Irrtum wäre
● In SPSS werden die Ergebnisse aller statistischen Tests ausnahmslos über den Signifikanzwert ausgegeben
Großer Signifikanzwert = Nullhypothese nicht zurückweisen
Kleiner Signifikanzwert = Nullhypothese zurückweisen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Prüfung auf Homoskedastizität
● Viele statistische Verfahren setzen voraus, dass die Varianzen innerhalb verschiedener Fallgruppen gleich sind
(beispielsweise Signifikanztests und Mittelwertvergleiche)
● Gleichheit der Varianzen = Homoskedastizität
● Ungleichheit der Varianzen = Hetroskedastizität
● Mit dem Signifikanztest nach Levene wird die Nullhypothese H0 überprüft, dass die Varianzen in der
Grundgesamtheit in allen Gruppen homogen (gleich) sind
● Der Test arbeitet mit dem F-Wert als statistischem Prüfmaß mit bekannter Verteilung
● Es wird getestet, mit welcher Wahrscheinlichkeit die beobachteten Abweichungen in den Varianzen
auftreten können, wenn in der Grundgesamtheit absolute Varianzgleichheit herrscht
● Diese Wahrscheinlichkeit wird als Testergebnis ausgewiesen
● Eine geringe Wahrscheinlichkeit weist auf eine Varianzungleichheit hin
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Grafische Homoskedastizitätsprüfung
● Eine grafische Prüfung auf Homoskedastizität kann mit Streudiagrammen oder Boxplots durchgeführt werden
● Hierbei ist auf die unterschiedlichen Streuungen und die Höhe des Medians zu achten
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Binomialverteilung
● Grundlage der Binomialverteilung ist das Bernoulli-Experiment:
● Zwei Möglichkeiten: Das Ereignis tritt entweder ein oder nicht ein
● Wiederholungen der Experimente sind stets unabhängig voneinander
● Die Wahrscheinlichkeiten bleiben daher bei Wiederholungen gleich
● Wird ein Bernoulli-Experiment n mal mit einer gleichbleibenden Wahrscheinlichkeit p wiederholt, so ist die zugehörige
Zufallsvariable binomialverteilt mit den Parametern n und p (Kurzform: X ~ B (n,p))
● Diese konvergiert im Grenzfall (n gegen unendlich) gegen eine Normalverteilung (!)
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
Erwartungswert
Varianz
für x = 0,1,2,...,n
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Binomialverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Hypergeometrische Verteilung
● Auch die hypergeometrische Verteilung basiert auf dem n-fachen Experiment mit zwei Ausgängen (dichotom)
● Im Unterschied zur Binomialverteilung ändert sich jedoch hier die Wahrscheinlichkeit bei Wiederholungen
● Die einzelnen Experimente sind somit nicht mehr unabhängig voneinander, sondern miteinander verbunden
● Typisches Beispiel: Ziehen von schwarzen und weißen Kugeln aus einer Urne ohne Zurücklegen
● Eine Zufallsvariable X, die einen solchen wiederholungsabhängigen Zufallsprozess beschreibt bzw. darstellt, wird als mit den
Parametern N, M und n hypergeometrisch verteilt bezeichnet (Kurzform: X ~ H (N,M,n))
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
Erwartungswert
Varianz
für x=max(0,n-(N-M)),...,min(n,M)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Poissonverteilung
● Typisch für die Poisson-Verteilung ist die geringe Grundwahrscheinlichkeit der Ereignisse
● Die Verteilung wird daher auch als „Verteilung der seltenen Ereignisse“ bezeichnet
● Charakteristisch ist sie vor allem für zeitintervallgebundene Variablen
● Innerhalb eines längeren Zeitraums gibt es viele kleine Zeitintervalle
● In jedem dieser Zeitintervalle ist die Eintrittswahrscheinlichkeit gering
● Über den Gesamtzeitraum betrachtet ist sie dagegen wieder groß
● Eine solche Ereignisstruktur – sehr viele Einzelereignisse n mit jeweils einer sehr kleinen Eintrittswahrscheinlichkeit p – kann
durch eine Poisson-Verteilung wiedergegeben werden (Kurzform: X ~ Po (λ))
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
Erwartungswert
Varianz
für x = 0,1,2,...
für x = 0,1,2,...
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Poissonverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Stetige Gleichverteilung
● Bei der stetigen Gleichverteilung haben alle Realisationen einer Zufallsvariable in einem Intervall [a, b] die gleiche
Wahrscheinlichkeit einzutreffen (Kurzform: X ~ Re (a,b))
● Wegen der rechteckförmigen Dichtefunktion wird die Verteilung auch als Rechteckverteilung bezeichnet
Wahrscheinlichkeitsdichte
Verteilungsfunktion
Erwartungswert
Varianz
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Stetige Gleichverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Exponentialverteilung
● Die Exponentialverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung über die positiven reelen Zahlen
● Exponentialverteilungen werden auch als gedächnislose Verteilungen bezeichnet
● Ist bekannt, dass eine exponentialverteilte Zufallsvariable den Wert x überschreitet, dann ist die Wahrscheinlichkeit, dass der
Wert x um t überschritten wird genau so groß wie die, dass eine exponentialverteilte Zufallsvariable mit den gleichen
Parametern den Wert t überschreitet
● Die Exponentialverteilung ist die einzige stetige Verteilung mit dieser Eigenschaft
● Im diskreten Bereich gibt es die kaum verwendete geometrische Verteilung, die ebenfalls gedächnislos ist
Wahrscheinlichkeitsdichte
Verteilungsfunktion
Erwartungswert
Varianz
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Exponentialverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Exponentialverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Normalverteilung
● Die Gauß- oder Normalverteilung ist die wichtigste kontinuierliche Wahrscheinlichkeitsverteilung
● Die zugehörige Dichtefunktion ist
als Gaußsche Glockenkurve bekannt
● Eigenschaften:
● Dichtefunktion ist
glockenförmig und
symmetrisch
● Erwartungswert, Median
und Modus sind gleich
● Zufallsvariable hat eine
unendliche Spannweite
● Viele statistische Verfahren setzen
die Normalverteilung der Daten
in der Grundgesamtheit voraus
● Es ist daher häufig zu prüfen,
ob von einer solchen Verteilung
ausgegangen werden kann
(auch näherungsweise)
µ
Erwartungswert
Median
Modus
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Normalverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Verteilungstypen
Frage: Ist die Verteilung DISKRET oder STETIG?
Frage: Handelt es sich um
ein MOZ oder ein MMZ?
Frage: Handelt es sich um
eine NORMALVERTEILUNG?
DISKRET STETIG
MOZ MMZ NEIN JA
Bei allen diskreten Verteilungen sind die
Approximationsbedingungen zu prüfen!
Hypergeometrische
Verteilung
Binomialverteilung Stetige Gleichverteilung
oder
Exponentialverteilung
Normalverteilung
Standardnormalverteilung
Poissonverteilung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Approximationen
Binomialverteilung
Modell mit Zurücklegen
Hypergeometrische Verteilung
Modell ohne Zurücklegen
Poissonverteilung
„Verteilung seltener Ereignisse“
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Einige Konfidenzintervalle
Erwartungswert eines normalverteilten
Merkmals bei bekannter Varianz
Erwartungswert eines normalverteilten
Merkmals bei unbekannter Varianz
Erwartungswert eines unbekannt verteilten
Merkmals bei unbekannter Varianz
Varianz eines normalverteilten Merkmals
Anteilswert einer dichotomen Grund-
gesamtheit beim Modell mit Zurücklegen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Intervall um den Erwartungswert
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ein Konfidenzintervall berechnen
Analysieren > Deskriptive Statistiken > Explorative Datenanalyse
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Fälle sortieren
● Die Fälle in einer Datendatei lassen sich zur besseren Übersichtlichkeit sortieren
● Möglich ist das auf- und absteigende Sortieren anhand einer wie auch mehrerer Variablen
● Werden mehrere Variablen ausgewählt, wird zuerst nach der zuoberst stehenden Variablen sortiert
● Fälle, die in der ersten Variable identische Werte enhalten, werden anhand der folgenden Variablen sortiert usw.
Daten > Fälle sortieren
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Fälle auswählen
● Bisweilen ist es sinnvoll, lediglich bestimmte Fälle in die Auswertung einfließen zu lassen
● Hierfür lassen sich in SPSS einzelne Fälle anhand von logischen Statements auswählen
● Die Statements setzten sich aus den diversen logischen Operatoren zusammen
● Beispiel: Auswahl aller weiblichen Befragten mit einem Einkommen von mehr als 2000 €
● Es ergibt sich eine neue Filtervariable (filter_$), die ans Ende des Variablenfeldes gehängt wird
Daten > Fälle auswählen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Exkurs: Logische Operatoren
● Statements mit einem logischen UND sind stets dann
WAHR, wenn alle im Statement enthaltenen Befingungen
ebenfalls WAHR werden.
● In der in SPSS verwendeten Statement-Syntax wird das
logische UND durch das Symbol „&“ ausgedrückt
● Statements mit einem logischen ODER sind stets dann
WAHR, wenn mindestens eines der im Statement
enthaltenen Bedingungen ebenfalls WAHR wird.
● Die schließt verständlicherweise den Fall mit ein, dass
beide enthaltenen Bedingungen WAHR werden.
● In der in SPSS verwendeten Statement-Syntax wird das
logische ODER durch das Symbol „|“ ausgedrückt
● Durch das logische NICHT verkehrt sich die Bedeutung
jedes Statements in das jeweilige Gegenteil
● In der in SPSS verwendeten Statement-Syntax wird das
logische NICHT durch das Symbol „~“ ausgedrückt
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Exkurs: Logische Operatoren (2)
● Zur Verdeutlichung noch einige Beispiele der zur Statement-Bildung mit logischen Operatoren
● Beispiel: Auswahl aller weiblichen Befragten
● Statement: Geschlecht = „weiblich“
● SPSS-Syntax: geschl = 2
● Beispiel: Auswahl aller Befragten mit einem Einkommen von unter 3000 €
● Statement: Einkommen < 3000 €
● SPSS-Syntax: einkom < 3000
● Beispiel: Auswahl aller weiblichen Befragten mit einem Einkommen von mehr als 2000 €
● Statement: Geschlecht = „weiblich“ UND Einkommen > 2000 €
● SPSS-Syntax: geschl = 2 & einkom > 2000
● Beispiel: Auswahl aller Befragten, die männlich sind oder ein Einkommen von mehr als 1500 € haben
● Statement: Geschlecht = „männlich“ ODER Einkommen > 1500 €
● SPSS-Syntax: geschl = 1 | einkom > 1500
● Männliche Befragte mit einem Einkommen von mehr als 1500 € werden hier nicht doppelt selektiert (!)
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Fälle auswählen (2)
● Neben der Auswahl mittels logischer Statements gibt es noch weitere Auswahlverfahren
● Auswahl nach Zeitintervall
● Sind die Fälle z.B. mit einem Datumsstempel versehen, kann ein Zeitintervall selektiert werden
● Ziehung einer Zufallsstichprobe
● Aus der Grundgesamtheit aller erfassten Fälle lässt sich auch eine Zufallsstichprobe ziehen
Daten > Fälle auswählen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Fälle gewichten
● Unter bestimmten Umständen ist eine Gewichtung der Fälle sinnvoll
● Beispiel: Online-Befragung zum Thema Internetsucht (Hahn & Jerusalem)
● Es besteht ein starker Zusammenhang zwischen Suchtgefahr und Lebensalter bzw. Geschlecht
● Besonders internetsuchtgefährdet sind demnach junge Männer unter 20 Jahren
● Befinden sich zuviele junge Männer in der Stichprobe, wird das Gesamtproblem überschätzt
● Junge Männer kommen in der Stichprobe doppelt so häufig vor wie in der Grundgesamtheit
● Ältere Frauen sind dagegen in der Stichprobe sehr stark unterrepräsentiert
● Den sich hieraus ergebenden Verzerrungen kann durch eine Gewichtung entgegengewirkt werden
● So werden junge Männer beispielsweise mit dem Faktor 0,5 gewichtet, ältere Frauen mit dem Faktor 2
● Die geschätzte Zahl der Internetsüchtigen unter allen Nutzern reduziert sich dadurch auf 2,7%
● Vorsicht: Es besteht die Gefahr, systematische Verzerrungen durch die Gewichtung zu verstärken
● Beispiel: Über 70-jährige sind bei Online-Befragungen ebenfalls sehr selten vertreten
● Inwiefern ist es vertretbar, die wenigen (seltsamen) Probanden stark überzugewichten?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Variablen umkodieren
● Um eine Gewichtung durchführen zu
können, ist eine Gewichtungs-Variable
erforderlich
● Im vorliegenden Fall sollen alle
männlichen Befragten mit 50%, alle
weiblichen Befragten mit 200% gewichtet
werden
● Es wird eine neue Variable erstellt, die für
jeden männlichen Befragten den Wert 0,5
und für jeden weiblichen Befragten den
Wert 2 annimmt
● Die Funktion „umkodieren“ kann auch für
andere Zwecke eingesetzt werden,
beispielsweise für die Datenklassierung
Transformieren
> Umkodieren
> in andere Variablen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Fälle gewichten (2)
Daten > Fälle gewichten
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Arbeit mit Dummy-Variablen
● Für viele Analyseverfahren wird ein metrisches Skalenniveau vorausgesetzt (z.B. Multiple Regression)
● Sollen nominalskalierte Daten in ein solches Verfahren einfließen, müssen Dummy-Variablen gebildet werden
● Dummy-Variablen sind binäre Variablen, die nur die Werte 0 und 1 annehmen können
● Eine dichotome Variable lässt sich durch Transformation in eine Dummy-Variable überführen
● 0 = Ausprägung liegt nicht vor
● 1 = Ausprägung liegt vor
● Beispiel: Untersuchung der Einflüsse von Verpackungseigenschaften auf das Kaufverhalten
● Dummy-Variable q1 nimmt für rote Verpackungen den Wert 1, für nicht-rote Verpackungen den Wert 0 an
● Analog dazu lässt sich auch eine Dummy-Variable q2 für die Farbe Gelb und q3 für die Farbe Grün definieren
● Existieren nur diese drei Verpackungsfarben kann auf q3 aber verzichtet werden, da:
● Wenn q1 = 0 und q2 = 0 muss q3 = 1 gelten
● Drei Farben lassen sich daher über nur zwei Dummy-Variablen beschreiben
● Generelle Regel: Eine nominale Variable mit n Ausprägungen lässt sich in n-1 Dummy-Variablen abbilden
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Das Problem der fehlenden Daten
● Unter fehlenden Daten sind einzelne fehlende Werte zu verstehen
● Typische fehlende Werte bei Personenbefragungen:
● Angaben zum Einkommen
● Angaben zum eigenen Körper
● Angaben zum Sexualverhalten
● Fehlende Werte sind ein Problem, wenn ein Zusammenhang zwischen der Wahrscheinlichkeit des Fehlens
und einem anderen Sachverhalt zu vermuten ist, die Verteilung der fehlenden Werte also nicht zufällig ist
● Beispiel: Kommt es bei der Frage nach dem Einkommen tendenziell eher zu Auskunftsverweigerungen
bei Personen mit niedrigem Einkommen, so wird dies das erhobene Durchschnittseinkommen verzerren
● Bei der Untersuchung fehlender Daten ist daher vor allem zu klären:
● Fehlen so viele Werte, dass eine sinnvolle Auswertung des Datensatzes unmöglich ist?
● Sind die fehlenden Werte zufällig im Datensatz gestreut oder lässt sich ein Muster identifizieren?
● Generell bieten sich drei Möglichkeiten des Umgangs mit fehlenden Daten an:
● Es werden ausschließlich die vollständigen Fälle zur weiteren Auswertung zugelassen
● Einzelne Fälle oder einzelne Variablen werden von der weiteren Auswertung ausgeschlossen
● Die fehlenden Werte werden induktiv oder statistisch ersetzt
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ursachen für fehlende Daten
● Das Fehlen von Daten kann auf vier Ursachen zurückgeführt werden:
● Dateneingabefehler (z.B. Buchstaben in einem Zahlenfeld)
● Codierungs- und Übertragungsfehler während Eingabe oder Speicherung
● Ungenaue Datenfelder bei der Erhebung (z.B. „Studienrichtung“ bei einer Befragung von Nicht-Akademikern)
● Aktionen des Befragten, beispielsweise Vergessen der Angaben, widersinnige Angaben (höchster Schulabschluss
ist die Mittlere Reife, trotzdem wurde eine Abiturnote eingetragen), Nichtauskunftsfähigkeit oder bewusste
Entscheidung eine bestimmte Frage nicht zu beantworten (Einkommen, Körper, Sexualverhalten...)
● Fehlende Werte sind bei der Arbeit mit empirischen Daten keine Ausnahme, sondern die Regel
● Die Wahrscheinlichkeit für das Auftreten fehlender Werte steigt im Allgemeinen mit der Größe des Datensatzes
● Bei der Analyse langer Zeitreihen, z.B. der Auswertung der Niederschlagsmengen der letzten 200 Jahre, werden
aufgrund von Katastrophen, Krieg oder anderen Gründen immer wieder einzelne Werte nicht erfasst worden sein
● Gerade in der sozialwissenschaftlichen Forschung und bei der Marktforschung im Zuge der Befragung von
hunderten oder tausenden Personen kommt es aufgrund verschiedenster Ursachen häufig zu Einzelausfällen
Mit fehlenden Daten ist bei jeder marktforscherischen Untersuchung zu rechnen!
Das Problem der fehlenden Daten sollte vom Marktforscher nicht einfach ignoriert werden!
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zufälligkeitsgrade
● Man unterscheidet in drei Zufälligkeitsgrade bezüglich des Auftretens fehlender Daten: MCAR, MAR und NRM
● Der Zufälligkeitsgrad entscheidet, ob fehlende Werte ausgeschlossen oder ersetzt werden können
● MCAR = missing completely at random
● Fehlende Werte treten vollkommen zufällig auf
● Die Wahrscheinlichkeit des Fehlen eines Wertes steht nicht in Zusammenhang mit anderen Größen
● Es ist kein Zusammenhang zwischen dem Auftreten von fehlenden Werten der Variable Y und der Variable Y selbst
(niedrige Einkommen werden tendenziell nicht angegeben) oder eine Korrelation mit einer anderen Variable X (Frauen sind
tendenziell weniger bereit, Auskünfte über ihr Körpergewicht zu machen) feststellbar
● MAR = missing at random
● Das Auftreten von fehlenden Werten steht (teilweise) in Zusammenhang mit einer anderen erhobenen Variablen
● Es ist kein Zusammenhang zwischen dem Auftreten von fehlenden Werten der Variable Y und der Variable Y selbst
feststellbar, aber eine (schwache) Korrelation des Auftretens von fehlenden Y-Werten mit einer anderen Variable X
● NRM = nonrandom missing
● Das Auftreten von fehlenden Werten folgt klaren Gesetzmäßigkeiten, Zufälligkeit ist auszuschließen
● Es kann entweder ein Zusammenhang zwischen dem Auftreten von fehlenden Werten der Variable Y und der Variable Y
selbst oder mit einer anderen Variable X oder auch beides vorliegen, d.h. das Auftreten eines fehlenden Wertes kann
vollständig durch eine andere Variable oder die Variable selbst erklärt werden
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Umgang mit fehlenden Daten
● Welche der drei Methoden angewandt werden kann, hängt wesentlich vom Zufälligkeitsgrad ab
● CCA = complete case approach
● Es werden ausschließlich vollständige Fälle für die weitere Analyse verwendet
● Alle Fälle mit auch nur einem fehlenden Wert werden aus dem Datensatz entfernt
● Die Methode kann nur bei zufällig fehlenden Daten (MCAR) angewendet werden
● Günstig ist sie bei einer großen Stichprobe, da die gelöschten Fälle hier unkritisch sind
● Ausschluss von Fällen oder Variablen
● Ziel ist die Verringerung des Gesamtanteils fehlender Werte
● Abwägen zwischen dem Datenverlust und der Reduktion der Probleme durch fehlende Werte
● Günstigste Methode für nicht zufällig auftretende fehlende Werte (MAR, NRM)
● Der Ausschluss von Fällen kann fallweise oder paarweise erfolgen
● Ersetzen fehlender Werte
● Grundidee: metrische Daten (ausschließlich!) lassen sich ersetzen, wenn Regelmäßigkeiten erkennbar sind
● Möglich ist der Ersatz über verschiedene induktive (nichtmathematische) und statistische (mathematische) Verfahren
● Die Gefahr besteht darin, dass man den Datensatz für vollständig hält bzw. durch die Ersetzungen verzerrt
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ausschlussverfahren
● Fallweiser Ausschluss:
● Fehlt ein einzelner Wert, wird der komplette Fall von der weiteren Analyse ausgeschlossen
● Vorteil: bestimmte Arten von Asymmetrien werden vermieden, da keine Teilfälle in die Analyse eingehen
● Nachteil: relevantes Datenmaterial geht verloren, der Stichprobenumfang sinkt mit jedem Ausschluss
● Paarweiser Ausschluss:
● Fehlen einzelne Werte, wird mit den restlichen Werten des Falles weitergearbeitet
● Vorteil: alle Fälle bleiben erhalten, der Stichprobenumfang verändert sich nicht
● Nachteil: bei multivariaten Analysen bilden u.U. unterschiedlich große Datensätze die Berechnungsgrundlage
● Um Fälle zu vermeiden, bei denen auf unterschiedlich große Datensätze zurückgegriffen und gleichzeitig verglichen wird, ist
der fallweise Ausschluss das weitaus häufiger verwendete Ausschlussverfahren
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ersatzwertverfahren
● Induktive Verfahren:
● Die fehlenden Werte werden auf der Basis von Informationen ersetzt, die über die Stichprobe vorliegen
● Nachbeobachtungen: zusätzliche Beobachtungen / Befragungen werden angestellt (Repräsentativität?)
● Externe Konstanten: konstanter Wert aus externer Quelle oder früherer Studie wird ersatzweise verwendet
● Statistische Verfahren:
● Metrische fehlende Werte können aus der Stichprobe geschätzt werden (Voraussetzung ist MCAR)
● Mittelwertersatz: ein fehlender Wert einer Variable wird durch den Mittelwert dieser Variablen ersetzt
● Formen des Mittelwertersatzes: Mittel / Median der Nachbarpunkte, Zeitreihen-Mittelwert & lineare Interpolation
● Vorteil: die Verfahren sind leicht anzuwenden, benötigt werden lediglich die entsprechenden Mittelwerte
● Nachteil: die Varianz, die Verteilung der Daten und eventuelle Korrelationen werden verzerrt
● Linearer Trend: ein fehlender Wert einer Variablen wird durch den linearen Trendwert für diese Variable ersetzt
● Voraussetzung: für die gültigen Werte lässt sich ein sinnvoller linearer Trend ermitteln
● Fehlende Werte können dann durch die Werte der Trendgraden an der betreffenden Stelle ersetzt werden
● Nachteil: der lineare Trend in den Variablen wird verstärkt, die Varianz der Verteilung verringert sich
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Der Wahrscheinlichkeitsbegriff
● Ein Zufallsvorgang ist ein Vorgang, der in einem von mehreren möglichen Ereignissen endet
● Diese Ereignisse schließen sich gegenseitig aus, d.h. es kann nur eines der Ereignisse eintreten
● Welches Ereignis eingetreten ist, kann erst nach Ende des Zufallsvorgangs festgestellt werden
● Typische Beispiele: Münzwurf, Ziehung der Lottozahlen, Ziehen von Kugeln aus einem Behälter
● Der klassische Begriff der Wahrscheinlichkeit geht auf Laplace zurück:
● Beispiel: Wahrscheinlichkeit beim einmaligen Würfeln eine 3 zu erhalten:
● Für das Rechnen mit Wahrscheinlichkeiten gelten die Axiome von Kolmogoroff (1933)
● Die Axiome schaffen eine mathematische Basis für das Rechnen mit Wahrscheinlichkeiten
● Axiom 1: Die Wahrscheinlichkeit eines Ereignisses A eines Zufallsvorgangs ist
eine nichtnegative reelle Zahl
● Axiom 2: Die Wahrscheinlichkeiten aller möglichen Elementarereignisse eines
Zufallsvorgangs ergeben zusammen den Wert 1
● Axiom 3: Die Wahrscheinlichkeit der Vereinigungsvorgänge zweier oder mehrerer
Ereignisse eines Zufallsvorgangs ergeben sich aus der Summe der
Einzelwahrscheinlichkeiten der Ereignisse, wenn die Ereignisse
disjunkt sind, d.h. sich (paarweise) gegenseitig ausschließen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Ablaufdiagramm: Dreifacher Münzwurf
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Das Taxi-Problem
● In einer Stadt sind zwei Taxiunternehmen tätig
● Unternehmen A verfügt über grüne Taxis und hat einen Marktanteil von 85%
● Unternehmen B verfügt über blaue Taxis und hat einen Marktanteil von 15%
● Es kommt zu einem Unfall mit Fahrerflucht, wobei ein Zeuge ein blaues Taxi erkennt
● Es stellt sich die Frage, inwieweit der Zeuge die Farbe zuverlässig bestimmen kann
● Vor Gericht muss er sich daher einem Farbidentifikationstest unterziehen
● Er ordnet in 80% aller Fälle die Farbe richtig zu und irrt sich in 20% der Fälle
● Bedeutet dies, dass er der Unfallwagen mit 80% Wahrscheinlichkeit richtig erkannt hat?
● Nein, denn die Baisisrate (a priori-Wahrscheinlichkeit) wurde außer Acht gelassen
● Es muss bedacht werden, dass wesentlich weniger blaue als grüne Taxis unterwegs sind
● Darum: Rechnung mit dem Satz von Bayes:
● Trotz der guten Sehkraft des Zeugen, ist seine Trefferwahrscheinlichkeit geringer als 50/50!
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Kombinatorik
● Um Wahrscheinlichkeiten nach Laplace zu berechnen, muss die Anzahl der Elementarereignisse bekannt sein
● Wie viele Möglichkeiten gibt es, die n Elemente eines Zufallsexperiments anzuordnen? (Permutationen)
● Wie viele Möglichkeiten gibt es, k Elemente aus den n Elementen auszuwählen? (Variationen, Kombinationen)
● Permutationen
● Alle möglichen Elemente sollen im Ergebnis vorkommen (Frage nach der Reihenfolge)
● Es wird in Permutationen mit und ohne Wiederholung von Elementen unterschieden
● Beispiele: Anordnung von Symbolen bei einem Sehtest, Anordnung von Fragen auf einem Fragebogen
● Variationen
● Es sollen nicht alle Elemente im Ergebnis vorkommen, die Reihenfolge spielt keine Rolle
● Es wird in Variationen mit und ohne Wiederholung von Elementen unterschieden
● Beispiele: Ziehung von schwarzen und weißen Kugeln, Ziehung der Lottozahlen
● Kombinationen
● Es sollen nicht alle Elemente im Ergebnis vorkommen, die Reihenfolge spielt eine Rolle
● Es wird in Kombinationen mit und ohne Wiederholung von Elementen unterschieden
● Beispiele: Passwort aus Buchstaben und Ziffern, Plazierungen bei einem Pferderennen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Kombinatorik
Frage: Sollen im Ergebnis ALLE Elemente vorkommen?
Frage: Können sich die Elemente
auch WIEDERHOLEN?
Frage: Spielt die REIHENFOLGE
eine Rolle?
Frage: Können sich die Elemente
auch WIEDERHOLEN?
Frage: Können sich die Elemente
auch WIEDERHOLEN?
JA NEIN
JA
JA
JA
JA
NEIN
NEIN NEIN
NEIN
Permutation mit
Wiederholung
Permutation ohne
Wiederholung
Variation mit
Wiederholung
Kombination mit
Wiederholung
Variation ohne
Wiederholung
Variation ohne
Wiederholung
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Weitere Statistik-Software
● Das Statistiklabor
● Kostenfreie SPSS-ähnliche Software
● Entwickelt von der Freien Universität Berlin
● Basiert auf der statistischen Programmiersprache R
● Um eigene in R geschriebene Programme erweiterbar
● Auch für den kommerziellen Einsatz freie Software
● Homepage: http://www.statistiklabor.de
● SAS
● Weltweit nach SPSS meistgenutzte Statistik-Software
● Software in C und Java kann eingebunden werden
● Homepage: http://www.sas.com/offices/europe/germany
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Empfohlene Literatur
SPSS 14
Felix Brosius
Mitp-Verlag
ISBN: 3826616340
SPSS-Programmierung
Felix Brosius
Mitp-Verlag
ISBN: 3826614151
SDA mit SPSS
Janssen & Laatz
Springer-Verlag
ISBN: 3540239308
Statistik mit SPSS
Diel & Staufenbiel
Verlag Dietmar Klotz
ISBN: 3880744610
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Was ist Statistik?
Statistical thinking will one day be as necessary for efficient
citizenship as the ability to read or write.
- H.G. Welles
If your experiment needs statistics, you ought to have done a better experiment.
- Ernest Rutherford
Statistics are like bikinis. What they reveal is suggestive, but
what they conceal is vital.
- Aaron Levenstein
It is easy to lie with statistics. It is hard to tell the truth without it.
- Andrejs Dunkels
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Fragebögen, Interviews, Diskussionen
● Grundlagen der Fragebogengestaltung
● Welche Fragetypen gibt es?
● Wie lassen sich Fragen eindeutig formulieren?
● Wie viele Fragen darf ein Fragebogen enthalten?
● Durchführung von Interviews
● Was für Interviewtypen gibt es?
● Wie arbeiten geschulte Interviewer?
● Wie werden Interviews ausgewertet?
● Wie kommt es zu Interviewereffekten?
● Durchführung von Gruppendiskussionen
● Welche Formen der Gruppendiskussion gibt es?
● Welche Vorteile haben Gruppendiskussionen?
● Welche Aufgaben kommen dem Moderator zu?
● Welche Probleme können in Gruppen auftreten?
● Wie werden Gruppendiskussionen ausgewertet?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Online-Marktforschung
● Teilnehmerrekrutierung
● Aktive und passive Rekrutierung
● Selbstselektion und Repräsentativität
● Teilnehmeransprache
● Formen der Teilnehmeransprache
● Online-Marktforschung und Spamproblematik
● Teilnehmermotivation
● Strategien zur Teilnehmermotivation
● Monetäre und nicht-monetäre Incentives
● Teilnehmerkontrolle
● Mehrfachteilnahmen und Incentivejäger
● Kontrolle vor, während und nach der Befragung
● Technische Umsetzung eines Fragebogens in HTML
● Probleme durch die Überschneidung Marktforschung/Marketing
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Explorative Datenanalyse
● Wir unterscheiden in...
● Deskriptive Statistik (Beschreibung und Visualisierung der Daten)
● Explorative Statistik (Suchen nach Strukturen und Auffälligkeiten)
● Induktive Statistik (Testen von Hypothesen und Schätzen von Parametern)
● Fragestellung: Was ist an der Verteilung eines Merkmals bemerkenswert?
● Was gehört zur explorativen Datenanalyse?
● Berechnung statistischer Maßzahlen
● Darstellung absoluter und relativer Häufigkeiten
● Visualisierung diskreter und stetiger Variablen
● Analyse von Ausreißern
● Analyse fehlender Daten
● Transformation von Daten
● Erstellung von Dummy-Variablen
● Prüfung der Voraussetzungen für weiterführende Analysemethoden
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Multiple Regression
● Vielseitiges, strukturprüfendes und am häufigsten eingesetztes multivariates Analyseverfahren
● Ziel: Analyse von Beziehungen zwischen einer abhängigen Variablen und einer (univariater Fall)
oder mehreren (multivariater Fall) unabhängigen Variablen
● Anwendung: Beschreibung und Erklärung von Zusammenhängen und Durchführung von Prognosen
● Beispiel: Hängt die Absatzmenge eines bestimmten Produktes von den Ausgaben für die Qualitätssicherung,
den Ausgaben für die Werbung oder bzw. und der Anzahl der Verkaufsstellen ab?
● Wenn ja, wie stark fallen die jeweiligen Zusammenhänge aus? Wie wird sich die Absatzmenge entwickeln,
wenn bestimmte Ausgaben erhöht oder gesenkt werden?
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Varianzanalyse
● Die Varianzanalyse gehört wie die Regressionsanalyse zu den strukturprüfenden Verfahren und dient der Feststellung von
Mittelwertunterschieden zwischen zwei oder mehr Gruppen von Merkmalsträgern
● Mathematisches Prinzip der Varianzanalyse:
● Es wird getestet, ob die Varianz zwischen den Gruppen größer ist als innerhalb der Gruppen
● Das Ergebnis ermöglicht eine Aussage darüber, ob sich die Gruppen bezüglich der (abhängigen) Variablen signifikant
voneinander unterscheiden, bzw. ob die Einteilung in Gruppen anhand der (unabhängigen) Variablen gerechtfertigt ist
● Um eine Varianzanalyse durchführen zu können, muss im Vorfeld bekannt sein, welches die abhängige und welches die
unabhängigen Variablen in einem Modell sind – daher wird sie auch als ein strukturprüfendes Verfahren bezeichnet
● Unterscheidung in ANOVA – Analysis of Variance (nur eine unabhängige Variable) und MANOVA – Multivariate Analysis of
Variance (mindestens zwei unabhängige Variablen)
ONEWAY ANOVA
ozon
17267,908 195 88,553 3,084 ,000
7338,670 1 7338,670 255,590 ,000
9929,238 194 51,182 1,783 ,000
3847,498 134 28,713
21115,406 329
(Kombiniert)
Gewichtet
Abweichung
Linearer
Term
Zwischen den
Gruppen
Innerhalb der Gruppen
Gesamt
Quadrats
umme df
Mittel der
Quadrate F Signifikanz
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Faktorenanalyse
● In der Marktforschung hat man es häufig mit komplexen Begriffen und Sachverhalten zu tun
● Begriffe wie „Nutzen“ oder „Qualität“ lassen sich nicht durch eine einzige Variable ausdrücken
● Um beispielsweise die Qualität abzubilden, wird ein ganzes Bündel von Variablen benötigt:
● Haltbarkeit, Preis-Leistungs-Verhältnis, Zuverlässigkeit, Zufriedenheit...
● Ziel: Reduktion von vielen Variablen auf komplexere Hintergrundvariablen
● Die Faktorenanalyse wird daher auch als dimensionsreduzierendes Verfahren bezeichnet
Produktqualität
Haltbarkeit P-L-V
Sicherheit Zufriedenheit
Lieferzeit
Bestellservice
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Clusteranalyse
● Die Clusteranalyse gehört zu den strukturen-entdeckenden Verfahren
● Ziel: Zusammenfassen von Objekten zu Gruppen (Clustern), innerhalb derer sich möglichst ähnliche Objekte
befinden, während zwischen den Gruppen die Ähnlichkeiten möglichst gering sein sollen (homogen <> heterogen)
● Beispiele: Finden von Persönlichkeitstypengruppen anhand verschiedener psychografischer Merkmale oder
Finden von Käufergruppen anhand von Variablen, die Nachfrage- und Kaufverhalten charakterisieren
● Problemstellung: Wie lässt sich bestimmen, welche Objekte einander ähnlich sind?
Zuordnungsübersicht
25 26 1,000 0 0 20
23 24 1,000 0 0 18
21 22 1,000 0 0 13
19 20 1,000 0 0 13
17 18 1,000 0 0 14
15 16 1,000 0 0 15
12 14 1,000 0 0 18
10 13 1,000 0 0 16
3 11 1,000 0 0 17
8 9 1,000 0 0 14
5 6 1,000 0 0 19
1 4 1,000 0 0 21
19 21 1,500 4 3 23
8 17 1,500 10 5 19
7 15 1,500 0 6 20
2 10 1,500 0 8 17
2 3 1,833 16 9 21
12 23 2,000 7 2 22
5 8 2,000 11 14 22
7 25 3,167 15 1 24
1 2 3,300 12 17 23
5 12 3,583 19 18 25
1 19 4,286 21 13 24
1 7 5,182 23 20 25
1 5 6,338 24 22 0
Schritt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Cluster 1 Cluster 2
Zusammengeführte
Cluster
Koeffizienten Cluster 1 Cluster 2
Erstes Vorkommen
des Clusters Nächster
Schritt
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Korrespondenzanalyse
● Auch die Korrespondenzanalyse gehört zu den strukturen-entdeckenden Verfahren
● Ziel: Visualisierung von Datentabellen > Veranschaulichung komplexer Daten und Zusammenhänge
● Verfahren der multidimensionalen Skalierung von nominalskalierten Variablen
● Darstellung der Zeilen und Spalten einer zweidimensionalen Kreuztabelle in einem gemeinsamen Raum
● Beispiel: Kunden werden gebeten, Merkmale wieWirkung
und Bekanntheit bestimmten Medikamenten zuzuordnen
● Die Ergebnisse werden in einer Kontingenztabelle erfasst,
sind aber in dieser Darstellungsform schlecht interpretierbar
● Mit Hilfe der Kontingenzanalyse lassen sich Medikamente und
Merkmale aber grafisch in einem gemeinsamen Raum darstellen
● Dieser grafischen Darstellung (Bi-Plot) lässt sich dann entnehmen,
wie die Medikamente (relativ zueinander) bezüglichder abgefragten
Merkmale beurteilt werden
● Bi-Plots erfreuen sich in der Praxis großer Beliebtheit, sind
aber nicht immer sinnvoll interpretierbar
● Ihre Gefahr liegt in ihrer Übersichtlichkeit, wegen der sie auch
dort zum Einsatz kommen, wo methodische Voraussetzungen fehlen
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Answer-Tree-Verfahren
● Bei Answer-Tree handelt es sich um ein SPSS-Zusatzmodul
● Mit diesem lässt sich eine Population über ein baumartiges Klassifikationssystem in Teilpopulationen unterteilen
● Das Ausgangsmodell besteht aus:
● einer abhängigen (Ziel-)Variablen (beispielsweise Käufer oder Nichtkäufer eines bestimmten Produktes)
● und verschiedenen unabhängigen (Prediktor-)Variablen (beispielsweise Geschlecht, Alter, Familienstand etc.)
● Anhand der Prediktor-Variablen soll die Population so aufgeteilt werden, dass sich die entstehenden Teilpopulationen
bezüglich der Ziel-Variablen signifikant voneinander unterscheiden
● Das Ergebnis kann im Beispiel dazu verwendet werden, die wahrscheinlichsten Käufergruppen zu identifizieren
● Welche Bücher sollten Sie kennen?
● Brosius, F.: SPSS 11, Bonn, mitp-Verlag, 2002
● Bleymüller, J.; Gehlert, G. & Gülicher, H.: Statistik für Wirtschaftswissenschaftler, München, Verlag Vahlen, 2000
● Fahrmeir, L.; Künstler, R.; Pigeot, I. & Tutz, G.: Statistik – Der Weg zur Datenanalyse, Berlin, Springer, 1999
● Hair, J.F.; Anderson, R.E.; Tatham, R.L. & Black, W.C.: Multivariate Data Analysis, New Jersey, Prentice Hall, 1998
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zur Vorbereitung empfohlen....
http://www.lulu.com/content/458434/
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Zur Vorbereitung empfohlen....
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Marktforschungs-Wiki
http://marktforschung.wikia.com
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Marktforschungs-Wiki
http://statistikberatung.blogspot.com
Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth
Gibt es noch Fragen?

Weitere ähnliche Inhalte

Ähnlich wie SPSS-Kurs

eoda R-Akademie 2014
eoda R-Akademie 2014 eoda R-Akademie 2014
eoda R-Akademie 2014 eoda GmbH
 
Learning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer TestsLearning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer Testsi_dahn
 
eoda R-Akademie 2015_Kursprogramm
eoda R-Akademie 2015_Kursprogrammeoda R-Akademie 2015_Kursprogramm
eoda R-Akademie 2015_Kursprogrammeoda GmbH
 
Social Media Monitoring für Information Professionals
Social Media Monitoring für Information ProfessionalsSocial Media Monitoring für Information Professionals
Social Media Monitoring für Information ProfessionalsDIE DIGITALE GmbH
 
Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...
Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...
Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...CONOGY GmbH
 
Market Research Meets Business Intelligence
Market Research Meets Business IntelligenceMarket Research Meets Business Intelligence
Market Research Meets Business IntelligenceDataLion
 
Management- und Brancheninformationssysteme
Management- und BrancheninformationssystemeManagement- und Brancheninformationssysteme
Management- und BrancheninformationssystemeChristian Reinboth
 
Information Training Strategische_Marktanalyse 2014
Information Training Strategische_Marktanalyse 2014Information Training Strategische_Marktanalyse 2014
Information Training Strategische_Marktanalyse 2014Matthias_Meyer
 
infonitor Medienanalyse Booklet 2010
infonitor Medienanalyse Booklet 2010infonitor Medienanalyse Booklet 2010
infonitor Medienanalyse Booklet 2010infonitor
 
Content-Marketing im B2B
Content-Marketing im B2B Content-Marketing im B2B
Content-Marketing im B2B Lupus Labs
 
Marktforschung mit einfachen Mitteln
Marktforschung mit einfachen MittelnMarktforschung mit einfachen Mitteln
Marktforschung mit einfachen MittelnJörg Hoewner
 
Social Media Monitoring – Tools und Services
Social Media Monitoring – Tools und ServicesSocial Media Monitoring – Tools und Services
Social Media Monitoring – Tools und ServicesDIE DIGITALE GmbH
 
Vortrag roland fiege tweetakademie ma 2010
Vortrag roland fiege   tweetakademie ma 2010Vortrag roland fiege   tweetakademie ma 2010
Vortrag roland fiege tweetakademie ma 2010Michael Gebert
 
Pfarrbrief-Umfrage 2014
Pfarrbrief-Umfrage 2014Pfarrbrief-Umfrage 2014
Pfarrbrief-Umfrage 2014Georg Frericks
 
Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...
Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...
Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...Thilo Stadelmann
 

Ähnlich wie SPSS-Kurs (20)

eoda R-Akademie 2014
eoda R-Akademie 2014 eoda R-Akademie 2014
eoda R-Akademie 2014
 
Tekom jt 2012 schaffner sturz workshop kennzahlen
Tekom jt 2012 schaffner sturz   workshop kennzahlenTekom jt 2012 schaffner sturz   workshop kennzahlen
Tekom jt 2012 schaffner sturz workshop kennzahlen
 
Learning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer TestsLearning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer Tests
 
Marketing Alexander Ojeda Moreno
Marketing Alexander Ojeda MorenoMarketing Alexander Ojeda Moreno
Marketing Alexander Ojeda Moreno
 
eoda R-Akademie 2015_Kursprogramm
eoda R-Akademie 2015_Kursprogrammeoda R-Akademie 2015_Kursprogramm
eoda R-Akademie 2015_Kursprogramm
 
Social Media Monitoring für Information Professionals
Social Media Monitoring für Information ProfessionalsSocial Media Monitoring für Information Professionals
Social Media Monitoring für Information Professionals
 
Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...
Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...
Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predic...
 
Market Research Meets Business Intelligence
Market Research Meets Business IntelligenceMarket Research Meets Business Intelligence
Market Research Meets Business Intelligence
 
Management- und Brancheninformationssysteme
Management- und BrancheninformationssystemeManagement- und Brancheninformationssysteme
Management- und Brancheninformationssysteme
 
Information Training Strategische_Marktanalyse 2014
Information Training Strategische_Marktanalyse 2014Information Training Strategische_Marktanalyse 2014
Information Training Strategische_Marktanalyse 2014
 
infonitor Medienanalyse Booklet 2010
infonitor Medienanalyse Booklet 2010infonitor Medienanalyse Booklet 2010
infonitor Medienanalyse Booklet 2010
 
Content-Marketing im B2B
Content-Marketing im B2B Content-Marketing im B2B
Content-Marketing im B2B
 
Ok Google... The end of search as we know it
Ok Google... The end of search as we know itOk Google... The end of search as we know it
Ok Google... The end of search as we know it
 
Marktforschung mit einfachen Mitteln
Marktforschung mit einfachen MittelnMarktforschung mit einfachen Mitteln
Marktforschung mit einfachen Mitteln
 
Social Media Monitoring – Tools und Services
Social Media Monitoring – Tools und ServicesSocial Media Monitoring – Tools und Services
Social Media Monitoring – Tools und Services
 
Vortrag roland fiege tweetakademie ma 2010
Vortrag roland fiege   tweetakademie ma 2010Vortrag roland fiege   tweetakademie ma 2010
Vortrag roland fiege tweetakademie ma 2010
 
Pfarrbrief-Umfrage 2014
Pfarrbrief-Umfrage 2014Pfarrbrief-Umfrage 2014
Pfarrbrief-Umfrage 2014
 
Tekom jt 2013 schaffner sturz kennzahlensystem
Tekom jt 2013 schaffner sturz   kennzahlensystemTekom jt 2013 schaffner sturz   kennzahlensystem
Tekom jt 2013 schaffner sturz kennzahlensystem
 
Tekom jt 2013 schaffner sturz kennzahlensystem
Tekom jt 2013 schaffner sturz   kennzahlensystemTekom jt 2013 schaffner sturz   kennzahlensystem
Tekom jt 2013 schaffner sturz kennzahlensystem
 
Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...
Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...
Wie die Swiss Alliance for Data-Intensive Services datenbasierte Mehrwerte sc...
 

Mehr von Christian Reinboth

Lichtpunktkartierung und Lichtplanung
Lichtpunktkartierung und LichtplanungLichtpunktkartierung und Lichtplanung
Lichtpunktkartierung und LichtplanungChristian Reinboth
 
Forschungsschwerpunkt Demografiefolgen an der Hochschule Harz
Forschungsschwerpunkt Demografiefolgen an der Hochschule HarzForschungsschwerpunkt Demografiefolgen an der Hochschule Harz
Forschungsschwerpunkt Demografiefolgen an der Hochschule HarzChristian Reinboth
 
Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...
Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...
Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...Christian Reinboth
 
Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?
Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?
Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?Christian Reinboth
 
Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...
Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...
Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...Christian Reinboth
 
Digitale Wunddokumentation und Wundfotografie
Digitale Wunddokumentation und WundfotografieDigitale Wunddokumentation und Wundfotografie
Digitale Wunddokumentation und WundfotografieChristian Reinboth
 
Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...
Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...
Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...Christian Reinboth
 
Light Pollution and LED Lighting
Light Pollution and LED LightingLight Pollution and LED Lighting
Light Pollution and LED LightingChristian Reinboth
 
Lichtplanung und optische Messtechnik
Lichtplanung und optische MesstechnikLichtplanung und optische Messtechnik
Lichtplanung und optische MesstechnikChristian Reinboth
 
Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...
Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...
Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...Christian Reinboth
 
Crowdfunding von Forschungsprojekten
Crowdfunding von ForschungsprojektenCrowdfunding von Forschungsprojekten
Crowdfunding von ForschungsprojektenChristian Reinboth
 
Vorteile und Chancen von LED-Beleuchtung im Außenbereich
Vorteile und Chancen von LED-Beleuchtung im AußenbereichVorteile und Chancen von LED-Beleuchtung im Außenbereich
Vorteile und Chancen von LED-Beleuchtung im AußenbereichChristian Reinboth
 
Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)
Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)
Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)Christian Reinboth
 
Erstellung einer Breitband-Karte mit QGIS
Erstellung einer Breitband-Karte mit QGISErstellung einer Breitband-Karte mit QGIS
Erstellung einer Breitband-Karte mit QGISChristian Reinboth
 
An Introduction to Operations Management
An Introduction to Operations ManagementAn Introduction to Operations Management
An Introduction to Operations ManagementChristian Reinboth
 
Impressionen vom AAL-Lehrgang an der MHH
Impressionen vom AAL-Lehrgang an der MHHImpressionen vom AAL-Lehrgang an der MHH
Impressionen vom AAL-Lehrgang an der MHHChristian Reinboth
 

Mehr von Christian Reinboth (20)

Lichtpunktkartierung und Lichtplanung
Lichtpunktkartierung und LichtplanungLichtpunktkartierung und Lichtplanung
Lichtpunktkartierung und Lichtplanung
 
Forschungsschwerpunkt Demografiefolgen an der Hochschule Harz
Forschungsschwerpunkt Demografiefolgen an der Hochschule HarzForschungsschwerpunkt Demografiefolgen an der Hochschule Harz
Forschungsschwerpunkt Demografiefolgen an der Hochschule Harz
 
Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...
Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...
Der Museumsverband LSA e.V. bei Facebook: Motivation, bisherige Entwicklung u...
 
Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?
Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?
Crowdfunding für Museen – eine attraktive Finanzierungsmöglichkeit?
 
Einführung in DIALux
Einführung in DIALuxEinführung in DIALux
Einführung in DIALux
 
Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...
Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...
Zum Einfluss der Darstellung von Rollenvorbildern auf die Mensch-Technik-Inte...
 
Digitale Wunddokumentation und Wundfotografie
Digitale Wunddokumentation und WundfotografieDigitale Wunddokumentation und Wundfotografie
Digitale Wunddokumentation und Wundfotografie
 
Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...
Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...
Können die Industrieländer mit REDD+-Maßnahmen die tropischen Regenwälder in ...
 
Light Pollution and LED Lighting
Light Pollution and LED LightingLight Pollution and LED Lighting
Light Pollution and LED Lighting
 
Lichtplanung und optische Messtechnik
Lichtplanung und optische MesstechnikLichtplanung und optische Messtechnik
Lichtplanung und optische Messtechnik
 
Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...
Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...
Winter Tourism and Protected Areas in the Harz Mts. – History, Problems and P...
 
Crowdfunding von Forschungsprojekten
Crowdfunding von ForschungsprojektenCrowdfunding von Forschungsprojekten
Crowdfunding von Forschungsprojekten
 
Vorteile und Chancen von LED-Beleuchtung im Außenbereich
Vorteile und Chancen von LED-Beleuchtung im AußenbereichVorteile und Chancen von LED-Beleuchtung im Außenbereich
Vorteile und Chancen von LED-Beleuchtung im Außenbereich
 
Abschlussbericht MOPF
Abschlussbericht MOPFAbschlussbericht MOPF
Abschlussbericht MOPF
 
Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)
Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)
Der „Walkenrieder Kapitän“ Felix Meier (1834-1886)
 
LEDs in der Außenbeleuchtung
LEDs in der AußenbeleuchtungLEDs in der Außenbeleuchtung
LEDs in der Außenbeleuchtung
 
Erstellung einer Breitband-Karte mit QGIS
Erstellung einer Breitband-Karte mit QGISErstellung einer Breitband-Karte mit QGIS
Erstellung einer Breitband-Karte mit QGIS
 
An Introduction to Operations Management
An Introduction to Operations ManagementAn Introduction to Operations Management
An Introduction to Operations Management
 
Das Jahr 1923
Das Jahr 1923Das Jahr 1923
Das Jahr 1923
 
Impressionen vom AAL-Lehrgang an der MHH
Impressionen vom AAL-Lehrgang an der MHHImpressionen vom AAL-Lehrgang an der MHH
Impressionen vom AAL-Lehrgang an der MHH
 

SPSS-Kurs

  • 1. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einführung in SPSS Wintersemester 2007 / 2008 Dipl.-WiInf.(FH) Christian Reinboth Einführung in SPSS TestenBeschreiben Darstellen Erkennen
  • 2. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Überblick ● Zu meiner Person ● Zu diesem Kurs ● Was ist Marktforschung ? ● Warum Marktforschung studieren ? ● Grundbegriffe der Statistik ● Methoden der Datengewinnung ● Verschiedene Skalenniveaus ● SPSS-Ansichten & Dateitypen ● Eine Verteilung überblicken ● Grafische Darstellungsformen ● Balken- und Kreisdiagramme ● Histogramme ● Stem-and-Leaf-Plots ● Box-Plots ● Streudiagramme ● Streudiagramm-Matrizen ● Lagemaße ● Arithmetisches Mittel ● Median & Quartile ● Modus ● Streuungsmaße ● Varianz ● Standardabweichung ● Interquartilsabstand ● Spannweite ● Verteilungsmaße ● Ausreißeranalyse ● Leverage-Effekt ● Umgang mit Ausreißern ● Identifikation von Ausreißern ● Test auf Normalverteilung ● Test auf Homoskedastizität ● Verteilungstypen ● Binomialverteilung ● Hypergeometrische Verteilung ● Poissonverteilung ● Stetige Gleichverteilung ● Exponentialverteilung ● Normalverteilung ● Daten bearbeiten mit SPSS ● Fälle sortieren ● Fälle auswählen ● Fälle gewichten ● Der Wahrscheinlichkeitsbegriff ● Grundlagen der Kombinatorik ● Satz von Bayes ● Vorschau auf die VTR MaFo
  • 3. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zu meiner Person ● Christian Reinboth (geb. 1980) ● 2005: Diplom-Wirtschaftsinformatiker (FH) ● Seit 2005 Lehraufträge für VTR Marktforschung, SPSS, Info-Management, MIS/BIS, und HTML ● 2006: Mitbegründer der HarzOptics GmbH Wissenschaftliches An-Institut der HS Harz Schwerpunkt: Optik-Forschung & Entwicklung ● Forschungspreis 2006 der IHK Magdeburg ● Seit 2006 EU-Koordinator der Hochschule Harz ● Seit 2007 Studium der regenerativen Energietechnik Innovations- und Gründungszentrum Raum B05 – HarzOptics GmbH Tel: 03943 – 935 – 615 E-Mail: creinboth@hs-harz.de WWW: http://creinboth.hs-harz.de Di. 18.00 – 20.00 Uhr Mi. 18.00 – 20.00 Uhr ...oder nach Vereinbarung
  • 4. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth HarzOptics GmbH
  • 5. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth HarzOptics GmbH
  • 6. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth HarzOptics GmbH
  • 7. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth HarzOptics GmbH http://www.harzoptics.de
  • 8. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zu diesem Kurs ● 2 SWS = 16 Vorlesungen á 90 Minuten ● Vorbereitung auf die VTR Marktforschung ● Kursziele: ● Erlernung der Grundlagen der Arbeit mit SPSS ● Wiederholung wesentlicher Inhalte von Statistik I & II ● Umsetzung von Berechnungen aus Statistik I & II in SPSS ● Der Kurs endet mit einer Klausur über 60 Minuten am PC ● Fragebögen, Interviews, Gruppendiskussionen ● Online-Marktforschung ● Explorative Datenanalyse ● Multiple Regression ● Varianzanalyse ● Faktorenanalyse ● Clusteranalyse ● Korrespondenzanalyse ● Answer Tree-Verfahren ● (Conjoint-Analyse)
  • 9. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Wiederholungskurs Statistik ● Die Einführung in SPSS ist teilweise auch ein Wiederholungskurs für Statistik I & II ● Grundbegriffe der Statistik ● Stetige und diskrete Daten ● Methoden der Datengewinnung ● Unterscheidung der Skalenniveaus ● Grafische Darstellungsformen ● Empirische Verteilungsfunktion ● Lage- & Streumaße ● Kombinatorik ● Häufigkeitstabellen ● Lineare Regression ● Stetige & diskrete Verteilungen ● Konfidenzintervalle & Tests
  • 10. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Empfohlene Literatur SPSS 14 Felix Brosius Mitp-Verlag ISBN: 3826616340 SPSS-Programmierung Felix Brosius Mitp-Verlag ISBN: 3826614151 SDA mit SPSS Janssen & Laatz Springer-Verlag ISBN: 3540239308 Statistik mit SPSS Diel & Staufenbiel Verlag Dietmar Klotz ISBN: 3880744610
  • 11. http://marktforschung.wikia.com Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Marktforschungs-Wiki
  • 12. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Was ist Marktforschung? ● Die Marktforschung ist der Bestandteil des Unternehmens, der es mit der Außenwelt verbindet ● Marktforschung wird betrieben um: ● Grundwissen über Finanz-, Arbeits-, Beschaffungs- und Absatzmärkte zu schaffen ● Unsicherheiten über tatsächliche und zukünftige Zustände zu beseitigen ● Folgen von Handlungsalternativen einschätzbar zu machen (Planspiele) ● den Grad der Zielerreichung bei laufenden Vorhaben zu überprüfen ● den Informationsfluss zwischen Unternehmen und Außenwelt zu verbessern ● Der Marktforschungsprozess läuft in fünf Phasen ab: ● Definitionsphase: Formulierung der Fragestellung und Erstellung des Forschungsdesigns ● Designphase: Festlegung der Informationsquellen (primär/sekundär) und der Erhebungsmethoden ● Datengewinnungsphase: Durchführung von Beobachtungen, Befragungen und Experimenten ● Datenanalysephase: Datenbereinigung, Kodierung, Auswertung und Ergebnisinterpretation ● Dokumentationsphase: Erstellung des Forschungsberichts und Präsentation der Ergebnisse ● Im Rahmen dieser Veranstaltung wird insbesondere auf die Datenanalysephase eingegangen
  • 13. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Warum Marktforschung studieren? ● Trotz der allgemein angespannten Wirtschaftslage in Deutschland und der EU steigen die Umsätze der Marktforschung kontinuierlich an ● Die Marktforschung ist damit eine der wenigen stabilen Wachstumsbrachen überhaupt ● Die Anforderungen an die Marktforschung und damit auch die Marktforscher wachsen ständig ● Ein aktueller Produktlebenszyklus im Konsum- güterbereich ist auf knapp sechs Monate begrenzt ● Etwa 80% des Gewinns werden bereits in den ersten zwei Monaten erzielt ● Informationen über Kunden und Märkte müssen daher immer zeitnaher beschafft werden können ● Nur so kann auf kurzfristige Entwicklungen überhaupt noch reagiert werden ● Diese Situation verlangt nach gut ausgebildeten Fachkräften, welche die theoretischen Grundlagen der Marktforschung beherrschen und in der Lage sind, schnelle und akkurate Ergebnisse zu liefern
  • 14. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zur Arbeit mit SPSS ● SPSS = Statistical Package for Social Sciences (ursprüngliche Bedeutung) ● Weltweit verwendete Statistik-Software (die erste Version erschien 1968) ● Informationen unter http://www.spss.com ● Schlüssel für den SPSS-Arbeits- und Übungsraum 4.114 im Dekanat W ● Kostenlose Alternativen für Studierende: Statistiklabor, OpenOffice
  • 15. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Weitere Statistik-Software ● Das Statistiklabor ● Kostenfreie SPSS-ähnliche Software ● Entwickelt von der Freien Universität Berlin ● Basiert auf der statistischen Programmiersprache R ● Um eigene in R geschriebene Programme erweiterbar ● Auch für den kommerziellen Einsatz freie Software ● Homepage: http://www.statistiklabor.de ● SAS ● Weltweit nach SPSS meistgenutzte Statistik-Software ● Software in C und Java kann eingebunden werden ● Homepage: http://www.sas.com/offices/europe/germany
  • 16. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Weitere Statistik-Software ● NSDStat Pro ● In Deutschland durch die GESIS vertrieben (Gesellschaft soz.wiss. Infrastruktureinrich.) ● Fast vollständige SPSS-Funktionalität ● Homepage: http://www.gesis.org
  • 17. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Der Aufbau von SPSS ● Bei SPSS handelt es sich um sogenannte modulare Software ● Einzelne Softwaremodule können frei miteinander kombiniert werden ● Die Grundlage bildet das SPSS BASE-Modul (Preis: 1.300 €) ● Inhalte: Deskriptive und explorative Datenanalyse, statistische Tests ● Von herausragender praktischer Bedeutung ist auch das Modul SPSS REGRESSION ● Inhalte: Lineare und nichtlineare Regressionsanalyse, Probitanalyse ● Eine Reihe weiterer Module erweitern SPSS um spezielle Analyseverfahren ● SPSS TRENDS (lineare Zeitreihenanalyse) ● SPSS CATEGORIES (Korrespondenzanalyse) ● SPSS AMOS (Analyse linearer Strukturgleichungen) ● SPSS ANSWER TREE (Analyse von Marktsegmenten) ● SPSS CONJOINT (Berechnung von Präferenzkaufmodellen) ● SPSS MISSING VALUES (Erweiterte Analyse fehlender Werte) ● SPSS EXACT TESTS (Berechnung exakter Irrtumswahrscheinlichkeiten)
  • 18. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Was ist Statistik? Wir benutzen die Statistik wie ein Betrunkener einen Laternenpfahl: Vor allem zur Stütze unseres Standpunktes und weniger zum Beleuchten eines Sachverhalts. - Andrew Lang Die Lüge hat zwei Steigerungsformen: Diplomatie und Statistik. - Marcel Achard Ich stehe Statistiken etwas skeptisch gegenüber. Denn laut Statistik haben ein Millionär und ein armer Kerl jeder eine halbe Million. - Franklin D. Roosevelt Statistics: the mathematical theory of ignorance. - Morris Kline
  • 19. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grundbegriffe der Statistik ● Statistische Einheit = Objekte, an denen die interessierenden Größen erfasst werden (Merkmalsträger) ● Grundgesamtheit = Menge aller für die Fragestellung relevanten statistischen Einheiten (Population) ● Teilgesamtheit = Teilmenge der Grundgesamtheit (Teilpopulation) ● Stichprobe = Tatsächlich untersuchte Teilmenge der Grundgesamtheit ● Merkmal = Interessierende Größe der statistischen Einheit (Variable) ● Ausprägung = Konkreter Merkmalswert einer statistischen Einheit
  • 20. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Methoden der Datengewinnung Frage: Wie sollen Daten gewonnen werden? Primär- statistisch Sekundär- statistisch Tertiär- statistisch Methodik Ablauf Umfang Experiment Erfassung Beobachtung Befragung mündlich schriftlich Querschnitt Längsschnitt Vollerhebung Teilerhebung willkürlich zufällig bewusst ● Einfache Zufallsst. ● Geschichtete Zufallsst. ● Klumpenst. ● Quotenauswahl ● Konzentrationsverf. ● Ausw. typischer Fälle
  • 21. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Skalenniveaus ● Nominalskala ● Daten sind lediglich Bezeichnungen ohne mögliche Rangordnung ● Festgestellt werden kann nur Gleichheit oder Ungleichheit ● Beispiele: Kontonummern, Telefonnummern, Geschlecht ● Ordinalskala ● Daten können in eine Rangordnung gebracht werden ● Abstände zwischen den Daten sind aber nicht interpretierbar ● Beispiele: Schulnoten, Präferenzrangfolgen ● Intervallskala ● Daten können in eine Rangordnung gebracht werden ● Abstände zwischen den Daten sind interpretierbar ● Beispiele: Temperatur in Celsius oder Fahrenheit ● Verhältnisskala ● Wie Intervallskala, nur mit absolutem Nullpunkt ● Beispiele: Temperatur in Kelvin, Zeit, Geld
  • 22. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Skalenniveaus Daten Nominalskala Ordinalskala Kardinalskala metrische Skala Intervallskala (kein natürlicher Nullpunkt) Verhältnisskala (natürlicher Nullpunkt) ● es existiert keine Rangordnung ● Beispiele: ● Geschlecht ● Studiengang ● Telefonnummer ● Familienstand ● es existiert eine Rangordnung ● die Abstände innerhalb dieser Rangordnung sind nicht interpretierbar ● Beispiele: ● Schulnoten ● Steuerklassen ● Erdbebenskala ● alle Arten von Präferenzurteilen ● es existiert eine Rangordnung ● die Abstände sind interpretierbar ● Beispiele: ● Abstand in cm ● Zeitdauer in sek ● Preis in € häufbar nicht häufbar meist diskret meist diskret meist stetig
  • 23. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Die SPSS-Datenansicht Statistische Einheit (Fall; Person...) Ausprägungen (Merkmalswerte)
  • 24. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Die SPSS-Variablenansicht Skalenniveaus (Meßniveaus) Merkmale & Merkmalsbezeichner Platzhalter für fehlende Werte Labels für diskrete Merkmalsausprägungen
  • 25. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Wichtige SPSS-Menübefehle ● Datei ● Erstellen, Öffnen & Importieren von Daten ● Ausdrucken kompletter Datensätze ● Bearbeiten ● Löschen, Kopieren & Einfügen von Daten ● Optionen > SPSS-Grundeinstellungen ● Ansicht ● Ein- und Ausblenden von Symbolleisten ● Einstellung von Schriftart und -größe ● Anzeigen von Labels/Werten ● Daten ● Einfügen von Variablen & Fällen ● Sortieren & Transponieren von Fällen ● Zusammenfügen von SPSS-Dateien ● Fälle zur Analyse auswählen ● Fälle für die Analyse gewichten ● Transformieren ● Umkodieren in selbe/neue Variable ● Analysieren & Grafiken ● Statistische & grafische SPSS-Analyseverfahren
  • 26. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth SPSS-Dateitypen ● Datendateien - *.sav ● Datendateien enthalten die zu analysierenden Daten ● Die Datenstruktur ähnelt der einer Tabellenkalkulation ● Datenimport aus anderen Programmen (z.B. Excel) möglich ● Ausgabedateien *.spo ● Analyseergebnisse werden in Ausgabedateien geschrieben ● Es können mehrere Ausgabedateien gleichzeitig offen sein ● Erfolgreiche Analysen können permanent gesichert werden ● Sytaxdateien *.sps ● SPSS-Verfahren können auch selbst programmiert werden ● Ein selbsterstelltes Programme wird als Syntax gespeichert ● SPSS-Programmierung ist nicht Bestandteil dieses Kurses ● Skriptdateien *.sbs ● SPSS-Skripte werden mit Microsoft Visual Basic programmiert ● Auch die VB-Programmierung ist nicht Bestandteil dieses Kurses
  • 27. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Unser Beispieldatensatz: Merkmale ● Geschlecht (geschl) – numerisch, 0 Dezimalstellen, 2 Wertelabels, nominales Meßniveau ● Einkommen (einkom) – numerisch, 2 Dezimalstellen, keine Wertelabels, metrisches Meßniveau ● Studienjahre (studj) – numerisch, 0 Dezimalstellen, keine Wertelabels, metrisches Meßniveau ● Krankentage (kranktg) – numerisch, 0 Dezimalstellen, keine Wertelabels, metrisches Meßniveau ● Jobzufriedenheit (jobzufr) – numerisch, 0 Dezimalstellen, 2 Wertelabels, nominales Meßniveau ● Alle anderen Merkmalseigenschaften sind im Rahmen dieser Einführung uninteressant und können ignoriert werden Bitte legen Sie diese Merkmale nun in einem leeren Datenblatt an
  • 28. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Unser Beispieldatensatz: Ausprägungen Bitte tragen Sie diese Ausprägungen nun in Ihr Datenblatt ein
  • 29. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zu Beginn einer Datenanalyse... ● ...ist es sinnvoll, einen Überblick über die vorliegenden Daten zu bekommen ● Darstellung von Lage und Verteilung der Werte – gibt es Auffälligkeiten in den Daten? ● Lagemaße: arithmetisches Mittel, Median, Perzentile, Modus ● Streumaße: Spannweite, Interquartilsabstand, Varianz, Standardabweichung ● Grafische Darstellung: Balken-, Kreis-, Stabdiagramm, Stem-and-Leaf, Histogramm, Box-Plot... ● Lassen sich extrem große oder kleine Werte (Ausreißer) in den Daten identifizieren? ● Sind außergewöhnliche Umstände oder Fehler die Ursache? ● Verzerren die Ausreißer die Ergebnisse der Datenanalyse? ● Ist es möglich, sie aus der weiteren Analyse auszuschließen? ● Erfüllen die vorliegenden Daten alle Voraussetzungen für weiterführende Analyseverfahren? ● Liegt eine Normalverteilung vor? ● Liegt eine Gleichheit der Varianzen vor? (Homoskedastizität) ● Welche Tests und Untersuchungen in eine solche explorative Datenanalyse gehören, ist nicht definitiv festgelegt ● Je nach der Art der Daten sowie der nachfolgenden Verfahren sind geeignete Teilelemente auszuwählen
  • 30. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Eine Verteilung überblicken Frage: Wie sieht die vorliegende Verteilung aus? Grafisch Lagemaße Streuungsmaße Aufbaumaße Balkendiagramme, Kreisdiagramme, Histogramme, Säulendiagramme, Box-Plots, Stem-and-Leaf-Diagramme.... Arithmetisches Mittel, Getrimmtes arithmetisches Mittel, Median, Perzentilwerte, Modus, Geometrisches Mittel, Harmonisches Mittel Varianz, Standardabweichung, Variationskoeffizient, Spannweite, Interquartilsabstand, 5-Werte-Zusammenfassung Momentenkoeffizient der Schiefe, Quartilskoeffizient der Schiefe, Kurtosis
  • 31. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grafische Darstellung univariater Daten Darstellungsformen ● Diskrete Merkmale ● Wenig Ausprägungen ● Stetige Merkmale ● Viele Ausprägungen Stabdiagramm Säulendiagramm Balkendiagramm Kreisdiagramm Stem & Leaf Histogramm Box-Plot P-P- & Q-Q-Plots
  • 32. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Balken- und Kreisdiagramme
  • 33. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Säulen- und Balkendiagramme ● Säulen- und Balkendiagramme eigenen sich primär für diskrete Merkmale mit einer geringen Anzahl an Ausprägungen ● Stetige Merkmale müssen vor der Darstellung klassiert werden, damit diese interpretierbar wird ● SPSS ermöglicht die grafische Darstellung sowohl der absoluten als auch der relativen Häufigkeiten im Diagramm
  • 34. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Kreisdiagramme ● Ebenso wie Säulen- und Balkendiagramme sind Kreisdiagramme primär für diskrete Merkmalsverteilungen geeignet ● Bei stetigen Merkmalen ist eine Klassierung für die grafische Darstellung unbedingt erforderlich
  • 35. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Balkendiagramm erstellen (1) Grafiken > Galerie
  • 36. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Balkendiagramm erstellen (2) Grafiken > Galerie Grafiken > Balkendiagramme
  • 37. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Kreisdiagramm erstellen (1) Grafiken > Galerie
  • 38. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Kreisdiagramm erstellen (2) Grafiken > Galerie Grafiken > Kreisdiagramme
  • 39. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Box-Plots und Histogramme
  • 40. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grafik: Histogramme ● Ein Histogramm stellt die Häufigkeitsverteilung der Werte einer intervallskalierten Variablen dar ● Dabei wird von nach der Größe geordneten Daten ausgegangen, die in n Klassen aufgeteilt werden, welche theoretisch nicht die gleiche Breite besitzen müssen (SPSS erstellt Histogramme stets mit gleichbreiten Klassen) ● Über jeder Klasse wird ein Rechteck konstruiert, dessen Flächeninhalt sich proportional zur absoluten bzw. relativen Häufigkeit der jeweiligen Klasse verhält (je nach Anlage des Histogramms) ● Die Form der Darstellung eignet sich primär für stetige Merkmale mit einer großen Anzahl an Ausprägungen ● Bei der Erstellung von Histogrammen mit SPSS ist zu beachten, dass maximal 21 Klassen gebildet werden können ● Außerdem kann eine Normalverteilungskurve in das Histogramm eingeblendet werden, aus der abgelesen werden kann, wie eine Normalverteilung bei Daten mit gleichem Mittelwert und gleicher Streuung aussehen würde (Voraussetzungsprüfung)
  • 41. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Histogramm erstellen Grafiken > Galerie Grafiken > Histogramme
  • 42. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Box-Plots ● Box-Plots bieten einen direkten Verteilungsüberblick und eignen sich insbesondere zum Verteilungsvergleich ● Sie stellen sowohl Lage als auch Streuung der Verteilung dar und dienen zudem der Identifikation von Ausreißern Median Unteres Quartil Oberes Quartil * Ausreißer Extremer Wert Ausreißer Kleinster nicht-extremer Wert Größter nicht-extremer Wert 27 16 42 IQR4 IQR7 IQR
  • 43. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Box-Plots ● Aus der Lage des Medians innerhalb eines Box-Plots läßt sich die Form der Verteilung ablesen Symmetrische Verteilung Linkssteile Verteilung Rechtssteile Verteilung
  • 44. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Box-Plots ● Sollen mehrere Verteilungen bzw. mehrere überschneidungsfreie Gruppen (beispielsweise männliche und weibliche Angestellte) innerhalb einer Verteilung miteinander verglichen werden, lassen sich Box-Plots nebeneinander darstellen ● Weitergehende Vergleiche sind über gruppierte Box-Plots möglich, d.h. es erfolgt eine Aufteilung anhand mehr als nur eines Merkmals (beispielsweise anhand des Geschlechts und des Minderheitenstatus, wodurch sich vier Gruppen ergeben)
  • 45. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einen Box-Plot erstellen (1) Grafiken > Galerie
  • 46. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einen Box-Plot erstellen (2) Grafiken > Galerie Grafiken > Box-Plot
  • 47. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einen Box-Plot erstellen (3) Grafiken > Galerie Grafiken > Box-Plot
  • 48. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Stem-and-Leaf-Plots und Streudiagramme
  • 49. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Stem-and-Leaf-Plots ● Stem-and-Leaf-Plots (Stamm-Blatt-Diagramme) eignen sich ebenfalls zur Darstellung stetiger Merkmale ● Der große Vorteil gegenüber jeder anderen grafischen Darstellungsform ist, dass die Originaldaten (bis zu einer gewissen Genauigkeit) noch aus dem Diagramm abgelesen werden können ● Das Diagramm ist ähnlich aufgebaut wie ein seitlich gekipptes Histogramm, d.h. flächenproportional ● Der Stamm besteht in der Regel aus der ersten Ziffer, die Blätter aus der jeweils folgenden (Rundungen) ● Sehr große oder sehr kleine Zahlen können auf- bzw. abgerundet oder als Extremwerte ausgewiesen werden ● Stem-and-Leaf-Plots können auch genutzt werden, um zwei Verteilungen miteinander zu vergleichen 1 | 1 1 1 2 2 3 4 5 7 7 2 | 2 2 4 3 | 3 3 3 4 5 8 8 4 | 1 2 9 9 9 9 2 Extremes Stem width: 10 Each leaf: 1 case(s) Datensatz A Datensatz B 8 8 8 3 2 | 1 | 1 1 1 2 2 3 4 5 7 7 2 1 | 2 | 2 2 4 9 5 4 43 3 | 3 | 3 3 3 4 5 8 8 4 3 3 2 1 | 4 | 1 2 9 9 9 9 3 Extremes 2 Extremes Stem width: 10 Each leaf: 1 case(s)
  • 50. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einen Stem-and-Leaf-Plot erstellen Analysieren > Deskriptive Statistiken > Explorative Datenanalyse
  • 51. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grafische Darstellung multivariater Daten Darstellungsformen Bivariate Darstellung Mehr als zwei Variablen 2-D-Streudiagramm Profildiagramme Andrew's Fourier Chernoff-Gesichter 3-D-Streudiagramm Streudiagramm-Matrix
  • 52. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Streudiagramme ● Streudiagramme stellen die gemeinsame Verteilung der Werte zweier Variablen (bzw. dreier Variablen in einem 3-D-Streudiagramm) dar, indem die entsprechenden Werte beider Variablen gegeneinander abgetragen werden ● Die Lage und Verteilung der Wertepaare ermöglicht Rückschlüsse auf mögliche Zusammenhänge ● Beispiel: Treten in der Tendenz große Werte der einen Variablen gepaart mit großen Werten der anderen Variablen auf, so kann ein positiver Zusammenhang vermutet werden (beispielsweise bei Werbeausgaben und Verkaufszahlen) ● Ein gefundener Zusammenhang kann nicht in eine bestimmte Richtung interpretiert werden, d.h. aus der Grafik ist nicht abzulesen, ob Variable A Variable B beeinflusst oder umgekehrt, bzw. ob ein Scheinzusammenhang besteht
  • 53. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Streudiagramm erstellen (1) Grafiken > Galerie
  • 54. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Streudiagramm erstellen (2) Grafiken > Galerie Grafiken > Streudiagramm
  • 55. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Streudiagramm-Matrix ● Liegt ein multivariater Fall vor, d.h. sollen für mehrere Variablenpaare jeweils gemeinsame Verteilungen dargestellt werden, ist statt einer Reihe bivariater Streudiagramme ein gemeinsames Streudiagramm in Form einer Matrix sinnvoll ● Eine Streudiagramm-Matrix erlaubt den schnellen Überblick über die Vielzahl aller denkbaren Paarverteilungen und gestattet das rasche Auffinden symmetrischer oder anderweitig auffälliger Einzel-Streudiagramme ● Jedes Streudiagramm taucht zweimal in der Matrix auf (einmal oberhalb und einmal unterhalb der Hauptdiagonalen), wobei die jeweiligen Achsen der Diagramme miteinander vertauscht sind (Gehalt <> Anfangsgehalt; Anfangsgehalt <> Gehalt)
  • 56. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Eine Streudiagramm-Matrix erstellen (1) Grafiken > Galerie
  • 57. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Eine Streudiagramm-Matrix erstellen (2) Grafiken > Galerie Grafiken > Streudiagramm
  • 58. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Lagemaße / Maße der zentralen Tendenz Daten Nominalskala Ordinalskala Kardinalskala metrische Skala Modus Median Quantile Quartile Perzentile Intervallskala (kein natürlicher Nullpunkt) Verhältnisskala (natürlicher Nullpunkt) geometrisches Mittel harmonisches Mittel arithmetisches Mittel (inkl. gewichtem aM und getrimmten aM) Lagemaße, die ein niedriges Skalenniveau voraussetzen können problemlos auf Datensätze eines höheren Skalenniveaus angewandt werden.
  • 59. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Das arithmetische Mittel ● Das arithmetische Mittel ist das bekannteste statistische Lagemaß (Standardmittelwert) ● Es kann nur für metrisch skalierte Daten berechnet werden (Intervallskala, Verhältnisskala) ● Vorsicht: SPSS „berechnet“ das arithmetische Mittel auch für nichtmetrische Daten (Schulnoten!) ● Methodenkenntnisse des Anwenders sind daher erforderlich! ● Liegen von einem metrischen Merkmal x insgesamt n Werte vor, berechnet sich das arithmetische Mittel durch: ● Die Gesamtsumme aller Abweichungen von arithmetischen Mittel beträgt daher stets Null ● Das arithmetische Mittel ist nicht robust, d.h. sehr empfindlich gegenüber Ausreißern ● Beispiel: 1, 2, 3, 4 > (1+2+3+4) / 4 = 2,5 >>> 1, 2, 3, 50 > (1+2+3+50) / 4 = 14
  • 60. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Weltweite Lebenserwartung
  • 61. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Der Median ● Der Median ist der Wert, der in der Mitte der geordneten Verteilung liegt ● Die Berechnung des Medians setzt mindestens ordinalskalierte Daten voraus ● Bei einer ungeraden Anzahl an Werten, wird der mittlere Wert gewählt: ● Bei einer geraden Anzahl an Werten wird das arithmetischen Mittel der beiden zentralen Werte gewählt: ● Bei klassierten Daten wird der mittlere Fall der zentralen Klasse ermittelt (unter Annahme einer Gleichverteilung) ● Der Median ist äußerst robust, d.h. er wird von Ausreißern nicht beeinflusst ● Aus diesem Grund ist er in der Regel aussagekräftiger als das arithmetische Mittel ● Beispiel: 1, 2, 3, 4, 5 > Median: 3 >>> 1, 2, 3, 4, 50 > Median: 3
  • 62. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Perzentilwerte ● Perzentilwerte sind Werte, unterhalb derer ein eindeutig definierter Anteil aller Werte liegt ● Für die Berechnung der Perzentile müssen mindestens ordinalskalierte Daten vorliegen (geordnet) ● Der bekannteste Perzentilwert ist das 50%-Perzentil, welches auch als Median bezeichnet wird ● Häufig verwendet wird auch die „Vierteilung“ des Wertebereichs mit den sogenannten Quartilen: ● 25%-Perzentil (25% aller Werte liegen unterhalb dieses Wertes) ● 50%-Perzentil, Median (50% aller Werte liegen unter- bzw. oberhalb dieses Wertes) ● 75%-Perzentil (75% aller Werte liegen unterhalb dieses Wertes) ● Ebenso wie der Median, sind die Perzentile absolut robust, d.h. von Ausreißern nicht zu beeinflussen
  • 63. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Der Modus ● Der Modus (Modalwert) ist der in den vorliegenden Daten am häufigsten auftretende Wert ● Bei klassierten Daten ist der Modus die Klassenmitte der Klasse mit den meisten Fällen (nur gleichbreite Klassen) ● Die Berechnung des Modus ist in der Regel nur bei diskreten Daten sinnvoll (Punktwahrscheinlichkeit) ● Er wird insbesondere für nominalskalierte Merkmale gebildet, da hier kein anderes Lagemaß möglich ist ● Bei metrisch skalierten Daten können gleichbreite Klassen gebildet und darüber der Modus ermittelt werden ● Vorteil: Der Modus ist auch ohne Berechnung erkennbar und kann daher in der Praxis schnell bestimmt werden ● Nachteil: Der Modus kann nur eindeutig interpretiert werden, wenn ein einzelnes, klares Maximum vorliegt ● Sind mehrere Werte mit gleicher Häufigkeit vertreten, gibt SPSS den in der Häufigkeitstabelle zuoberst stehenden Wert an
  • 64. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Lagemaße / Maße der zentralen Tendenz ● Lagemaße sind Maßzahlen, die das Zentrum einer Verteilung beschreiben ● Arithmetisches Mittel ● Sogenanntes „Standardmittel“ ● Daten müssen stets metrisch skaliert sein ● Mittel ist nicht robust, d.h. empfindlich gegenüber Ausreißern ● Getrimmtes arithmetisches Mittel ● Arithmetisches Mittel nach Entfernung einiger Randdaten ● Trimmung der Daten erfolgt stets symmetrisch an beiden Rändern ● Berechnung dieses Mittels ist sinnvoll bei Ausreißern ● Median ● Der Median ist der mittlere Wert der geordneten Verteilung ● Daten müssen mindestens ordinalskaliert sein ● Für gerade und ungereade n existieren zwei Formeln ● Der Median ist äußerst robust gegenüber Ausreißern (falls n ungerade)
  • 65. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Lagemaße / Maße der zentralen Tendenz ● Perzentile ● Perzentile sind eine Verallgemeinerung des Medians ● Anstelle der 50% werden beliebige andere Prozentzahlen gewählt ● In der Praxis spielen noch Quantile und Quartile eine Rolle ● Modus ● Am häufigsten auftretender Wert in den Daten ● Kann schon für nominalskalierte Werte berechnet werden ● Nur sinnvoll, wenn ein einzelnes, klares Maximum vorliegt ● Geometrisches Mittel ● Kommt bei relativen Veränderungen zum Einsatz (Raten...) ● In solchen Fällen einzig zulässiges Lagemaß ● Faktoren können unterschiedlich gewichtet werden ● Harmonisches Mittel ● Kommt bei Quotienten zum Einsatz (Geschwindigkeiten...) ● Kann analog zum geometrischen Mittel gewichtet werden (falls np nicht ganzzahlig)
  • 66. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Berechnung von Lagemaßen Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
  • 67. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth SPSS-Analyseproblem SPSS führt JEDE Analyse unabhängig von den Voraussetzungen durch! Also auch die Berechnung des arithmetischen Mittels... ➔ ... aus Schulnoten ➔ ... aus Präferenzrängen ➔ ... aus Kontonummern ➔ ... aus Telefonnummern Mit komplexeren Verfahren sind noch schlimmere „Vergehen“ denkbar! Die fachlichen Kenntnisse der Anwender sind daher absolut entscheidend! >>> Darum: Keine Analyse ohne Prüfung der Voraussetzungen!!
  • 68. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Skalenniveaus & Interpretation
  • 69. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Die Spannweite ● Die Spannweite ist der Abstand zwischen dem kleinsten (Minimum) und dem größten (Maximum) Wert im Datensatz ● Die Spannweite ist als Streuungsmaß ungenügend, da sie extrem stark von Ausreißern beeinflusst wird ● Existieren an beiden Verteilungsrändern Ausreißer, wird die Spannweite nur(!) durch diese bestimmt ● Beispiel: 1, 2, 3, 4, 5 > Spannweite: 4 >>> 1, 2, 3, 4, 50 > Spannweite: 49
  • 70. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Der Interquartilsabstand ● Der Interquartilsabstand (IQR = Inter Quartile Range) ist der Abstand zwischen dem oberen und dem unteren Quartil ● Da die beiden Quartile nicht von Ausreißern beeinflusst werden können, ist der IQR deutlich robuster als die Spannweite ● Aus den Quartilen sowie Minimum und Maximum lässt sich die kompakte 5-Werte-Zusammenfassung bilden Interquartilsabstand
  • 71. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Die Varianz und die Standardabweichung ● Die Varianz (bzw. Standardabweichung) ist das gebräuchlichste Streuungsmaß ● Sie berechnet sich als Summe der quadrierten Abweichungen der Einzelwerte (Ausgleich negativer und positiver Abweichungen) vom arithmetischen Mittel, geteilt durch die Gesamtzahl aller Werte ● Bei der Berechnung der Stichproben-Varianz (SPSS) stehen die Freiheitsgrade im Nenner: ● Die Varianz wird kleiner, je näher die Einzelwerte am arithmetischen Mittel liegen ● Sind alle Werte mit dem Mittel identisch (keine Streuung), ergibt sich eine Varianz von Null ● Bei der Interpretation des Ergebnisses ist zu beachten, dass die quadrierten Werte in die Berechnung eingehen ● Dies hat zur Folge, dass auch die Varianz in der quadrierten Einheit dimensioniert ist (also z.B. in €² statt in €) ● Zur besseren Interpretation wird häufig die Standardabweichung als Quadratwurzel der Varianz angegeben
  • 72. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Streuungsmaße / Dispersionsparameter ● Streuungsmaße geben Auskunft darüber, wie stark die Daten um das Zentrum streuen ● Empirische Varianz ● Mittlere quadrierte Abweichung vom arithmetischen Mittel ● Kann daher nur für metrisch skalierte Daten berechnet werden ● Varianz ist nicht robust, d.h.empfindlich gegenüber Ausreißern ● Standardabweichung ● Durch die Quadrierung ist die Varianz schwer interpretierbar ● Sie drückt sich in Einheiten wie €² oder Stunden² aus ● Die Standardabweichung ist die positive Wurzel der Varianz ● Variationskoeffizient ● Streuungen mit unterschiedlichen Maßstäben sind nicht vergleichbar ● Beispiel: Währungsschwankungen in verschiedenen Währungen ● Ist der Mittelwert positiv, können die Daten aber normiert werden ● Der entstehende Variationskoeffizient gestattet direkte Vergleiche
  • 73. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Streuungsmaße / Dispersionsparameter ● Spannweite ● Differenz zwischen größtem und kleinstem Wert ● Wenige Informationen fließen in diesen Kennwert ein ● Differenz wird massiv durch Ausreißer beeinflusst ● Interquartilsabstand (IQR) ● Abstand zwischen dem oberen und dem unteren Quartil ● Wird für den Box-Plot und die 5-Werte-Zusammenfassung benötigt ● 5-Werte-Zusammenfassung ● Hochkomprimierte Darstellung von Streuung und Lage einer Verteilung ● Besteht aus den beiden Randwerten und den drei Quartilen
  • 74. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Berechnung von Streuungsmaßen Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
  • 75. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Schiefe und Wölbung ● Verteilungen können nach Schiefe unterschieden werden: ● Symmetrische Verteilungen (spiegelbildlich) ● Linkssteile / rechtsschiefe Verteilungen ● Rechtssteile / linksschiefe Verteilungen ● Zudem kann nach der Wölbung unterschieden werden: ● Wölbungsgrad entspricht der Wölbung einer Normalverteilung ● Wölbung verläuft flacher als Wölbung einer Normalverteilung ● Wolbung verläuft spitzer als Wölbung einer Normalverteilung
  • 76. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Schiefe und Wölbung ● Schiefe und Wölbung können auch in Maßzahlen ausgedrückt werden ● Momentenkoeffizient der Schiefe ● Abweichung der Verteilung von der symmetrischen Form ● Daten müssen mindestens intervallskaliert sein ● Es ergeben sich positive Werte für linkssteile Verteilungen und negative Werte für rechtssteile Verteilungen ● Quartilskoeffizient der Schiefe ● Koeffizient wird mit den Quartilen gebildet ● Daten müssen daher lediglich ordinalskaliert sein ● Interpretation ist indentisch zum Momentenkoeffizient ● Kurtosis / Exzeß ● Abweichung der Wölbung von der einer Normalverteilung ● Es ergeben sich positive Werte für spitze Verteilungen und negative Werte für flache Verteilungen mit und mit und
  • 77. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Berechnung von Verteilungsmaßen Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
  • 78. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Deskriptive Verteilungsübersicht Analysieren > Deskriptive Statistiken > Häufigkeiten > Statistik
  • 79. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Bivariate Zusammenhänge analysieren Frage: Liegt in einem bivariaten Datensatz ein Zusammenhang vor? grafisch nominalskaliert ordinalskaliert metrisch skaliert Streudiagramm Scatterplot-Matrixstetig diskret Balkendiagramme (gruppiert, bedingt) Bravais-Pearson- Korrelationskoeffizient Konkordanzkoeffizient nach Kendall Rangkorrelations- koeffizient nach Spearman Chi²-Koeffizient
  • 80. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grafische Zusammenhangsanalyse Zweidimensionales Streudiagramm Dreidimensionales Streudiagramm
  • 81. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grafische Zusammenhangsanalyse
  • 82. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Prinzip der Korrelationskoeffizienten ● Prinzip der Korrelationskoeffizienten: ● Für zwei Variablen X und Y kann ein Zusammenhang unterstellt werden, wenn sie sich gleichmäßig verändern ● Eine solche gleichmäßige Veränderung kann zwei Formen annehmen: ● Gleichsinnig = wird X größer wird Y größer; wird X kleiner wird Y kleiner ● Gegensinnig = wird X größer wird Y kleiner; wird X kleiner wird Y größer ● Entscheidende Frage: Ist eine Regelmäßigkeit in der gemeinsamen Veränderung erkennbar? ● Bei der Berechnung von Korrelationen wird nach dem Skalenniveau der Daten unterschieden: ● Nominalskalenniveau: Chi² ● Ordinalskalenniveau: Spearman, Kendall ● Metrisches Skalenniveau: Bravais-Pearson ● Grundsätzlich immer möglich ist auch eine grafische Analyse der Daten ● Hier wird nach der Art der Daten unterschieden: ● Diskrete Daten: Gruppierte Balkendiagramme, Bedingte Balkendiagramme ● Stetige Daten: Zwei- und dreidimensionale Streudiagramme, Scatterplot-Matrix
  • 83. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Bravais-Pearson-Korrelationskoeffizient ● Für metrisch skalierte Merkmale wird der Bravais-Pearson-Korrelationskoeffizient berechnet ● Wichtig: Der Korrelationskoeffizient misst ausschließlich den linearen Zusammenhang zwischen zwei Variablen (!) ● Nicht-lineare Zusammenhänge werden nicht aufgedeckt, auch wenn sie stark oder sogar absolut sein sollten ● Berechnung des Koeffizienten: ● Der Koeffizient r kann Werte zwischen -1 und +1 annehmen ● Bei positiven Werten liegt ein positiver Zusammenhang vor, d.h. die Wertepaare liegen auf einer steigenden Gerade ● Bei negativen Werten liegt ein negativer Zusammenhang vor, d.h. die Wertepaare liegen auf einer fallenden Gerade ● Werte nahe Null deuten darauf hin, dass keinerlei lineare Korrelation zwischen den beiden Variablen vorliegt ● Interpretation des Betrags (!) von r: ● r = 0 = keine Korrelation ● 0 < r < 0,5 = schwache Korrelation ● 0,5 <= r < 0,8 = mittlere Korrelation ● 0,8 <= r < 1 = starke Korrelation ● r = 1 = perfekte Korrelation
  • 84. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Bravais-Pearson-Korrelationskoeffizient
  • 85. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Spearman-Rangkorrelationskoeffizient ● Für ordinalskalierte Merkmale bieten sich zwei Zusammenhangsmaße an: ● Der Rangkorrelationskoeffizient nach Spearman ● Der Konkordanzkoeffizient nach Kendall ● Der Rangkorrelationskoeffizient nach Spearman misst den monotonen Zusammenhang zweier Variablen ● Für die n Datenpaare werden dabei innerhalb jeder Variablen zunächst Ränge gebildet ● Die kleinste Ausprägung von X erhält den Wert 1, die zweitkleinste den Wert 2 usw. ● Für die Variable Y wird identisch vorgegangen, auch hier erhält die kleinste Ausprägung die 1 etc. ● Anschließend werden die Rangdifferenzen d der Datenpaare gebildet ● Mit diesen Differenzwerten lässt sich dann der Rangkorrelationskoeffizient berechnen ● Die Ergebnisse liegen stets zwischen -1 und +1 ● p > 0 = gleichsinniger monotoner Zusammenhang (große X-Werte gehen mit großen Y-Werten einher und umgekehrt) ● p ~ 0 = es besteht kein monotoner Zusammenhang zwischen X und Y (damit kann auch kein linearer bestehen!) ● p < 0 = gegenseitiger monotoner Zusammenhang (große X-Werte gehen mit kleinen Y-Werten einher und umgekehrt) ● Die Formel liefert nur genaue Resultate, wenn keine Rangplatzbindungen (ties) vorliegen ● Haben Beobachtungen identische Werte, ordnet man allen identischen Daten den Durchschnittsrang zu
  • 86. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Konkordanzkoeffizient nach Kendall ● Alternativ zu Spearmans Rho kann für ordinalskalierte Daten auch Kendalls Tau berechnet werden ● Zur Berechnung wird die Anzahl konkordanter (K) und diskordanter (D) Paare benötigt ● Zur Bestimmung der Paare wird eine der Datenreihen nach der Größe geordnet ● Anschließend wird untersucht, inwieweit sich die zweite Datenreihe „mitsortiert“ hat ● Für jedes Datenpaar aus den beiden Datenreihen (yi, yj) mit i < j gilt: ● ist yi < yj, so ist das Paar konkordant (K) ● ist yi > yj, so ist das Paar diskordant (D) ● ist yi = yj, so liegt eine Bindung vor (wird nicht mitgezählt) ● Sind alle Paare entsprechend untersucht worden, wird gerechnet: ● Auch hier gilt, dass die Formel nur Bestand hat, wenn keine Bindungen auftreten ● Einige wenige Bindungen können aber ignoriert werden, da sie das Ergebnis kaum verzerren
  • 87. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Die lineare Regression ● Die Regressionsanalyse ist das flexibelste und am häufigsten eingesetzte multivariate Analyseverfahren ● Untersucht wird die Beziehung zwischen einer abhängigen und einer unabhängigen Variablen ● Sie wird verwendet um: ● Zusammenhänge quantitativ darzustellen und zu erklären (Ursachenanalyse) ● Werte der abhängigen Variablen zu prognostizieren (Wirkungsprognose) ● Beispiel: Wie verändert sich die Absatzmenge (abhängige Variable) bei Veränderungen am Produktpreis, den Werbeausgaben oder der Anzahl der öffentlichen Verkaufsveranstaltungen (unabhängige Variablen)? ● Ergebnis des Verfahrens ist die Regressionsfunktion: ● Y = f(X) > lineare Regression (eine abhängige und eine unabhängige Variable) ● Problemfall interdependente Beziehungen: ● Beeinflusst der Bekanntheitsgrad die Absatzmenge oder beeinflusst die Absatzmenge den Bekanntheitsgrad? ● Dieses System ist nicht in einer einzelnen Gleichung erfassbar, sondern nur im Mehrgleichungsmodell
  • 88. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Schätzung der Regressionsfunktion ● Der Zusammenhang zwischen den beiden Variablen im Streudiagramm ist nicht perfekt ● Beide Variablen bewegen sich jedoch tendenziell in die gleiche Richtung, ein linearer Trend ist erkennbar ● Es kommen theoretisch mehrere Geraden in Frage um den Verlauf der Punkte nachzuzeichnen ● Entscheidende Frage: Welche der möglichen Geraden beschreibt den Zusammenhang am besten?
  • 89. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Methode der kleinsten Quadrate ● Minimierung der Summe der Abweichungsquadrate = Methode der kleinsten Quadrate ● Auch die Methode der kleinsten Quadrate arbeitet mit den senkrechten Abständen der realen Werte von der Gerade ● Die Abstände werden jedoch quadriert, so dass sämtliche negativen Vorzeichen wegfallen ● Eine Kompensation der positiven und negativen Abstände wird dadurch vermieden ● Es wird diejenige Gerade selektiert, bei der die Summe der quadrierten Abstände minimal ist ● Durch Umformung der Zielfunktion erhält man die Parameter der Regressionsfunktion: ● Regressionskoeffizient: ● Konstantes Glied/Konstante: ● Die Gleichung der Regressionsgeraden lautet dann:
  • 90. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Bestimmtheitsmaß R² Regressionsgerade X Y Yi Xi/Yi _ Y Y* _ X Xi {Nicht erklärte Abweichung ei { Erklärte Abweichung }Gesamte Abweichung Residuum
  • 91. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Bestimmtheitsmaß R² ● Die Regressionsgerade gibt Zusammenhänge, die nicht perfekt linear sind, nur imperfekt wieder ● Es ist daher mit der Regressionsfunktion nur selten möglich, alle Veränderungen in Y durch die Koeffizienten zu erklären ● In der Regel wird ein Teil der Veränderungen erklärt werden können, ein anderer Teil wird unaufgeklärt bleiben ● Das Verhältnis von erklärter Streuung zur Gesamtstreuung ist ein gutes Maß für die Güte des Regressionsmodells ● Residuen werden quadriert, damit sich positive und negative Abweichungen nicht aufheben ● Berechnung des Güßtemaßes R² mit: ● TSS = Total Sum of Squares = Summe aller quadrierten Abweichungen ● ESS = Explaines Sum of Squares = Summe aller erklärten quadrierten Abweichungen ● RSS = Residual Sum of Squares = Summe aller nicht erklärten quadrierten Abweichungen ● Die Relation zwischen erklärter Streuung und Gesamtstreuung wird mit R² bezeichnet: ● Der Wert von R² gibt den Anteil der erklärten Streuung an der Gesamtstreuung wieder > Güte der Anpassung ● R² ist als prozentualer Wert zu verstehen und liegt daher stets zwischen 0 und 1 ● R² = 1 > Gesamte Streuung wird erklärt, es besteht ein perfekter linearer Zusammenhang ● Je kleiner R² ausfällt, desto mehr weicht der vorliegende Fall vom linearen Zusammenhang ab ● Beachte: R² ist lediglich ein Maß für den linearen Zusammenhang, nicht für andere Zusammenhänge
  • 92. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einführung in die Ausreißeranalyse ● Bei einem Ausreißer handelt es sich um einen gemessenen oder erhobenen Wert,der nicht den Erwartungen entspricht bzw. nicht zu den restlichen Werten der Verteilung passt ● Es existiert keine klare Definition darüber, wann ein Wert als Ausreißer bezeichnet werden kann- beim Box-Plot z.b. werden alle Werte außerhalb des dreifachen IQR-Bereichs um den Median als Ausreißer klassifiziert ● Es gibt drei mögliche Ursachen für das Auftreten eines Ausreißers: ● Der Ausreißer wurde durch einen verfahrenstechnischen Fehler verursacht, beispielsweise einen Fehler bei der Dateneingabe, beim Codieren der Daten oder einen technischen Ausfall bei der Datenerfassung bzw. -speicherung ● Der Ausreißer kennzeichnet einen außergewöhnlichen Wert, beispielsweise eine einzelne aus dem Rahmen fallende Beobachtung (der einzige befragte Millionär), die sich aber erklären lässt – mitunter können solche Ausreißer auch ein Hinweis darauf sein, dass die Befragung falsch angelegt wurde und daher nicht repräsentativ ist ● Der Ausreißer kennzeichnet einen korrekt erfassten außergewöhnlichen Wert, für den es keinerlei Erklärung gibt ● Generell ist zwischen normalen Ausreißen und multivariaten Ausreißern zu unterscheiden: ● „Normaler“ Ausreißer = außergewöhnlich großer oder kleiner Wert (persönliches Einkommen im Millionenbereich) ● Multivariarer Ausreißer = für sich betrachtet im normalen Bereich liegende Einzelwerte, die in ihrer Kombination quer durch die Variablen einen einzigartigen Fall ergeben (86jährige Frau mit Internetanschluss) ● Die entscheidende Frage der Ausreißeranalyse lautet: Werden die Ausreißer beibehalten oder verworfen?
  • 93. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Der Leverage-Effekt Auswirkung eines Ausreißers auf den Verlauf einer lineare Regressionsgerade Einzelne Ausreißer können die Regressionsgerade zu sich „hinziehen“ und das Ergebnis einer linearen Regressionsanalyse erheblich beeinflussen
  • 94. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Umgang mit Ausreißern ● Wie ist nun mit den gefundenen Ausreißern umzugehen? ● Generell gibt es drei Möglichkeiten: ● Ausschluss aus der Analyse ● Eingang in die Analyse ● Kennzeichnung als fehlende Werte ● Verschiedene Überlegungen sind für die Entscheidung von Bedeutung: ● Wie ist das Auftreten der Ausreißer zu erklären? ● Handelt es sich um Eingabefehler und ist es möglich, diese zu bereinigen? ● Was sagen die Werte über Anlage und Durchführung der Erhebung aus? ● Welche Auswirkungen haben die Ausreißer auf die Ergebnisse der Datenanalyse? ● Beeinflussen sie beispielsweise den Verlauf der Regressionsgraden? (Leverage-Effekt) ● Werden die Analyseergebnisse so stark verzerrt, dass die Ausreißer entfernt werden müssen? ● Welcher Datenverlust entsteht, wenn die Ausreißer aus dem Datensatz entfernt werden?
  • 95. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Identifikation von Ausreißern ● Wie lassen sich Ausreißer erkennen? Unterscheidung in Ausreißer und extreme Werte im Box-Plot Grafische Identifikation von Ausreißern im Streudiagramm Identifikation von Ausreißern über die Extremwerttabelle
  • 96. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Identifikation von Ausreißern (2) Grafiken > Galerie Grafiken > Box-Plot Analysieren > Deskriptive Statistiken > Explorative Datenanalyse
  • 97. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Prüfung auf Normalverteilung ● Die Gauß- oder Normalverteilung ist die wichtigste kontinuierliche Wahrscheinlichkeitsverteilung ● Die zugehörige Dichtefunktion ist als Gaußsche Glockenkurve bekannt ● Eigenschaften: ● Dichtefunktion ist glockenförmig und symmetrisch ● Erwartungswert, Median und Modus sind gleich ● Zufallsvariable hat eine unendliche Spannweite ● Viele statistische Verfahren setzen die Normalverteilung der Daten in der Grundgesamtheit voraus ● Es ist daher häufig zu prüfen, ob von einer solchen Verteilung ausgegangen werden kann (auch näherungsweise) µ Erwartungswert Median Modus
  • 98. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Dichtefunktion der Normalverteilung
  • 99. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Histogramm mit NV-Kurve ● Grafische Analyse mit Histogramm und überlagerter Normalverteilungskurve ● Die Balken des Histogramms spiegeln die Breite der Wertebereiche wieder – da zudem für leere Wertebereiche ein Freiraum ausgegeben wird, kommt im Histogramm die gesamte empirische Verteilung der Variablen zum Ausdruck ● Dies ermöglicht den direkten Vergleich mit einer eingezeichneten theoretischen Verteilung, wie beispielsweise der Normalverteilung ● Der Grad der Abweichung einer Normalverteilung lässt sich auch anhand verschiedener Maßzahlen wie Exzeß (Kurtosis) und Schiefe bestimmen
  • 100. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Histogramm mit NV-Kurve erstellen Grafiken > Galerie Grafiken > Histogramme
  • 101. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Kolmogorov-Smirnov-Test ● Die Prüfung auf Vorliegen einer Normalverteilung kann auch mit einem Anpassungstests erfolgen ● In SPSS lässt sich dazu beispielsweise der Kolmogorov-Smirnov-Anpassungstest nutzen ● Der Test arbeitet mit der kumulierten empirischen und der kumulierten erwarteten Referenzverteilung ● Die maximale Differenz zwischen beiden Verteilungen wird zur Berechnung der Prüfgröße Z nach Kolmogorov-Smirnov verwendet, mit der dann aus einer Tabelle der für einen Stichprobenumfang n kritische Wert für die maximale Differenz bei einem gegebenen Signifikanzniveau abgelesen werden kann ● Nullhypothese H0 des SPSS-Tests: die Werte der untersuchten Variablen sind normalverteilt ● Berechnet wird die Wahrscheinlichkeit, mit der das Zurückweisen dieser Hypothese falsch ist (Signifikanzwert) ● Je größer diese Wahrscheinlichkeit ausfällt, desto eher ist von einer Normalverteilung der Werte auszugehen ● Im nebenstehenden Beispiel eines Kolmogorov-Smirnov-Tests fällt der Signifikanzwert mit 0,00 so niedrig aus, dass die Annahme der Normalverteilung zurückzuweisen ist ● Bei der Interpretation ist zu beachten, dass es sich um einen Test auf perfekte Normalverteilung handelt ● Anzuraten ist daher die Kombination mit einem der grafischen Prüfverfahren
  • 102. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einen K-S-A durchführen Analysieren > Nichtparametrische Tests > K-S bei einer Stichprobe Wie ist dieser Signifikanzwert zu interpretieren?
  • 103. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Stufen eines statistischen Tests I. Aufstellung von Nullhypothese und Alternativhypothese sowie Festlegung des Signifikanzniveaus und Angabe der Parametermenge II. Festlegung einer geeigneten Prüfgröße und Bestimmung der Testverteilung unter Annahme der Gültigkeit der Nullhypothese III. Bestimmung des kritischen Bereichs (linksoffen, rechtsoffen oder beidseitig) IV. Berechnung des Wertes der Prüfgröße V. Entscheidung und Interpretation
  • 104. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Die Bedeutung des Signifikanzwerts ● Der Signifikanzwert gibt die Wahrscheinlichkeit dafür an, dass das Zurückweisen einer Nullhypothese falsch ist ● Je größer dieser Wert also ausfällt, umso wahrscheinlicher ist es, dass ein Zurückweisen der H0 ein Irrtum wäre ● In SPSS werden die Ergebnisse aller statistischen Tests ausnahmslos über den Signifikanzwert ausgegeben Großer Signifikanzwert = Nullhypothese nicht zurückweisen Kleiner Signifikanzwert = Nullhypothese zurückweisen
  • 105. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Prüfung auf Homoskedastizität ● Viele statistische Verfahren setzen voraus, dass die Varianzen innerhalb verschiedener Fallgruppen gleich sind (beispielsweise Signifikanztests und Mittelwertvergleiche) ● Gleichheit der Varianzen = Homoskedastizität ● Ungleichheit der Varianzen = Hetroskedastizität ● Mit dem Signifikanztest nach Levene wird die Nullhypothese H0 überprüft, dass die Varianzen in der Grundgesamtheit in allen Gruppen homogen (gleich) sind ● Der Test arbeitet mit dem F-Wert als statistischem Prüfmaß mit bekannter Verteilung ● Es wird getestet, mit welcher Wahrscheinlichkeit die beobachteten Abweichungen in den Varianzen auftreten können, wenn in der Grundgesamtheit absolute Varianzgleichheit herrscht ● Diese Wahrscheinlichkeit wird als Testergebnis ausgewiesen ● Eine geringe Wahrscheinlichkeit weist auf eine Varianzungleichheit hin
  • 106. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Grafische Homoskedastizitätsprüfung ● Eine grafische Prüfung auf Homoskedastizität kann mit Streudiagrammen oder Boxplots durchgeführt werden ● Hierbei ist auf die unterschiedlichen Streuungen und die Höhe des Medians zu achten
  • 107. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Binomialverteilung ● Grundlage der Binomialverteilung ist das Bernoulli-Experiment: ● Zwei Möglichkeiten: Das Ereignis tritt entweder ein oder nicht ein ● Wiederholungen der Experimente sind stets unabhängig voneinander ● Die Wahrscheinlichkeiten bleiben daher bei Wiederholungen gleich ● Wird ein Bernoulli-Experiment n mal mit einer gleichbleibenden Wahrscheinlichkeit p wiederholt, so ist die zugehörige Zufallsvariable binomialverteilt mit den Parametern n und p (Kurzform: X ~ B (n,p)) ● Diese konvergiert im Grenzfall (n gegen unendlich) gegen eine Normalverteilung (!) Wahrscheinlichkeitsfunktion Verteilungsfunktion Erwartungswert Varianz für x = 0,1,2,...,n
  • 108. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Binomialverteilung
  • 109. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Hypergeometrische Verteilung ● Auch die hypergeometrische Verteilung basiert auf dem n-fachen Experiment mit zwei Ausgängen (dichotom) ● Im Unterschied zur Binomialverteilung ändert sich jedoch hier die Wahrscheinlichkeit bei Wiederholungen ● Die einzelnen Experimente sind somit nicht mehr unabhängig voneinander, sondern miteinander verbunden ● Typisches Beispiel: Ziehen von schwarzen und weißen Kugeln aus einer Urne ohne Zurücklegen ● Eine Zufallsvariable X, die einen solchen wiederholungsabhängigen Zufallsprozess beschreibt bzw. darstellt, wird als mit den Parametern N, M und n hypergeometrisch verteilt bezeichnet (Kurzform: X ~ H (N,M,n)) Wahrscheinlichkeitsfunktion Verteilungsfunktion Erwartungswert Varianz für x=max(0,n-(N-M)),...,min(n,M)
  • 110. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Poissonverteilung ● Typisch für die Poisson-Verteilung ist die geringe Grundwahrscheinlichkeit der Ereignisse ● Die Verteilung wird daher auch als „Verteilung der seltenen Ereignisse“ bezeichnet ● Charakteristisch ist sie vor allem für zeitintervallgebundene Variablen ● Innerhalb eines längeren Zeitraums gibt es viele kleine Zeitintervalle ● In jedem dieser Zeitintervalle ist die Eintrittswahrscheinlichkeit gering ● Über den Gesamtzeitraum betrachtet ist sie dagegen wieder groß ● Eine solche Ereignisstruktur – sehr viele Einzelereignisse n mit jeweils einer sehr kleinen Eintrittswahrscheinlichkeit p – kann durch eine Poisson-Verteilung wiedergegeben werden (Kurzform: X ~ Po (λ)) Wahrscheinlichkeitsfunktion Verteilungsfunktion Erwartungswert Varianz für x = 0,1,2,... für x = 0,1,2,...
  • 111. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Poissonverteilung
  • 112. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Stetige Gleichverteilung ● Bei der stetigen Gleichverteilung haben alle Realisationen einer Zufallsvariable in einem Intervall [a, b] die gleiche Wahrscheinlichkeit einzutreffen (Kurzform: X ~ Re (a,b)) ● Wegen der rechteckförmigen Dichtefunktion wird die Verteilung auch als Rechteckverteilung bezeichnet Wahrscheinlichkeitsdichte Verteilungsfunktion Erwartungswert Varianz
  • 113. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Stetige Gleichverteilung
  • 114. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Exponentialverteilung ● Die Exponentialverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung über die positiven reelen Zahlen ● Exponentialverteilungen werden auch als gedächnislose Verteilungen bezeichnet ● Ist bekannt, dass eine exponentialverteilte Zufallsvariable den Wert x überschreitet, dann ist die Wahrscheinlichkeit, dass der Wert x um t überschritten wird genau so groß wie die, dass eine exponentialverteilte Zufallsvariable mit den gleichen Parametern den Wert t überschreitet ● Die Exponentialverteilung ist die einzige stetige Verteilung mit dieser Eigenschaft ● Im diskreten Bereich gibt es die kaum verwendete geometrische Verteilung, die ebenfalls gedächnislos ist Wahrscheinlichkeitsdichte Verteilungsfunktion Erwartungswert Varianz
  • 115. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Exponentialverteilung
  • 116. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Exponentialverteilung
  • 117. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Normalverteilung ● Die Gauß- oder Normalverteilung ist die wichtigste kontinuierliche Wahrscheinlichkeitsverteilung ● Die zugehörige Dichtefunktion ist als Gaußsche Glockenkurve bekannt ● Eigenschaften: ● Dichtefunktion ist glockenförmig und symmetrisch ● Erwartungswert, Median und Modus sind gleich ● Zufallsvariable hat eine unendliche Spannweite ● Viele statistische Verfahren setzen die Normalverteilung der Daten in der Grundgesamtheit voraus ● Es ist daher häufig zu prüfen, ob von einer solchen Verteilung ausgegangen werden kann (auch näherungsweise) µ Erwartungswert Median Modus
  • 118. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Normalverteilung
  • 119. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Verteilungstypen Frage: Ist die Verteilung DISKRET oder STETIG? Frage: Handelt es sich um ein MOZ oder ein MMZ? Frage: Handelt es sich um eine NORMALVERTEILUNG? DISKRET STETIG MOZ MMZ NEIN JA Bei allen diskreten Verteilungen sind die Approximationsbedingungen zu prüfen! Hypergeometrische Verteilung Binomialverteilung Stetige Gleichverteilung oder Exponentialverteilung Normalverteilung Standardnormalverteilung Poissonverteilung
  • 120. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Approximationen Binomialverteilung Modell mit Zurücklegen Hypergeometrische Verteilung Modell ohne Zurücklegen Poissonverteilung „Verteilung seltener Ereignisse“
  • 121. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Einige Konfidenzintervalle Erwartungswert eines normalverteilten Merkmals bei bekannter Varianz Erwartungswert eines normalverteilten Merkmals bei unbekannter Varianz Erwartungswert eines unbekannt verteilten Merkmals bei unbekannter Varianz Varianz eines normalverteilten Merkmals Anteilswert einer dichotomen Grund- gesamtheit beim Modell mit Zurücklegen
  • 122. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Intervall um den Erwartungswert
  • 123. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ein Konfidenzintervall berechnen Analysieren > Deskriptive Statistiken > Explorative Datenanalyse
  • 124. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Fälle sortieren ● Die Fälle in einer Datendatei lassen sich zur besseren Übersichtlichkeit sortieren ● Möglich ist das auf- und absteigende Sortieren anhand einer wie auch mehrerer Variablen ● Werden mehrere Variablen ausgewählt, wird zuerst nach der zuoberst stehenden Variablen sortiert ● Fälle, die in der ersten Variable identische Werte enhalten, werden anhand der folgenden Variablen sortiert usw. Daten > Fälle sortieren
  • 125. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Fälle auswählen ● Bisweilen ist es sinnvoll, lediglich bestimmte Fälle in die Auswertung einfließen zu lassen ● Hierfür lassen sich in SPSS einzelne Fälle anhand von logischen Statements auswählen ● Die Statements setzten sich aus den diversen logischen Operatoren zusammen ● Beispiel: Auswahl aller weiblichen Befragten mit einem Einkommen von mehr als 2000 € ● Es ergibt sich eine neue Filtervariable (filter_$), die ans Ende des Variablenfeldes gehängt wird Daten > Fälle auswählen
  • 126. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Exkurs: Logische Operatoren ● Statements mit einem logischen UND sind stets dann WAHR, wenn alle im Statement enthaltenen Befingungen ebenfalls WAHR werden. ● In der in SPSS verwendeten Statement-Syntax wird das logische UND durch das Symbol „&“ ausgedrückt ● Statements mit einem logischen ODER sind stets dann WAHR, wenn mindestens eines der im Statement enthaltenen Bedingungen ebenfalls WAHR wird. ● Die schließt verständlicherweise den Fall mit ein, dass beide enthaltenen Bedingungen WAHR werden. ● In der in SPSS verwendeten Statement-Syntax wird das logische ODER durch das Symbol „|“ ausgedrückt ● Durch das logische NICHT verkehrt sich die Bedeutung jedes Statements in das jeweilige Gegenteil ● In der in SPSS verwendeten Statement-Syntax wird das logische NICHT durch das Symbol „~“ ausgedrückt
  • 127. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Exkurs: Logische Operatoren (2) ● Zur Verdeutlichung noch einige Beispiele der zur Statement-Bildung mit logischen Operatoren ● Beispiel: Auswahl aller weiblichen Befragten ● Statement: Geschlecht = „weiblich“ ● SPSS-Syntax: geschl = 2 ● Beispiel: Auswahl aller Befragten mit einem Einkommen von unter 3000 € ● Statement: Einkommen < 3000 € ● SPSS-Syntax: einkom < 3000 ● Beispiel: Auswahl aller weiblichen Befragten mit einem Einkommen von mehr als 2000 € ● Statement: Geschlecht = „weiblich“ UND Einkommen > 2000 € ● SPSS-Syntax: geschl = 2 & einkom > 2000 ● Beispiel: Auswahl aller Befragten, die männlich sind oder ein Einkommen von mehr als 1500 € haben ● Statement: Geschlecht = „männlich“ ODER Einkommen > 1500 € ● SPSS-Syntax: geschl = 1 | einkom > 1500 ● Männliche Befragte mit einem Einkommen von mehr als 1500 € werden hier nicht doppelt selektiert (!)
  • 128. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Fälle auswählen (2) ● Neben der Auswahl mittels logischer Statements gibt es noch weitere Auswahlverfahren ● Auswahl nach Zeitintervall ● Sind die Fälle z.B. mit einem Datumsstempel versehen, kann ein Zeitintervall selektiert werden ● Ziehung einer Zufallsstichprobe ● Aus der Grundgesamtheit aller erfassten Fälle lässt sich auch eine Zufallsstichprobe ziehen Daten > Fälle auswählen
  • 129. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Fälle gewichten ● Unter bestimmten Umständen ist eine Gewichtung der Fälle sinnvoll ● Beispiel: Online-Befragung zum Thema Internetsucht (Hahn & Jerusalem) ● Es besteht ein starker Zusammenhang zwischen Suchtgefahr und Lebensalter bzw. Geschlecht ● Besonders internetsuchtgefährdet sind demnach junge Männer unter 20 Jahren ● Befinden sich zuviele junge Männer in der Stichprobe, wird das Gesamtproblem überschätzt ● Junge Männer kommen in der Stichprobe doppelt so häufig vor wie in der Grundgesamtheit ● Ältere Frauen sind dagegen in der Stichprobe sehr stark unterrepräsentiert ● Den sich hieraus ergebenden Verzerrungen kann durch eine Gewichtung entgegengewirkt werden ● So werden junge Männer beispielsweise mit dem Faktor 0,5 gewichtet, ältere Frauen mit dem Faktor 2 ● Die geschätzte Zahl der Internetsüchtigen unter allen Nutzern reduziert sich dadurch auf 2,7% ● Vorsicht: Es besteht die Gefahr, systematische Verzerrungen durch die Gewichtung zu verstärken ● Beispiel: Über 70-jährige sind bei Online-Befragungen ebenfalls sehr selten vertreten ● Inwiefern ist es vertretbar, die wenigen (seltsamen) Probanden stark überzugewichten?
  • 130. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Variablen umkodieren ● Um eine Gewichtung durchführen zu können, ist eine Gewichtungs-Variable erforderlich ● Im vorliegenden Fall sollen alle männlichen Befragten mit 50%, alle weiblichen Befragten mit 200% gewichtet werden ● Es wird eine neue Variable erstellt, die für jeden männlichen Befragten den Wert 0,5 und für jeden weiblichen Befragten den Wert 2 annimmt ● Die Funktion „umkodieren“ kann auch für andere Zwecke eingesetzt werden, beispielsweise für die Datenklassierung Transformieren > Umkodieren > in andere Variablen
  • 131. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Fälle gewichten (2) Daten > Fälle gewichten
  • 132. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Arbeit mit Dummy-Variablen ● Für viele Analyseverfahren wird ein metrisches Skalenniveau vorausgesetzt (z.B. Multiple Regression) ● Sollen nominalskalierte Daten in ein solches Verfahren einfließen, müssen Dummy-Variablen gebildet werden ● Dummy-Variablen sind binäre Variablen, die nur die Werte 0 und 1 annehmen können ● Eine dichotome Variable lässt sich durch Transformation in eine Dummy-Variable überführen ● 0 = Ausprägung liegt nicht vor ● 1 = Ausprägung liegt vor ● Beispiel: Untersuchung der Einflüsse von Verpackungseigenschaften auf das Kaufverhalten ● Dummy-Variable q1 nimmt für rote Verpackungen den Wert 1, für nicht-rote Verpackungen den Wert 0 an ● Analog dazu lässt sich auch eine Dummy-Variable q2 für die Farbe Gelb und q3 für die Farbe Grün definieren ● Existieren nur diese drei Verpackungsfarben kann auf q3 aber verzichtet werden, da: ● Wenn q1 = 0 und q2 = 0 muss q3 = 1 gelten ● Drei Farben lassen sich daher über nur zwei Dummy-Variablen beschreiben ● Generelle Regel: Eine nominale Variable mit n Ausprägungen lässt sich in n-1 Dummy-Variablen abbilden
  • 133. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Das Problem der fehlenden Daten ● Unter fehlenden Daten sind einzelne fehlende Werte zu verstehen ● Typische fehlende Werte bei Personenbefragungen: ● Angaben zum Einkommen ● Angaben zum eigenen Körper ● Angaben zum Sexualverhalten ● Fehlende Werte sind ein Problem, wenn ein Zusammenhang zwischen der Wahrscheinlichkeit des Fehlens und einem anderen Sachverhalt zu vermuten ist, die Verteilung der fehlenden Werte also nicht zufällig ist ● Beispiel: Kommt es bei der Frage nach dem Einkommen tendenziell eher zu Auskunftsverweigerungen bei Personen mit niedrigem Einkommen, so wird dies das erhobene Durchschnittseinkommen verzerren ● Bei der Untersuchung fehlender Daten ist daher vor allem zu klären: ● Fehlen so viele Werte, dass eine sinnvolle Auswertung des Datensatzes unmöglich ist? ● Sind die fehlenden Werte zufällig im Datensatz gestreut oder lässt sich ein Muster identifizieren? ● Generell bieten sich drei Möglichkeiten des Umgangs mit fehlenden Daten an: ● Es werden ausschließlich die vollständigen Fälle zur weiteren Auswertung zugelassen ● Einzelne Fälle oder einzelne Variablen werden von der weiteren Auswertung ausgeschlossen ● Die fehlenden Werte werden induktiv oder statistisch ersetzt
  • 134. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ursachen für fehlende Daten ● Das Fehlen von Daten kann auf vier Ursachen zurückgeführt werden: ● Dateneingabefehler (z.B. Buchstaben in einem Zahlenfeld) ● Codierungs- und Übertragungsfehler während Eingabe oder Speicherung ● Ungenaue Datenfelder bei der Erhebung (z.B. „Studienrichtung“ bei einer Befragung von Nicht-Akademikern) ● Aktionen des Befragten, beispielsweise Vergessen der Angaben, widersinnige Angaben (höchster Schulabschluss ist die Mittlere Reife, trotzdem wurde eine Abiturnote eingetragen), Nichtauskunftsfähigkeit oder bewusste Entscheidung eine bestimmte Frage nicht zu beantworten (Einkommen, Körper, Sexualverhalten...) ● Fehlende Werte sind bei der Arbeit mit empirischen Daten keine Ausnahme, sondern die Regel ● Die Wahrscheinlichkeit für das Auftreten fehlender Werte steigt im Allgemeinen mit der Größe des Datensatzes ● Bei der Analyse langer Zeitreihen, z.B. der Auswertung der Niederschlagsmengen der letzten 200 Jahre, werden aufgrund von Katastrophen, Krieg oder anderen Gründen immer wieder einzelne Werte nicht erfasst worden sein ● Gerade in der sozialwissenschaftlichen Forschung und bei der Marktforschung im Zuge der Befragung von hunderten oder tausenden Personen kommt es aufgrund verschiedenster Ursachen häufig zu Einzelausfällen Mit fehlenden Daten ist bei jeder marktforscherischen Untersuchung zu rechnen! Das Problem der fehlenden Daten sollte vom Marktforscher nicht einfach ignoriert werden!
  • 135. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zufälligkeitsgrade ● Man unterscheidet in drei Zufälligkeitsgrade bezüglich des Auftretens fehlender Daten: MCAR, MAR und NRM ● Der Zufälligkeitsgrad entscheidet, ob fehlende Werte ausgeschlossen oder ersetzt werden können ● MCAR = missing completely at random ● Fehlende Werte treten vollkommen zufällig auf ● Die Wahrscheinlichkeit des Fehlen eines Wertes steht nicht in Zusammenhang mit anderen Größen ● Es ist kein Zusammenhang zwischen dem Auftreten von fehlenden Werten der Variable Y und der Variable Y selbst (niedrige Einkommen werden tendenziell nicht angegeben) oder eine Korrelation mit einer anderen Variable X (Frauen sind tendenziell weniger bereit, Auskünfte über ihr Körpergewicht zu machen) feststellbar ● MAR = missing at random ● Das Auftreten von fehlenden Werten steht (teilweise) in Zusammenhang mit einer anderen erhobenen Variablen ● Es ist kein Zusammenhang zwischen dem Auftreten von fehlenden Werten der Variable Y und der Variable Y selbst feststellbar, aber eine (schwache) Korrelation des Auftretens von fehlenden Y-Werten mit einer anderen Variable X ● NRM = nonrandom missing ● Das Auftreten von fehlenden Werten folgt klaren Gesetzmäßigkeiten, Zufälligkeit ist auszuschließen ● Es kann entweder ein Zusammenhang zwischen dem Auftreten von fehlenden Werten der Variable Y und der Variable Y selbst oder mit einer anderen Variable X oder auch beides vorliegen, d.h. das Auftreten eines fehlenden Wertes kann vollständig durch eine andere Variable oder die Variable selbst erklärt werden
  • 136. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Umgang mit fehlenden Daten ● Welche der drei Methoden angewandt werden kann, hängt wesentlich vom Zufälligkeitsgrad ab ● CCA = complete case approach ● Es werden ausschließlich vollständige Fälle für die weitere Analyse verwendet ● Alle Fälle mit auch nur einem fehlenden Wert werden aus dem Datensatz entfernt ● Die Methode kann nur bei zufällig fehlenden Daten (MCAR) angewendet werden ● Günstig ist sie bei einer großen Stichprobe, da die gelöschten Fälle hier unkritisch sind ● Ausschluss von Fällen oder Variablen ● Ziel ist die Verringerung des Gesamtanteils fehlender Werte ● Abwägen zwischen dem Datenverlust und der Reduktion der Probleme durch fehlende Werte ● Günstigste Methode für nicht zufällig auftretende fehlende Werte (MAR, NRM) ● Der Ausschluss von Fällen kann fallweise oder paarweise erfolgen ● Ersetzen fehlender Werte ● Grundidee: metrische Daten (ausschließlich!) lassen sich ersetzen, wenn Regelmäßigkeiten erkennbar sind ● Möglich ist der Ersatz über verschiedene induktive (nichtmathematische) und statistische (mathematische) Verfahren ● Die Gefahr besteht darin, dass man den Datensatz für vollständig hält bzw. durch die Ersetzungen verzerrt
  • 137. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ausschlussverfahren ● Fallweiser Ausschluss: ● Fehlt ein einzelner Wert, wird der komplette Fall von der weiteren Analyse ausgeschlossen ● Vorteil: bestimmte Arten von Asymmetrien werden vermieden, da keine Teilfälle in die Analyse eingehen ● Nachteil: relevantes Datenmaterial geht verloren, der Stichprobenumfang sinkt mit jedem Ausschluss ● Paarweiser Ausschluss: ● Fehlen einzelne Werte, wird mit den restlichen Werten des Falles weitergearbeitet ● Vorteil: alle Fälle bleiben erhalten, der Stichprobenumfang verändert sich nicht ● Nachteil: bei multivariaten Analysen bilden u.U. unterschiedlich große Datensätze die Berechnungsgrundlage ● Um Fälle zu vermeiden, bei denen auf unterschiedlich große Datensätze zurückgegriffen und gleichzeitig verglichen wird, ist der fallweise Ausschluss das weitaus häufiger verwendete Ausschlussverfahren
  • 138. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ersatzwertverfahren ● Induktive Verfahren: ● Die fehlenden Werte werden auf der Basis von Informationen ersetzt, die über die Stichprobe vorliegen ● Nachbeobachtungen: zusätzliche Beobachtungen / Befragungen werden angestellt (Repräsentativität?) ● Externe Konstanten: konstanter Wert aus externer Quelle oder früherer Studie wird ersatzweise verwendet ● Statistische Verfahren: ● Metrische fehlende Werte können aus der Stichprobe geschätzt werden (Voraussetzung ist MCAR) ● Mittelwertersatz: ein fehlender Wert einer Variable wird durch den Mittelwert dieser Variablen ersetzt ● Formen des Mittelwertersatzes: Mittel / Median der Nachbarpunkte, Zeitreihen-Mittelwert & lineare Interpolation ● Vorteil: die Verfahren sind leicht anzuwenden, benötigt werden lediglich die entsprechenden Mittelwerte ● Nachteil: die Varianz, die Verteilung der Daten und eventuelle Korrelationen werden verzerrt ● Linearer Trend: ein fehlender Wert einer Variablen wird durch den linearen Trendwert für diese Variable ersetzt ● Voraussetzung: für die gültigen Werte lässt sich ein sinnvoller linearer Trend ermitteln ● Fehlende Werte können dann durch die Werte der Trendgraden an der betreffenden Stelle ersetzt werden ● Nachteil: der lineare Trend in den Variablen wird verstärkt, die Varianz der Verteilung verringert sich
  • 139. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Der Wahrscheinlichkeitsbegriff ● Ein Zufallsvorgang ist ein Vorgang, der in einem von mehreren möglichen Ereignissen endet ● Diese Ereignisse schließen sich gegenseitig aus, d.h. es kann nur eines der Ereignisse eintreten ● Welches Ereignis eingetreten ist, kann erst nach Ende des Zufallsvorgangs festgestellt werden ● Typische Beispiele: Münzwurf, Ziehung der Lottozahlen, Ziehen von Kugeln aus einem Behälter ● Der klassische Begriff der Wahrscheinlichkeit geht auf Laplace zurück: ● Beispiel: Wahrscheinlichkeit beim einmaligen Würfeln eine 3 zu erhalten: ● Für das Rechnen mit Wahrscheinlichkeiten gelten die Axiome von Kolmogoroff (1933) ● Die Axiome schaffen eine mathematische Basis für das Rechnen mit Wahrscheinlichkeiten ● Axiom 1: Die Wahrscheinlichkeit eines Ereignisses A eines Zufallsvorgangs ist eine nichtnegative reelle Zahl ● Axiom 2: Die Wahrscheinlichkeiten aller möglichen Elementarereignisse eines Zufallsvorgangs ergeben zusammen den Wert 1 ● Axiom 3: Die Wahrscheinlichkeit der Vereinigungsvorgänge zweier oder mehrerer Ereignisse eines Zufallsvorgangs ergeben sich aus der Summe der Einzelwahrscheinlichkeiten der Ereignisse, wenn die Ereignisse disjunkt sind, d.h. sich (paarweise) gegenseitig ausschließen
  • 140. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Ablaufdiagramm: Dreifacher Münzwurf
  • 141. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Das Taxi-Problem ● In einer Stadt sind zwei Taxiunternehmen tätig ● Unternehmen A verfügt über grüne Taxis und hat einen Marktanteil von 85% ● Unternehmen B verfügt über blaue Taxis und hat einen Marktanteil von 15% ● Es kommt zu einem Unfall mit Fahrerflucht, wobei ein Zeuge ein blaues Taxi erkennt ● Es stellt sich die Frage, inwieweit der Zeuge die Farbe zuverlässig bestimmen kann ● Vor Gericht muss er sich daher einem Farbidentifikationstest unterziehen ● Er ordnet in 80% aller Fälle die Farbe richtig zu und irrt sich in 20% der Fälle ● Bedeutet dies, dass er der Unfallwagen mit 80% Wahrscheinlichkeit richtig erkannt hat? ● Nein, denn die Baisisrate (a priori-Wahrscheinlichkeit) wurde außer Acht gelassen ● Es muss bedacht werden, dass wesentlich weniger blaue als grüne Taxis unterwegs sind ● Darum: Rechnung mit dem Satz von Bayes: ● Trotz der guten Sehkraft des Zeugen, ist seine Trefferwahrscheinlichkeit geringer als 50/50!
  • 142. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Kombinatorik ● Um Wahrscheinlichkeiten nach Laplace zu berechnen, muss die Anzahl der Elementarereignisse bekannt sein ● Wie viele Möglichkeiten gibt es, die n Elemente eines Zufallsexperiments anzuordnen? (Permutationen) ● Wie viele Möglichkeiten gibt es, k Elemente aus den n Elementen auszuwählen? (Variationen, Kombinationen) ● Permutationen ● Alle möglichen Elemente sollen im Ergebnis vorkommen (Frage nach der Reihenfolge) ● Es wird in Permutationen mit und ohne Wiederholung von Elementen unterschieden ● Beispiele: Anordnung von Symbolen bei einem Sehtest, Anordnung von Fragen auf einem Fragebogen ● Variationen ● Es sollen nicht alle Elemente im Ergebnis vorkommen, die Reihenfolge spielt keine Rolle ● Es wird in Variationen mit und ohne Wiederholung von Elementen unterschieden ● Beispiele: Ziehung von schwarzen und weißen Kugeln, Ziehung der Lottozahlen ● Kombinationen ● Es sollen nicht alle Elemente im Ergebnis vorkommen, die Reihenfolge spielt eine Rolle ● Es wird in Kombinationen mit und ohne Wiederholung von Elementen unterschieden ● Beispiele: Passwort aus Buchstaben und Ziffern, Plazierungen bei einem Pferderennen
  • 143. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Kombinatorik Frage: Sollen im Ergebnis ALLE Elemente vorkommen? Frage: Können sich die Elemente auch WIEDERHOLEN? Frage: Spielt die REIHENFOLGE eine Rolle? Frage: Können sich die Elemente auch WIEDERHOLEN? Frage: Können sich die Elemente auch WIEDERHOLEN? JA NEIN JA JA JA JA NEIN NEIN NEIN NEIN Permutation mit Wiederholung Permutation ohne Wiederholung Variation mit Wiederholung Kombination mit Wiederholung Variation ohne Wiederholung Variation ohne Wiederholung
  • 144. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Weitere Statistik-Software ● Das Statistiklabor ● Kostenfreie SPSS-ähnliche Software ● Entwickelt von der Freien Universität Berlin ● Basiert auf der statistischen Programmiersprache R ● Um eigene in R geschriebene Programme erweiterbar ● Auch für den kommerziellen Einsatz freie Software ● Homepage: http://www.statistiklabor.de ● SAS ● Weltweit nach SPSS meistgenutzte Statistik-Software ● Software in C und Java kann eingebunden werden ● Homepage: http://www.sas.com/offices/europe/germany
  • 145. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Empfohlene Literatur SPSS 14 Felix Brosius Mitp-Verlag ISBN: 3826616340 SPSS-Programmierung Felix Brosius Mitp-Verlag ISBN: 3826614151 SDA mit SPSS Janssen & Laatz Springer-Verlag ISBN: 3540239308 Statistik mit SPSS Diel & Staufenbiel Verlag Dietmar Klotz ISBN: 3880744610
  • 146. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Was ist Statistik? Statistical thinking will one day be as necessary for efficient citizenship as the ability to read or write. - H.G. Welles If your experiment needs statistics, you ought to have done a better experiment. - Ernest Rutherford Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital. - Aaron Levenstein It is easy to lie with statistics. It is hard to tell the truth without it. - Andrejs Dunkels
  • 147. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Fragebögen, Interviews, Diskussionen ● Grundlagen der Fragebogengestaltung ● Welche Fragetypen gibt es? ● Wie lassen sich Fragen eindeutig formulieren? ● Wie viele Fragen darf ein Fragebogen enthalten? ● Durchführung von Interviews ● Was für Interviewtypen gibt es? ● Wie arbeiten geschulte Interviewer? ● Wie werden Interviews ausgewertet? ● Wie kommt es zu Interviewereffekten? ● Durchführung von Gruppendiskussionen ● Welche Formen der Gruppendiskussion gibt es? ● Welche Vorteile haben Gruppendiskussionen? ● Welche Aufgaben kommen dem Moderator zu? ● Welche Probleme können in Gruppen auftreten? ● Wie werden Gruppendiskussionen ausgewertet?
  • 148. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Online-Marktforschung ● Teilnehmerrekrutierung ● Aktive und passive Rekrutierung ● Selbstselektion und Repräsentativität ● Teilnehmeransprache ● Formen der Teilnehmeransprache ● Online-Marktforschung und Spamproblematik ● Teilnehmermotivation ● Strategien zur Teilnehmermotivation ● Monetäre und nicht-monetäre Incentives ● Teilnehmerkontrolle ● Mehrfachteilnahmen und Incentivejäger ● Kontrolle vor, während und nach der Befragung ● Technische Umsetzung eines Fragebogens in HTML ● Probleme durch die Überschneidung Marktforschung/Marketing
  • 149. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Explorative Datenanalyse ● Wir unterscheiden in... ● Deskriptive Statistik (Beschreibung und Visualisierung der Daten) ● Explorative Statistik (Suchen nach Strukturen und Auffälligkeiten) ● Induktive Statistik (Testen von Hypothesen und Schätzen von Parametern) ● Fragestellung: Was ist an der Verteilung eines Merkmals bemerkenswert? ● Was gehört zur explorativen Datenanalyse? ● Berechnung statistischer Maßzahlen ● Darstellung absoluter und relativer Häufigkeiten ● Visualisierung diskreter und stetiger Variablen ● Analyse von Ausreißern ● Analyse fehlender Daten ● Transformation von Daten ● Erstellung von Dummy-Variablen ● Prüfung der Voraussetzungen für weiterführende Analysemethoden
  • 150. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Multiple Regression ● Vielseitiges, strukturprüfendes und am häufigsten eingesetztes multivariates Analyseverfahren ● Ziel: Analyse von Beziehungen zwischen einer abhängigen Variablen und einer (univariater Fall) oder mehreren (multivariater Fall) unabhängigen Variablen ● Anwendung: Beschreibung und Erklärung von Zusammenhängen und Durchführung von Prognosen ● Beispiel: Hängt die Absatzmenge eines bestimmten Produktes von den Ausgaben für die Qualitätssicherung, den Ausgaben für die Werbung oder bzw. und der Anzahl der Verkaufsstellen ab? ● Wenn ja, wie stark fallen die jeweiligen Zusammenhänge aus? Wie wird sich die Absatzmenge entwickeln, wenn bestimmte Ausgaben erhöht oder gesenkt werden?
  • 151. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Varianzanalyse ● Die Varianzanalyse gehört wie die Regressionsanalyse zu den strukturprüfenden Verfahren und dient der Feststellung von Mittelwertunterschieden zwischen zwei oder mehr Gruppen von Merkmalsträgern ● Mathematisches Prinzip der Varianzanalyse: ● Es wird getestet, ob die Varianz zwischen den Gruppen größer ist als innerhalb der Gruppen ● Das Ergebnis ermöglicht eine Aussage darüber, ob sich die Gruppen bezüglich der (abhängigen) Variablen signifikant voneinander unterscheiden, bzw. ob die Einteilung in Gruppen anhand der (unabhängigen) Variablen gerechtfertigt ist ● Um eine Varianzanalyse durchführen zu können, muss im Vorfeld bekannt sein, welches die abhängige und welches die unabhängigen Variablen in einem Modell sind – daher wird sie auch als ein strukturprüfendes Verfahren bezeichnet ● Unterscheidung in ANOVA – Analysis of Variance (nur eine unabhängige Variable) und MANOVA – Multivariate Analysis of Variance (mindestens zwei unabhängige Variablen) ONEWAY ANOVA ozon 17267,908 195 88,553 3,084 ,000 7338,670 1 7338,670 255,590 ,000 9929,238 194 51,182 1,783 ,000 3847,498 134 28,713 21115,406 329 (Kombiniert) Gewichtet Abweichung Linearer Term Zwischen den Gruppen Innerhalb der Gruppen Gesamt Quadrats umme df Mittel der Quadrate F Signifikanz
  • 152. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Faktorenanalyse ● In der Marktforschung hat man es häufig mit komplexen Begriffen und Sachverhalten zu tun ● Begriffe wie „Nutzen“ oder „Qualität“ lassen sich nicht durch eine einzige Variable ausdrücken ● Um beispielsweise die Qualität abzubilden, wird ein ganzes Bündel von Variablen benötigt: ● Haltbarkeit, Preis-Leistungs-Verhältnis, Zuverlässigkeit, Zufriedenheit... ● Ziel: Reduktion von vielen Variablen auf komplexere Hintergrundvariablen ● Die Faktorenanalyse wird daher auch als dimensionsreduzierendes Verfahren bezeichnet Produktqualität Haltbarkeit P-L-V Sicherheit Zufriedenheit Lieferzeit Bestellservice
  • 153. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Clusteranalyse ● Die Clusteranalyse gehört zu den strukturen-entdeckenden Verfahren ● Ziel: Zusammenfassen von Objekten zu Gruppen (Clustern), innerhalb derer sich möglichst ähnliche Objekte befinden, während zwischen den Gruppen die Ähnlichkeiten möglichst gering sein sollen (homogen <> heterogen) ● Beispiele: Finden von Persönlichkeitstypengruppen anhand verschiedener psychografischer Merkmale oder Finden von Käufergruppen anhand von Variablen, die Nachfrage- und Kaufverhalten charakterisieren ● Problemstellung: Wie lässt sich bestimmen, welche Objekte einander ähnlich sind? Zuordnungsübersicht 25 26 1,000 0 0 20 23 24 1,000 0 0 18 21 22 1,000 0 0 13 19 20 1,000 0 0 13 17 18 1,000 0 0 14 15 16 1,000 0 0 15 12 14 1,000 0 0 18 10 13 1,000 0 0 16 3 11 1,000 0 0 17 8 9 1,000 0 0 14 5 6 1,000 0 0 19 1 4 1,000 0 0 21 19 21 1,500 4 3 23 8 17 1,500 10 5 19 7 15 1,500 0 6 20 2 10 1,500 0 8 17 2 3 1,833 16 9 21 12 23 2,000 7 2 22 5 8 2,000 11 14 22 7 25 3,167 15 1 24 1 2 3,300 12 17 23 5 12 3,583 19 18 25 1 19 4,286 21 13 24 1 7 5,182 23 20 25 1 5 6,338 24 22 0 Schritt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Cluster 1 Cluster 2 Zusammengeführte Cluster Koeffizienten Cluster 1 Cluster 2 Erstes Vorkommen des Clusters Nächster Schritt
  • 154. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Korrespondenzanalyse ● Auch die Korrespondenzanalyse gehört zu den strukturen-entdeckenden Verfahren ● Ziel: Visualisierung von Datentabellen > Veranschaulichung komplexer Daten und Zusammenhänge ● Verfahren der multidimensionalen Skalierung von nominalskalierten Variablen ● Darstellung der Zeilen und Spalten einer zweidimensionalen Kreuztabelle in einem gemeinsamen Raum ● Beispiel: Kunden werden gebeten, Merkmale wieWirkung und Bekanntheit bestimmten Medikamenten zuzuordnen ● Die Ergebnisse werden in einer Kontingenztabelle erfasst, sind aber in dieser Darstellungsform schlecht interpretierbar ● Mit Hilfe der Kontingenzanalyse lassen sich Medikamente und Merkmale aber grafisch in einem gemeinsamen Raum darstellen ● Dieser grafischen Darstellung (Bi-Plot) lässt sich dann entnehmen, wie die Medikamente (relativ zueinander) bezüglichder abgefragten Merkmale beurteilt werden ● Bi-Plots erfreuen sich in der Praxis großer Beliebtheit, sind aber nicht immer sinnvoll interpretierbar ● Ihre Gefahr liegt in ihrer Übersichtlichkeit, wegen der sie auch dort zum Einsatz kommen, wo methodische Voraussetzungen fehlen
  • 155. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Answer-Tree-Verfahren ● Bei Answer-Tree handelt es sich um ein SPSS-Zusatzmodul ● Mit diesem lässt sich eine Population über ein baumartiges Klassifikationssystem in Teilpopulationen unterteilen ● Das Ausgangsmodell besteht aus: ● einer abhängigen (Ziel-)Variablen (beispielsweise Käufer oder Nichtkäufer eines bestimmten Produktes) ● und verschiedenen unabhängigen (Prediktor-)Variablen (beispielsweise Geschlecht, Alter, Familienstand etc.) ● Anhand der Prediktor-Variablen soll die Population so aufgeteilt werden, dass sich die entstehenden Teilpopulationen bezüglich der Ziel-Variablen signifikant voneinander unterscheiden ● Das Ergebnis kann im Beispiel dazu verwendet werden, die wahrscheinlichsten Käufergruppen zu identifizieren
  • 156. ● Welche Bücher sollten Sie kennen? ● Brosius, F.: SPSS 11, Bonn, mitp-Verlag, 2002 ● Bleymüller, J.; Gehlert, G. & Gülicher, H.: Statistik für Wirtschaftswissenschaftler, München, Verlag Vahlen, 2000 ● Fahrmeir, L.; Künstler, R.; Pigeot, I. & Tutz, G.: Statistik – Der Weg zur Datenanalyse, Berlin, Springer, 1999 ● Hair, J.F.; Anderson, R.E.; Tatham, R.L. & Black, W.C.: Multivariate Data Analysis, New Jersey, Prentice Hall, 1998 Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zur Vorbereitung empfohlen....
  • 157. http://www.lulu.com/content/458434/ Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Zur Vorbereitung empfohlen....
  • 158. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Marktforschungs-Wiki http://marktforschung.wikia.com
  • 159. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Marktforschungs-Wiki http://statistikberatung.blogspot.com
  • 160. Einführung in SPSS • Wintersemester 2007 / 2008 • Christian Reinboth Gibt es noch Fragen?

Hinweis der Redaktion

  1. Guten Morgen und herzlich Willkommen zur „kick-off“- Einführungsveranstaltung der Vertiefungsrichtung Marktforschung in diesem Semester Ich freue mich, dass so viele Studentinnen und Studenten sich für das hochinteressante Gebiet der Marktforschung entschieden haben, und hoffe auf eine gute Zusammenarbeit Die Vertiefungsrichtungen – das wissen die älteren Kollegen aus dem siebten Semester – sind nicht mehr mit den Vorlesungen im Grundstudium gleichzusetzen Statt dessen ist eine aktive Mitarbeit von Seiten der Studierenden gefragt – es ist gewollt dass Sie sich einbringen und diese Veranstaltung mit ausfüllen und mitgestalten Darum werden Sie hier – und auch das kennen die älteren Kollegen bereits aus dem sechsten Semester – aktiv über Vorträge und Übungen in die Veranstaltung eingebunden Von diesen Vorträgen werden nicht nur Ihre Noten für dieses Semester abhängen, sie werden auch dazu dienen, Ihren Kommilitoninnen und Kommilitonen Teile des Vorlesungsstoffs zu vermitteln Gefragt ist also Ihre aktive Teilnahme an dieser Veranstaltung und ich hoffe, Sie nehmen das Angebot, sich hier einzubinden, auch an!
  2. Worum wird es in der ersten Vorlesung heute gehen? Zunächst einmal sage ich kurz ein paar Worte zu meiner Person, soweit Sie dies noch nicht von Prof. Lammers gehört haben Danach geht es nochmal um die wesentlichen Inhalte dieser Vertiefungsrichtung und um einige organisatorische Fragen bezüglich der Prüfungsleistungen, der Teilleistungen und der Fachprüfung Anschließend wenden wir uns kurz der Frage zu, worum es in der Marktforschung eigentlich geht, womit wir uns in der Vertiefungsrichtung beschäftigen werden und natürlich auch um die wichtige Frage, warum man sich überhaupt mit der Marktforschung befassen sollte – vielleicht denken einige von Ihnen ja darüber nach, sich später auch einmal beruflich in diese Richtung zu orientieren Das Ganze ist also mehr eine Einführung für diejenigen, die dieses Semester hier anfangen, vielleicht können Ihnen die älteren Semester ja auch noch etwas darüber verraten, warum sie sich für die Vertiefungsrichtung entschieden haben und was ihnen daran bislang gefällt. Anschließend werden wir in aller Ruhe die Themen für dieses und nächstes Semester durchgehen, so dass sie Zeit haben sich in Gruppen zu finden und zu überlegen, zu welchem dieser Themen Sie gerne referieren möchten
  3. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer
  4. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer
  5. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer
  6. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer
  7. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer
  8. Was ist zur Vertiefungsrichtung allgemein zu sagen? Wir haben eine schöne Mischung aus verschiedenen Studienrichtungen und auch aus Diplom- und Bachelor-Studiengängen – das sollten wir ausnutzen und die Synnergieeffekte nutzen, die sich daraus ergeben Wir haben einmal die Woche einen Termin über 4 SWS, d.h. diese 2 Vorlesungen am Dienstag in der Frühe Pro Themenbereich wird es 4 Vorlesungen geben Eine Vorlesung als theoretische Einführung durch mich Zwei Vorlesungen als praktische Präsentation durch Sie Eine Vorlesung als gemeinsame Übung durch die Studenten, die präsentiert haben und mich gemeinsam Dieses Semester gibt es 6 Themen, nächstes Semester nochmal 3 dazu, so dass insgesamt 9 Themen verbleiben, die wir unter Ihnen aufteilen müssen Ihre Kommilitonen aus dem siebten Semester kennen das ja alles schon und haben ihre Referate, vermute ich, alle schon gehalten (?) Wir werden jedes dieser Themen, auch die aus dem nächsten Semester heute einzeln und in Ruhe durchgehen, damit Sie sich überlegen können, welches Thema Sie mit welchen Kommilitonen gerne bearbeiten würden
  9. Was ist zur Vertiefungsrichtung allgemein zu sagen? Wir haben eine schöne Mischung aus verschiedenen Studienrichtungen und auch aus Diplom- und Bachelor-Studiengängen – das sollten wir ausnutzen und die Synnergieeffekte nutzen, die sich daraus ergeben Wir haben einmal die Woche einen Termin über 4 SWS, d.h. diese 2 Vorlesungen am Dienstag in der Frühe Pro Themenbereich wird es 4 Vorlesungen geben Eine Vorlesung als theoretische Einführung durch mich Zwei Vorlesungen als praktische Präsentation durch Sie Eine Vorlesung als gemeinsame Übung durch die Studenten, die präsentiert haben und mich gemeinsam Dieses Semester gibt es 6 Themen, nächstes Semester nochmal 3 dazu, so dass insgesamt 9 Themen verbleiben, die wir unter Ihnen aufteilen müssen Ihre Kommilitonen aus dem siebten Semester kennen das ja alles schon und haben ihre Referate, vermute ich, alle schon gehalten (?) Wir werden jedes dieser Themen, auch die aus dem nächsten Semester heute einzeln und in Ruhe durchgehen, damit Sie sich überlegen können, welches Thema Sie mit welchen Kommilitonen gerne bearbeiten würden
  10. Worum geht es nun in der Marktforschung Die Marktforschung ist der Teil des Unternehmens, der dieses mit der Außenwelt verbindet Unternehmen betreiben Marktforschung um Wissen über verschiedene Märkte zu sammeln und zu analysieren. Man möchte Unsicherheiten über zukünftige Entwicklungen beseitigen und eine Vorstellung davon bekommen, wie sich bestimmte eigene Entscheidungen auswirken können. Außerdem dienen die gewonnenen Daten auch Controlling-Zwecken und verbinden ganz generell das Unternehmen mit seiner Umwelt, d.h. man erfährt vieles über Kunden und Konkurrenten, Preise und Produkte, was für die eigene Arbeit wichtig ist Generell unterscheidet man in 5 Phasen In der Definitionsphase definiert man ganz eindeutig den Informationsbedarf, d.h. welche Fragen wollen wir über die Marktforschung klären und wie setzen wir die Studie an In der Designphase werden grundlegende Entscheidungen getroffen, z.B. Primär vs. Sekundär oder Befragung vs. Beobachtung In der Datengewinnungsphase wird die tatsächliche Erhebung und Speicherung der Daten durchgeführt Die Datenanalysephase beschäftigt sich mit der EDV-Umsetzung der Daten und dann der Kodierung, Auswertung und Interpretation der Ergebnisse – dies wird unsere Hauptphase in der VTR sein! Wir werden aber auch über die anderen Phasen sprechen, darunter auch die Dokumentationsphase, wenn wir uns überlegen, wie Interpretationsergebnisse darzustellen sind
  11. Warum sollten Sie nun Marktforschung studieren? Nun, vor allem natürlich weil Sie sich dafür begeisten können, aber natürlich auch deshalb, weil Marktforschung Ihnen sehr gute Berufsaussichten bietet Obwohl die allgemeine Wirtschaftslage schon seit langem angespannt ist, verzeichnet die Marktforschung weiterhin hervorragende Wachstumsraten und gerade im Bereich der Online-Marktforschung tun sich zur Zeit hochinteressante neue Anwendungen und Chancen auf Warum ist gerade die Marktforschung so interessant? Die Produktlebenszyklen im Konsumerbereich werden immer kürzer Eine Digitalkamera ist heute beispielsweise noch 6 bis 8 Monate auf dem Markt, wobei die Masse des Gewinns in den ersten 2 Monaten erwirtschaftet wird Das bedeutet, man braucht akkurate Informationen über Kunden und Märkte schnell und zeitnah, damit man nach dem ersten Monat noch etwas machen kann und nicht erst am Jahresende feststellt, warum die Dinge nicht so gelaufen sind wie geplant Dazu werden gut ausgebildete Fachleute benötigt, die nicht nur mit SPSS umgehen können, sondern vor allem auch verstehen was sie da eigentlich tun Dies ist besonders wichtig im wachsenden Bereich der Online-Marktforschung, wo sehr häufig die methodischen Hintergründe hinter den technischen Möglichkeiten zurückbleiben und nicht genügend Beachtung finden Frage an die siebten Semester: Warum haben Sie Marktforschung gewählt?
  12. SPSS – das kennen Sie bereits aus dem Vorkurs zur VTR Mit SPSS werden Sie hier in den nächsten zwei bzw. einem Semester sehr viel arbeiten und das auch außerhalb dieser einen Vorlesung Es wäre also gut, wenn Sie sich mit SPSS vertraut machen würden Dazu gibt es mehrere Möglichkeiten: Sie können in den SPSS-Übungsraum gehen, den Schlüssel dazu bekommen Sie bei Frau Stolte im Dekanat des Fachbereichs W Sie können auch zu Herrn Zock in der Papierfabrik gehen und versuchen, noch eine SPSS 12 Studentenversion zu bekommen Wir verwenden hier SPSS 13, aber SPSS 12 ist nicht sehr viel anders und Sie können auch damit gut arbeiten bzw. sich auf Ihre Referate vorbereiten Das können Sie aber eben auch in besagtem Übungsraum tun Ich würde Sie bitten, einmal eine Liste mit Namen und u-Nummern, natürlich nicht Matrikelnummern, zu machen, damit ich auch eine Kursliste habe und Frau Stolte eine Kopie zukommen lassen kann, damit sie weiss, wer den Schlüssel für den Raum bekommen kann und wer nicht Dazu kommt noch, dass ich generell gerne Ihre Namen und u-Nummern hätte, damit ich einen kleinen E-Mail-Verteiler einrichten kann – so können wir unseren Kurs auch außerhalb der Vorlesungszeiten fortsetzen und ein wenig e-Learning betreiben
  13. Was ist zur Vertiefungsrichtung allgemein zu sagen? Wir haben eine schöne Mischung aus verschiedenen Studienrichtungen und auch aus Diplom- und Bachelor-Studiengängen – das sollten wir ausnutzen und die Synnergieeffekte nutzen, die sich daraus ergeben Wir haben einmal die Woche einen Termin über 4 SWS, d.h. diese 2 Vorlesungen am Dienstag in der Frühe Pro Themenbereich wird es 4 Vorlesungen geben Eine Vorlesung als theoretische Einführung durch mich Zwei Vorlesungen als praktische Präsentation durch Sie Eine Vorlesung als gemeinsame Übung durch die Studenten, die präsentiert haben und mich gemeinsam Dieses Semester gibt es 6 Themen, nächstes Semester nochmal 3 dazu, so dass insgesamt 9 Themen verbleiben, die wir unter Ihnen aufteilen müssen Ihre Kommilitonen aus dem siebten Semester kennen das ja alles schon und haben ihre Referate, vermute ich, alle schon gehalten (?) Wir werden jedes dieser Themen, auch die aus dem nächsten Semester heute einzeln und in Ruhe durchgehen, damit Sie sich überlegen können, welches Thema Sie mit welchen Kommilitonen gerne bearbeiten würden
  14. Was ist zur Vertiefungsrichtung allgemein zu sagen? Wir haben eine schöne Mischung aus verschiedenen Studienrichtungen und auch aus Diplom- und Bachelor-Studiengängen – das sollten wir ausnutzen und die Synnergieeffekte nutzen, die sich daraus ergeben Wir haben einmal die Woche einen Termin über 4 SWS, d.h. diese 2 Vorlesungen am Dienstag in der Frühe Pro Themenbereich wird es 4 Vorlesungen geben Eine Vorlesung als theoretische Einführung durch mich Zwei Vorlesungen als praktische Präsentation durch Sie Eine Vorlesung als gemeinsame Übung durch die Studenten, die präsentiert haben und mich gemeinsam Dieses Semester gibt es 6 Themen, nächstes Semester nochmal 3 dazu, so dass insgesamt 9 Themen verbleiben, die wir unter Ihnen aufteilen müssen Ihre Kommilitonen aus dem siebten Semester kennen das ja alles schon und haben ihre Referate, vermute ich, alle schon gehalten (?) Wir werden jedes dieser Themen, auch die aus dem nächsten Semester heute einzeln und in Ruhe durchgehen, damit Sie sich überlegen können, welches Thema Sie mit welchen Kommilitonen gerne bearbeiten würden
  15. SPSS – das kennen Sie bereits aus dem Vorkurs zur VTR Mit SPSS werden Sie hier in den nächsten zwei bzw. einem Semester sehr viel arbeiten und das auch außerhalb dieser einen Vorlesung Es wäre also gut, wenn Sie sich mit SPSS vertraut machen würden Dazu gibt es mehrere Möglichkeiten: Sie können in den SPSS-Übungsraum gehen, den Schlüssel dazu bekommen Sie bei Frau Stolte im Dekanat des Fachbereichs W Sie können auch zu Herrn Zock in der Papierfabrik gehen und versuchen, noch eine SPSS 12 Studentenversion zu bekommen Wir verwenden hier SPSS 13, aber SPSS 12 ist nicht sehr viel anders und Sie können auch damit gut arbeiten bzw. sich auf Ihre Referate vorbereiten Das können Sie aber eben auch in besagtem Übungsraum tun Ich würde Sie bitten, einmal eine Liste mit Namen und u-Nummern, natürlich nicht Matrikelnummern, zu machen, damit ich auch eine Kursliste habe und Frau Stolte eine Kopie zukommen lassen kann, damit sie weiss, wer den Schlüssel für den Raum bekommen kann und wer nicht Dazu kommt noch, dass ich generell gerne Ihre Namen und u-Nummern hätte, damit ich einen kleinen E-Mail-Verteiler einrichten kann – so können wir unseren Kurs auch außerhalb der Vorlesungszeiten fortsetzen und ein wenig e-Learning betreiben
  16. SPSS – das kennen Sie bereits aus dem Vorkurs zur VTR Mit SPSS werden Sie hier in den nächsten zwei bzw. einem Semester sehr viel arbeiten und das auch außerhalb dieser einen Vorlesung Es wäre also gut, wenn Sie sich mit SPSS vertraut machen würden Dazu gibt es mehrere Möglichkeiten: Sie können in den SPSS-Übungsraum gehen, den Schlüssel dazu bekommen Sie bei Frau Stolte im Dekanat des Fachbereichs W Sie können auch zu Herrn Zock in der Papierfabrik gehen und versuchen, noch eine SPSS 12 Studentenversion zu bekommen Wir verwenden hier SPSS 13, aber SPSS 12 ist nicht sehr viel anders und Sie können auch damit gut arbeiten bzw. sich auf Ihre Referate vorbereiten Das können Sie aber eben auch in besagtem Übungsraum tun Ich würde Sie bitten, einmal eine Liste mit Namen und u-Nummern, natürlich nicht Matrikelnummern, zu machen, damit ich auch eine Kursliste habe und Frau Stolte eine Kopie zukommen lassen kann, damit sie weiss, wer den Schlüssel für den Raum bekommen kann und wer nicht Dazu kommt noch, dass ich generell gerne Ihre Namen und u-Nummern hätte, damit ich einen kleinen E-Mail-Verteiler einrichten kann – so können wir unseren Kurs auch außerhalb der Vorlesungszeiten fortsetzen und ein wenig e-Learning betreiben
  17. SPSS – das kennen Sie bereits aus dem Vorkurs zur VTR Mit SPSS werden Sie hier in den nächsten zwei bzw. einem Semester sehr viel arbeiten und das auch außerhalb dieser einen Vorlesung Es wäre also gut, wenn Sie sich mit SPSS vertraut machen würden Dazu gibt es mehrere Möglichkeiten: Sie können in den SPSS-Übungsraum gehen, den Schlüssel dazu bekommen Sie bei Frau Stolte im Dekanat des Fachbereichs W Sie können auch zu Herrn Zock in der Papierfabrik gehen und versuchen, noch eine SPSS 12 Studentenversion zu bekommen Wir verwenden hier SPSS 13, aber SPSS 12 ist nicht sehr viel anders und Sie können auch damit gut arbeiten bzw. sich auf Ihre Referate vorbereiten Das können Sie aber eben auch in besagtem Übungsraum tun Ich würde Sie bitten, einmal eine Liste mit Namen und u-Nummern, natürlich nicht Matrikelnummern, zu machen, damit ich auch eine Kursliste habe und Frau Stolte eine Kopie zukommen lassen kann, damit sie weiss, wer den Schlüssel für den Raum bekommen kann und wer nicht Dazu kommt noch, dass ich generell gerne Ihre Namen und u-Nummern hätte, damit ich einen kleinen E-Mail-Verteiler einrichten kann – so können wir unseren Kurs auch außerhalb der Vorlesungszeiten fortsetzen und ein wenig e-Learning betreiben
  18. SPSS – das kennen Sie bereits aus dem Vorkurs zur VTR Mit SPSS werden Sie hier in den nächsten zwei bzw. einem Semester sehr viel arbeiten und das auch außerhalb dieser einen Vorlesung Es wäre also gut, wenn Sie sich mit SPSS vertraut machen würden Dazu gibt es mehrere Möglichkeiten: Sie können in den SPSS-Übungsraum gehen, den Schlüssel dazu bekommen Sie bei Frau Stolte im Dekanat des Fachbereichs W Sie können auch zu Herrn Zock in der Papierfabrik gehen und versuchen, noch eine SPSS 12 Studentenversion zu bekommen Wir verwenden hier SPSS 13, aber SPSS 12 ist nicht sehr viel anders und Sie können auch damit gut arbeiten bzw. sich auf Ihre Referate vorbereiten Das können Sie aber eben auch in besagtem Übungsraum tun Ich würde Sie bitten, einmal eine Liste mit Namen und u-Nummern, natürlich nicht Matrikelnummern, zu machen, damit ich auch eine Kursliste habe und Frau Stolte eine Kopie zukommen lassen kann, damit sie weiss, wer den Schlüssel für den Raum bekommen kann und wer nicht Dazu kommt noch, dass ich generell gerne Ihre Namen und u-Nummern hätte, damit ich einen kleinen E-Mail-Verteiler einrichten kann – so können wir unseren Kurs auch außerhalb der Vorlesungszeiten fortsetzen und ein wenig e-Learning betreiben
  19. (nominalskalierte Werte haben keine natürliche Ordnung)
  20. Grundfrage: Wofür setze ich die Multiple Regression ein? Antwort: Um die Beziehung zwischen einer abhängigen und einer (im sogenannten univariaten Fall) oder mehrerer (im sogenannten multivariaten Fall) zu untersuchen. Mit den Ergebnissen dieser Analyse lassen sich Zusammenhänge zwischen Variablen quantitativ darstellen und erklären (in der Ursachenanalyse), außerdem kann die Regressionsgleichung natürlich dazu verwendet werden, die Werte der abhängigen Variablen zu prognostizieren (bekannt aus der einfachen linearen Regression in Statistik I) Beispiel: Wie verändert sich die Absatzmenge eines Produktes in Abhängigkeit von Werbeausgaben oder Verkaufsveranstaltungen Die Absatzmenge ist in diesem Fall die abhängige Variable, die Werbeausgaben und Verkaufsveranstaltungen die unabhängigen Das Ergebnis des Verfahren ist die lineare Regressionsfunktion Im univariaten Fall enthält sie nur eine einzige Variable, im multivariaten Fall rein theoretisch beliebig viele Ein Problem ergibt sich noch bei den sogenannten interdependenten Beziehungen Dies sind Beziehungen, bei denen nicht automatisch einsichtig ist, welche Variable welche andere Variable beeinflusst So könnte man denken, dass das Produkt, welches sich in höheren Stückzahlen verkauft auch bekannter ist, aber auch, dass das bekanntere Produkt sich in höheren Stückzahlen verkauft Solche logischen „Teufelskreise“ werden als interdependente Beziehungen bezeichnet, und sind nicht in einzelnen Gleichungen erfassbar, sondern nur in komplexen Mehrgleichungsmodellen Die Berechnung solcher Mehrgleichungsmodelle ist nicht Inhalt dieser Veranstaltung
  21. Das R² immer zwischen 0 und 1 liegen muss, kann man sich leicht klarmachen, wenn man bedenkt, dass durch das Quadrieren weder ESS noch TSS je negativ werden können und ESS als Teil von TSS nie größer als TSS werden kann, so dass durch die Division logischerweise eine positive Zahl zwischen 0 und 1 entstehen muss Wieder ist zu beachten, dass R² nur ein Maß für den linearen Zusammenhang darstellt, aber nicht für anderen Zusammenhangsformen, d.h. ein 100%ig perfekter linearer Zusammenhang kann in einem niedrigen R² resultieren – ein niedriges R² ist daher keinesfalls so zu interpretieren, dass gar kein Zusammenhang vorliegt – nur eben kein linearer
  22. Korrelation mit sich selbst = falsch Zusammenhang WSK des Fehlens mit Variable &amp;gt; Hair
  23. Was ist zur Vertiefungsrichtung allgemein zu sagen? Wir haben eine schöne Mischung aus verschiedenen Studienrichtungen und auch aus Diplom- und Bachelor-Studiengängen – das sollten wir ausnutzen und die Synnergieeffekte nutzen, die sich daraus ergeben Wir haben einmal die Woche einen Termin über 4 SWS, d.h. diese 2 Vorlesungen am Dienstag in der Frühe Pro Themenbereich wird es 4 Vorlesungen geben Eine Vorlesung als theoretische Einführung durch mich Zwei Vorlesungen als praktische Präsentation durch Sie Eine Vorlesung als gemeinsame Übung durch die Studenten, die präsentiert haben und mich gemeinsam Dieses Semester gibt es 6 Themen, nächstes Semester nochmal 3 dazu, so dass insgesamt 9 Themen verbleiben, die wir unter Ihnen aufteilen müssen Ihre Kommilitonen aus dem siebten Semester kennen das ja alles schon und haben ihre Referate, vermute ich, alle schon gehalten (?) Wir werden jedes dieser Themen, auch die aus dem nächsten Semester heute einzeln und in Ruhe durchgehen, damit Sie sich überlegen können, welches Thema Sie mit welchen Kommilitonen gerne bearbeiten würden
  24. Was ist zur Vertiefungsrichtung allgemein zu sagen? Wir haben eine schöne Mischung aus verschiedenen Studienrichtungen und auch aus Diplom- und Bachelor-Studiengängen – das sollten wir ausnutzen und die Synnergieeffekte nutzen, die sich daraus ergeben Wir haben einmal die Woche einen Termin über 4 SWS, d.h. diese 2 Vorlesungen am Dienstag in der Frühe Pro Themenbereich wird es 4 Vorlesungen geben Eine Vorlesung als theoretische Einführung durch mich Zwei Vorlesungen als praktische Präsentation durch Sie Eine Vorlesung als gemeinsame Übung durch die Studenten, die präsentiert haben und mich gemeinsam Dieses Semester gibt es 6 Themen, nächstes Semester nochmal 3 dazu, so dass insgesamt 9 Themen verbleiben, die wir unter Ihnen aufteilen müssen Ihre Kommilitonen aus dem siebten Semester kennen das ja alles schon und haben ihre Referate, vermute ich, alle schon gehalten (?) Wir werden jedes dieser Themen, auch die aus dem nächsten Semester heute einzeln und in Ruhe durchgehen, damit Sie sich überlegen können, welches Thema Sie mit welchen Kommilitonen gerne bearbeiten würden
  25. Damit kommen wir zum ersten Thema: Fragebögen, Interviews und Gruppendiskussionen Dies wird das Thema der ersten studentischen Präsentation in drei Wochen sein, wer das also wählt, hat es schnell hinter sich Hier wird noch nichts mit SPSS gerechnet werden, es geht lediglich um die Theorie Was kann man zum Beispiel für unterschiedliche Fragen stellen? Offene Fragen, geschlossene Fragen, Fragen mit grafischen Skalen, Fragen mit vorgegebenen Antwortsätzen.... Wie müssen Fragen eindeutig formuliert werden? Welches ist der höchste Schulabschluss den Sie besitzen, bzw. welchen Schulabschluss streben Sie an: Realschulabschluss, Abitur, ich gehe noch zur Schule.... Wie viele Fragen sollten überhaupt in so einem Fragebogen sein? Was für Interviewtypen gibt es? Persönliche Interviews, telefonische Interviews, Interviews mit oder ohne Arbeitsmaterial... Wie müssen Interviewer an so ein Interview herangehen? Was gibt es für Interviewereffekte? Zum Beispiel den Effekt der sozialen Erwünschtheit, wenn der Interviewte so antwortet, wie es gesellschaftlich von ihm erwartet wird, beispielsweise bei Fragen über rechtsradikale Parteien oder Ausländerfeindlichkeit Auch spannend: Gruppendiskussionen. Wie laufen solche Diskussionen ab? Welche Aufgaben hat der Moderator? Wie kann man schüchterne Menschen ermutigen und einschüchternde Menschen ausbremsen? Was gibt es eigentlich für Gruppendiskussionen? Panels, Expertenrunden, Delphis.....
  26. Auch im zweiten Thema – eines meiner Lieblingsthemen und mit Sicherheit das aktuellste von allen – wird es noch keine SPSS-Rechnungen geben Hier geht es um die neuen Möglichkeiten, Marktforschung im Internet zu betreiben – das ist modern, technisch anspruchsvoll und vor allem sehr kostengünstig – bringt aber auf der anderen Seite auch viele methodische Probleme mit sich Wie wähle ich zum Beispiel die Teilnehmer aus? E-Mail, Banner oder Pop-Ups? Kann ich Teilnehmer per Zufall auswählen? Oder wählen sie sich im Internet irgendwie selbst aus, ein Phänomen was auch als Selbstselektion bezeichnet wird? Welche Folgen kann Selbstselektion haben? Denken Sie nur an das Literary Digest Desaster von 1936 während des Präsidentschaftsrennens zwischen Franklin Delanor Roosevelt und Artie Landon und an „Landon in a Landslide“ Wie kann ich im Internet Teilnehmer ansprechen? Was muss ich machen, damit Marktforschung nicht mir Marketing verwechselt wird? Jeder kennt ja das Spam-Problem selbst..... Die Telefonwerbung hat schon die Möglichkeiten der Marktforschung per Telefon erheblich eingeschränkt – wie verhindern wir, das dies auch im Internet passiert? Wie kann ich Teilnehmer motivieren? Wie kann ich Ihnen Incentives über das Internet zukommen lassen – vor allem bei anonymen Befragungen? Wie verhindere ich, dass Leute für die Incentives einfach mehrfach teilnehmen oder sonst wie manipulativ eingreifen? Und wie stelle ich überhaupt Fragebögen mit HTML ins Interent....?
  27. Die explorative Datenanalyse ist das erste der vier klausurrelevanten Themen in diesem Semester Das Ziel der explorativen Datenanalyse ist es, erst einmal einen Überblick über die vorliegenden Daten zu erhalten. Was ist an der Verteilung eines Merkmals bemerkenswert oder auffällig? Vieles kennen Sie bereits aus der Statistik I oder der Statistik II und auch aus dem SPSS-Kurs Beispielsweise die Mittelwerte wie das arithmetische Mittel oder den Median oder auch die Lagemaße wie die Spannweite oder die Standardabweichung Kennen sollten Sie ebenfalls bereits die Ausreißer bzw. die Möglichkeit, dass solche auftreten können – neu wird dann sein, wie man diese analysiert und mit ihnen umgeht Die explorative Datenanalyse enthält auch viele grafische Darstellungen wie Balken- und Kreisdiagramme oder Box-Plots Dazu kommt noch die spannende Frage, was uns fehlende Daten in unseren Datensätzen sagen oder wie wir feststellen können, ob die Voraussetzungen für weitergehende Analysen gegeben sind, beispielsweise das Vorliegen einer Normalverteilung oder eine Gleichheit der Varianzen in verschiedenen Gruppen
  28. Das nächste spannende Thema wird die multiple Regression werden Sie kennen die Regression bereits aus Statistik I: Lineare Regression Bei der linearen Regression haben Sie versucht, ein Vorhersagemodell auf der Basis einer abhängigen und einer unabhängigen Variablen zu konstuieren, zwischen denen es einen linearen Zusammenhang gab Nun stellen Sie sich vor, sie haben nicht nur eine unabhängige sonder zwei, drei oder noch mehr unabhängige Variablen, die alle die abhängige Variable beeinflussen Natürlich können Sie das nicht mehr so einfach grafisch darstellen, auch wenn drei Dimensionen noch möglich sind, wie man hier sehen kann Die multiple Regression ist aufgrund ihrer vielseitigen Anwendbarkeit eines der am häufigsten eingesetzten und auch eines der allerwichtigsten Verfahren überhaupt Wer später einmal in der Marktforschung arbeiten möchte, sollte sich dies hier sehr gut einprägen
  29. Die Varianzanalyse ist das dritte der vier klausurrelevanten Themen dieses Semesters Es geht hier im wesentlichen um die Beantwortung der Frage, ob zwischen zwei Gruppen ein Mittelwertunterschied besteht Dabei wird die Varianz untersucht, also die Streuung der Werte um diesen Mittelwert Es wird getestet, ob die Varianz zwischen den Gruppen größer ausfällt als die Varianz innerhalb der Gruppen Im Ergebnis kann etwas darüber ausgesagt werdenl, ob sich die Gruppen bezüglich der abhängigen Variablen signifikant voneinander unterscheiden, bzw. welche Variablen eine Einteilung in Gruppen rechtfertigen Das Verfahren kann als ANOVA mit einer unabhängigen Variablen oder als MANOVA mit zwei oder noch mehr unabhängigen Variablen durchgeführt werden
  30. Die Faktorenanalyse ist
  31. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer
  32. Bevor wir zu den wirklich wichtigen Sachen kommen, noch schnell ein paar Sätze über mich Wie Sie sehen können, bin ich nicht wesentlich älter als Sie es vermutlich sind und habe zudem meine bisherige Unterrichtserfahrung als HiWi und Tutor gesammelt Wir wollen aber trotzdem versuchen, die Veranstaltung hier nicht zu „locker“ und relaxed werden zu lassen, da Sie sie sonst vielleicht nicht mehr ernst genug nehmen Es geht hier aber immerhin um eine Vertiefungsrichtung, das heisst, Sie wollen auch am Ende eine Fachprüfung schreiben, die nicht ganz so einfach ist und vielleicht ja sogar Ihre Diplom- oder Bachelor-Arbeit in diesem Bereich ansiedeln Ich habe das übrigens auch gemacht und meine Diplomarbeit im letzten Jahr über Stichprobenziehung und die Umsetzung von Zufallsverfahren im Internet geschrieben, also im Bereich der sogenannten Online-Marktforschung Seitdem arbeite ich als wissenschaftlicher Mitarbeiter im anderen Fachbereich und freue mich, in diesem Semester Herrn Prof. Lammers vertreten zu können Ich habe ein Büro im IGZ, wo ich jederzeit für Sie erreichbar bin, auch außerhalb der Sprechzeiten oder am Wochenende Wenn etwas sein sollte, bitte sagen Sie Bescheid und kommen Sie dann vorbei, einen Termin finden wir immer