Grundbegriffe der statistik

2.557 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
2.557
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
6
Aktionen
Geteilt
0
Downloads
30
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Grundbegriffe der statistik

  1. 1. Grundbegriffe der Statistik Skript Kapitel 6.2, Seite 130
  2. 2. Grundbegriffe der Statistik Ich glaube nur der Statistik, die ichselbst gefälscht habe
  3. 3. „Wer misst, misst Mist...“ Analysenergebnisse sind stets mit einem Fehler behaftet Mit Hilfe von statistischen Verfahren lassen sich diese Fehler objektiv beurteilen
  4. 4. Fehler Fehler = Differenz zwischen dem wahren und dem gemessenen Wert Bei „normalen“ Proben kennen wir nur den Messwert, nicht aber den wahren Wert Wir unterscheiden zwischen zufälligen und systematischen Fehlern
  5. 5. Arten von Fehlern:der zufällige Fehler • Die Werte streuen zufällig Wahrer Wert sich um einen und häufen mittleren Wert. • Entsteht während der Messung durch nicht beherr- schte Änderungen der Probe und der Messgeräte. • Unregelmässig bezüglich Betrag und Vorzeichen. • Beispiel: Zittern der letzten Ziffer beim Einwägen.
  6. 6. Arten von Fehlern:der systematische Fehler • Die Werte weichen deutlich Wahrer Wert Wert ab. vom wahren • Entsteht durch bleibende Unvollkommenheiten im Analysenverfahren und in der Probe. • Beispiel: Falsche Einwaage bei der Herstellung einer 0.1 molaren Natriumoxalat- lösung.
  7. 7. Messunsicherheit:Präzision und Genauigkeit Die Präzision (auch Reproduzierbar- keit) sagt aus, wie gut die Ergebnisse mehrerer Analysen untereinander übereinstimmen. Die Genauigkeit (auch Richtigkeit) beschreibt, wie gut die Ergebnisse mit dem wahren Wert übereinstimmen.
  8. 8. Messunsicherheit:Präzision und Genauigkeit Zufällige Fehler Systematische Fehler Präzision Genauigkeit(Reproduzierbarkeit) (Richtigkeit) Messunsicherheit
  9. 9. Zufällige und systematischeFehler Genauigkeit: gut Genauigkeit: schlechtPräzision: schlecht Präzision: gut
  10. 10. Statistische Kenngrössen:Mittelwert Auch „Durchschnitt“ genannt Formelzeichen⎯x („x quer“) Berechnet sich aus der Summe aller Messwerte xi geteilt durch die Anzahl der Werte n: x= x1 + x 2 + x 3 + ... = ∑x i n n
  11. 11. Statistische Kenngrössen: MittelwertGesamt-Phosphor Messwerte:im Belebtschlamm 5.9 mg P/l 5.4 mg P/l 7 5.8 4 9 5.8 mg P/l 5.7 mg P/l 22.8 mg P/l : 4 = 5.7 mg P/l
  12. 12. Statistische Kenngrössen:Mittlerer Fehler Vergleich eines Messwertes mit dem Mittelwert einzelner absoluter Fehler d Mittelwert aus allen absoluten Fehlern mittlerer Fehler⎯d Berechnung: d1 + d2 + d3 + ... d= n d= x1 − x + x 2 − x + x 3 − x + ... = ∑ (x − x) i n n
  13. 13. Statistische Kenngrössen:Mittlerer FehlerMess- Fehler absoluterwert (Messwert - Mittelwert) Fehler d 5.9 5.9 - 5.7 = 0.2 0.2 5.4 5.4 - 5.7 = -0.3 0.3 5.8 5.8 - 5.7 = 0.1 0.1 5.7 5.7 – 5.7 = 0.0 0.0 0.6 : 4 = Mittlerer Fehler = 0.15 mg P/l
  14. 14. Statistische Kenngrössen: Standardabweichung Wichtiges Mass für die Streuung Die absoluten Fehler werden vor dem Zusammenzählen quadriert, nach der Mittelwertbildung wird die Wurzel gezogen Bei Stichproben wird durch n-1 dividiert Berechnung:s= 2 2 2 (x 1 − x ) + (x 2 − x ) + (x 3 − x ) + ... = ∑ (x i − x) 2 n −1 n −1
  15. 15. Statistische Kenngrössen:StandardabweichungMess- Fehler Fehler-wert (Messwert - Mittelwert) Quadrat 5.9 5.9 - 5.7 = 0.2 0.04 5.4 5.4 - 5.7 = -0.3 0.09 5.8 5.8 - 5.7 = 0.1 0.01 n-1 5.7 5.7 – 5.7 = 0.0 0.00 0.14 : 3 = 0.0467 davon die Quadratwurzel 0.216 Standardabweichung = 0.22 mg P/l
  16. 16. Statistische Kenngrössen:Relative Standardabweichung Die relative Standardabweichung (Variations- koeffizient V) erlaubt den Vergleich der Streuung unterschiedlicher Konzentrationen oder Parameter Die Standardabweichung wird relativ zum Mittelwert ausgedrückt (in Prozent) Berechnung: s V = ⋅100% x
  17. 17. Statistische Kenngrössen:Relative Standardabweichung Probe Mittelwert Standardabweichung 1 5.7 mg P/l 0.22 mg P/l 2 1.2 mg P/l 0.09 mg P/lBei welcher Probe war die Messung reproduzierbarer?Antwort gibt die relative Standardabweichung: 0.22Probe 1 : V = ⋅100% = 3.86% 5.7 0.09Probe 2 : V = ⋅100% = 7.5% 1.2
  18. 18. Normalverteilung:TabelleKaliumpermanganatverbrauch [mg/l] Gruppe Anzahl 316 341 303 340 260 354 -250 1 337 320 356 327 300 380 251-275 3 327 316 316 379 319 322 276-300 2 348 344 327 305 274 340 301-325 15 284 403 310 335 350 369 326-350 15 322 360 316 340 319 319 351-375 6 360 272 360 338 310 379 376-400 3 341 250 316 332 401- 1Um die Verteilung der Daten darstellen zu können, teilenwir die Resultate in acht Gruppen ein und zählen dieMesswerte in jeder Gruppe.
  19. 19. Normalverteilung:Häufigkeitsdiagramm Häufigkeitsverteilung der KMnO4-ResultateGruppe Anzahl 16 -250 1 14 Anzahl Messwerte251-275 3 12 10276-300 2 8301-325 15 6326-350 15 4 2351-375 6 0376-400 3 -250 251- 275 276- 300 301- 325 326- 350 351- 375 376- 400 401- 401- 1 mg KMnO4/lDie grafische Darstellung der gruppierten Daten nenntman Häufigkeitsdiagramm oder Histogramm.
  20. 20. Normalverteilung: Gaußsche Glockenkurve • keine systematischen Fehler • Gruppenbreite 5 mg/l • sehr viele MessergebnisseC.F. Gauß (1777-1855) 230 245 260 275 290 305 320 335 350 365 380 395 410 425
  21. 21. Eigenschaften der Normalverteilung Mittelwert = 329 Wendepunkt Wendepunkt s=31 s=31 230 245 260 275 290 305 320 335 350 365 380 395 410 425• Kurve symmetrisch um den Mittelwert• Standardabweichung bestimmt die Wendepunkte
  22. 22. Eigenschaften der Normalverteilung s 95%s 2s 68% 2s 230 245 260 275 290 305 320 335 350 365 380 395 410 425• ca. 2/3 aller Messwerte liegen im Bereich ⎯x ± s• 19 von 20 Messwerten liegen im Bereich ⎯x ± 2s
  23. 23. Statistische Kenngrössen:Median Entspricht bei den nach der Grösse aufgelisteten Messwerten dem in der Mitte liegenden Wert Auch „Zentralwert“ genannt Unempfindlich gegenüber Ausreissern Entspricht bei exakt symmetrischen Verteilungen dem Mittelwert
  24. 24. Statistische Kenngrössen:Spannweite Differenz zwischen dem grössten und dem kleinsten Wert einer Reihe von Messwerten Formelzeichen R Empfindlich gegenüber Ausreissern
  25. 25. Statistische Kenngrössen: Median und SpannweiteMesswerte 2.5 2.8 2.5 2.6 3.4 2.6 2.7 2.7 2.8 3.4Mittelwert 2.8Median 2.7Spannweite 0.9
  26. 26. Statistische Kenngrössen: MedianFall 1: Ungerade Anzahl Messwerte: 12.1 12.3 12.6 12.7 13.1Fall 2: Gerade Anzahl Messwerte: 5.4 5.7 5.8 5.9 5.75
  27. 27. Grafische Darstellungen:Diagramme Ein Bild sagt mehr Ein Bild sagt mehr als tausend Worte! als tausend Worte!
  28. 28. Grafische Darstellungen: XY-Diagramm 60 50 40 Das XY-Diagramm eignetY-Werte 30 sich dazu, Zusammenhänge 20 zwischen zwei Zahlen- 10 reihen darzustellen 0 0 2 4 6 X-Werte
  29. 29. Grafische Darstellungen: Balken/Säulen-Diagramm 60 50 Dieser Diagrammtyp eignet sich 40 z.B. für den Vergleich unter-Werte 30 schiedlicher Analysenmethoden, 20 Probentypen etc. 10 0 A B C D Kategorien
  30. 30. Grafische Darstellungen:Kuchen-Diagramm Gesamt-N Das Kuchendiagramm zeigtNH4 die prozentuelle AufteilungNO2 eines zusammengesetztenNO3 Werts in seine Komponenten.
  31. 31. Grafische Darstellungen:Regeln Auf optische Spielereien und unüber- sichtliche 3D-Darstellungen verzichten Nicht zu viele Daten ins gleiche Diagramm hineinzwängen Das Diagramm soll selbsterklärend sein Auf sinnvolle Skalierung der Achsen achten
  32. 32. Qualitätssicherung im Labor Skript Kapitel 6.3, Seite 134
  33. 33. AnalysenkenndatenWas leistet meine Analysenmethode?Eignet sie sich überhaupt für die Fragestellung? Methoden- validierung Analysenkenndaten
  34. 34. Analysenkenndaten:Präzision Mass für die Reproduzierbarkeit der gesamten analytischen Methode Berechnung der relativen Standard- abweichung aus mehreren Wiederhol- messungen der gleichen Probe Beispiel: Präzision der PO44-P-Messung Beispiel: Präzision der PO -P-Messung V = 3.86% (n=4, c=5.7 mg/l) V = 3.86% (n=4, c=5.7 mg/l)
  35. 35. Analysenkenndaten: Genauigkeit Abweichung eines Resultats vom wahren Wert Test mit einer Lösung bekannter Konzentration (z.B. Ringversuch)Beispiel: Genauigkeit KMnO44 beim RingversuchBeispiel: Genauigkeit KMnO beim RingversuchSollwert: 377 mg/l Messwert: 416 mg/lSollwert: 377 mg/l Messwert: 416 mg/lAbweichung: +39 mg/l bzw. +10.3%Abweichung: +39 mg/l bzw. +10.3%
  36. 36. Analysenkenndaten:Linearität Linearität einer Analysenmethode bedeutet, dass die Messwerte entweder direkt oder nach einer Umrechung proportional zur Konzentration der interessierenden Substanz sindBeispiele, wo die Linearität aufhört:Beispiele, wo die Linearität aufhört:• Extinktion bei hohen Konzentrationen• Extinktion bei hohen Konzentrationen• KMnO44 ab 5 ml Titrationsvolumen• KMnO ab 5 ml Titrationsvolumen
  37. 37. Analysenkenndaten:Messbereich Derjenige Konzentrationsbereich der interessierenden Substanz in der Probe, in dem eine Messung mit akzeptabler Präzision, Genauigkeit und Linearität möglich ist Beispiel: BSB55 Beispiel: BSB Messbereich Sauerstoff in der Messbereich Sauerstoff in der Verdünnung: 2 bis 6 mg O22/l Verdünnung: 2 bis 6 mg O /l
  38. 38. Analysenkenndaten:Robustheit Kleine Veränderungen im Verfahren sollen keinen Einfluss auf das Resultat haben Klärwärter A sollte das gleiche Ergebnis erhalten wie Klärwärter B
  39. 39. Analysenkenndaten:Nachweisgrenze Kleinste Konzentration in einer Probe, die noch nachgewiesen werden kann Der gemessene Wert muss sich vom Geräte-Rauschen unterscheidenBeispiel: ChromatografieBeispiel: ChromatografieRauschenRauschenNachweisgrenzeNachweisgrenze
  40. 40. Analysenkenndaten: Bestimmungsgrenze Kleinste Konzentration in einer Probe, die sich noch mit einer akzeptablen Präzision und Genauigkeit bestimmen lässtBeispiel: Unterschiedliche NH44-KonzentrationenBeispiel: Unterschiedliche NH -Konzentrationen• Präzision 5% bei 1 mg/l• Präzision 5% bei 1 mg/l• Präzision 10% bei 0.1 mg/l• Präzision 10% bei 0.1 mg/l Best.grenze Best.grenze• Präzision 30% bei 0.01 mg/l• Präzision 30% bei 0.01 mg/l
  41. 41. Analysenkenndaten:Selektivität / Spezifität Selektivität: Stören andere Komponenten in der Probe die Messung der interessierenden Substanz? Spezifität: Stammt das gemessene Signal wirklich von der interessierenden Substanz und nicht von anderen Komponenten aus der Probe?
  42. 42. Qualitätssicherung im Labor:Kontrollkarten Analysenmethode nicht zur bei der Einführung, sondern auch in der Routine regelmässig überprüfen Testlösung (Standard oder stabile Probe) mehrmals messen und die Präzision der Analyse bestimmen Im Routinebetrieb die Testlösung mitlaufen lassen Messergebnisse grafisch auswerten (auf Kontrollkarte eintragen)
  43. 43. Kontrollkarten:Beispiel KMnO4-Analysenmethode mit Zuckerlösung überprüfen Testlösung 7 mal messen: Mittelwert ⎯x = 214 mg/l Standardabw. s = 8 mg/l Warngrenzen bei ⎯x ± 2s (NV 95%) oben 230 mg/l, unten 198 mg/l Kontrollgrenzen bei ⎯x ± 3s (NV 99.7%) oben 238 mg/l, unten 190 mg/l
  44. 44. Kontrollkarten: Beispiel 250 240 Kontrollgrenze 230 Warngrenzemg KMnO4/l 220 Mittelwert 210 200 Warngrenze 190 Kontrollgrenze 180 0 2 4 6 8 10 12 14 16 Analysennummer
  45. 45. Kontrollkarten:Methode überprüfen bei... 1 Wert ausserhalb der Kontrollgrenze 7 aufeinanderfolgende Werte auf einer Seite der Mittelswertlinie 7 aufeinanderfolgende Werte mit ansteigender Tendenz 7 aufeinanderfolgende Werte mit absteigender Tendenz 2 von 3 aufeinanderfolgenden Werten ausserhalb der Warngrenze 10 von 11 Werten auf einer Seite der Mittelwertslinie
  46. 46. Aufdecken systematischerFehler Problem: Systematische Fehler werden durch Mehrfachbestimmungen mit der gleichen Methoden nicht entdeckt Lösung: - Überprüfung mit einer zweiten, unabhängigen Methode und/oder - Vergleichsmessung mit anderen Labors

×