SlideShare ist ein Scribd-Unternehmen logo
Testen und BewertenFortbildungsseminar für AHS-Lehrer22.09-23.09.2011, EisenstadtMag. Margarita Kolesnik-Eigentler Innsbruck
Performanz testen (nicht auswendig gelerntes)situativer Kontextmöglichst authentisch und handlungsorientiert testenmöglichst objektiv und transparent bewerten(Hinger/Hosp)⇨ Standardisierung und/ oder die gleichen Prinzipien des Testens bei der TesterstellungKommunikative SprachtestsM. Kolesnik-Eigentler, 2011
Fremdbewertung, Peer-Bewertung, SelbstbewertungSprachstandtests vs. Qualifikationsprüfungganzheitlich vs. analytischkontinuierlich vs. punktuellformativ vs. summativdirekt vs. indirektsubjektiv vs. objektivnormorienmtiert vs. kriterienorientiertGERS Kap. 9. Typen der BewertungM. Kolesnik-Eigentler, 2011
Sprachstandstest (Leistungstest, achievementtest) überprüft, ob bestimmte Ziele erreicht wurdenwas unterrichtet worden istbezieht sich auf die Arbeit einer Woche, eines Semesters, das Lehrbuch oder den Lehrplan. orientiert sich am Kurs stellt eine Binnenperspektive dar.Qualifikationsprüfung (auch: Feststellungsprüfung; proficiencytest) was jemand kann oder weiß, wenn er/sie einen Lerngegenstand im 'wirklichen Leben' anwendet.stellt eine Außenperspektive darM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertunghttp://www.goethe.de/Z/50/commeuro/i0.htm
Normorientierte  Bewertung  bringt die Lernenden in eine Rangfolge die Bewertung ihrer Leistungen erfolgt relativ zu den anderen Lernenden der Gruppe.Kriteriumsorientierte Bewertungder Lernende wird  lediglich in Bezug auf seine Fähigkeit in dem jeweiligen Gebiet bewertetunabhängig von der Fähigkeit der anderen LernendenM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Kontinuierliche Beurteilung Beurteilung von Leistungen in der Klasse, von Arbeiten und Projekten während des ganzen Kursesdurch die Lehrenden und eventuell durch die Lernenden. Abschlussnote spiegelt den ganzen Kurs/das Lernjahr/das Semester.Punktuelle Beurteilung  (Leistungsmessung zu einem festen Zeitpunkt)eine Prüfung oder eine anderen Form der Beurteilung, die an einem bestimmten Tag stattfindetWas vorher stattgefunden hat, ist irrelevantentscheidend ist, was die Person zum aktuellen Zeitpunkt tun kannM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Direkte Beurteilung was tut der Kandidat tatsächlichWenn z. B. eine kleine Gruppe etwas diskutiert, dann beobachtet der Beurteilende die Leistung, vergleicht sie mit einem Kriterienraster, bezieht die Leistungen auf die passendsten Kategorien des Rasters und gibt eine Beurteilung ab.beschränkt sich auf das Sprechen, Schreiben und Zuhören bei InteraktionenM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Indirekte Beurteilung ein Test, üblicherweise ein schriftlicher, der Kompetenzen und Fertigkeiten prüft, die einer Leistung zugrunde liegen.Leseverstehen z. B. kann nur indirekt überprüft werden, indem man die Lernenden dazu bringt, Belege für Verstehen dadurch liefern, dass sie Kästchen ankreuzen, Sätze ergänzen, Fragen beantworten usw. Das Spektrum und die Beherrschung sprachlicher Mittel kann entweder direkt beurteilt werden, indem man feststellt, inwieweit sie bestimmten Kriterien entsprechen, oder indirekt dadurch, dass man die Antworten auf Testaufgaben interpretiert oder generalisiert. Ein klassischer direkter Test ist das Interview, und ein klassischer indirekter Test ist der Cloze-Test.M. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Beurteilung der Performanz die Lernenden legen mündliche oder schriftliche Beispiele ihrer Sprachproduktion in einem direkten TestBeurteilung von Kenntnissen die Lösung von Aufgaben, die aus einem breiten Spektrum von Aufgabentypen stammen und die einen Nachweis für den Umfang der sprachlichen Kenntnisse und der Beherrschung sprachlicher Mittel liefern sollen.M. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Subjektive Beurteilung das Urteil eines PrüfendenObjektive Beurteilung Subjektivität ist ausgeschlossenNormalerweise meint man dabei einen indirekten Test, bei dem die Items nur eine korrekte Antwort zulassen, z. B. multiple-choice  (Mehrfachwahlaufgaben). M. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Reduzierung der Subjektivität bei der Beurteilunginhaltliche Vorgaben für die Beurteilung entwickeln, z. B. basierend auf einemReferenzrahmen für den betreffenden Kontext; sich auf gemeinsame Entscheidungen stützten bei der Auswahl von Inhalten und/oder der Beurteilung der Leistungen Standardverfahren verwenden, die festlegen, wie geprüft wirdverbindliche Bewertungsschlüssel für indirekte Tests zu Verfügung stellen auf spezifische, klar definierte Kriterien in direkten Tests stützenmehrfache Beurteilung und/oder die Gewichtung verschiedener Faktoren fordern entsprechendes Training in Bezug auf die Beurteilungsrichtlinien anbietendie Qualität von Leistungsbeurteilungen (Validität, Reliabilität) durch eine Analyse der Prüfungsdaten kontrollierenM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
Ein qualifizierter Test muss die Forderungen nach Objektivität, Zuverlässigkeit (Reliabilität) und  Gültigkeit (Validität) erfüllen. Die Objektivität eines Tests ist dann gegeben, wenn die Ergebnisse einer Testuntersuchung unabhängig von der Person des Untersuchers sind. Die Zuverlässigkeit (Reliabilität) betrifft den Exaktheitsgrad, mit dem ein Test individuelle psychische Unterschiede (Persönlichkeitsmerkmale) erfasst. Die Gültigkeit (Validität) betrifft die Frage, inwieweit die Testergebnisse tatsächlich dasjenige Persönlichkeitsmerkmal erfassen, das durch die Testuntersuchung bestimmt werden soll.Gütekriterien.http://www.medpsych.uni-freiburg.de/OL/glossar/body_gutekriterien.htmlM. Kolesnik-Eigentler, 2011
Wen teste ich? Eine KlasseAlle Klassen eines JahrgangsWarum teste ich?SchularbeitReifeprüfungWas teste ich?FertigkeitenKompetenzenWie teste ich?TestformateBewertungsskalenKorrekturschlüsselWas messe ich?(Test)KonstruktM. Kolesnik-Eigentler, 2011
ValiditätObjektivitätReliabilitätPraktikabilitätAuthentizitätWashbackTestgütekriterienM. Kolesnik-Eigentler, 2011
TestgütekriterienValiditätKonstrukt-Inhalts-Augenschein-Kriteriums-M. Kolesnik-Eigentler, 2011
ValiditätKonstruktvaliditätDas Konstrukt, z.B. die Fertigkeit Hören ist klar definiertDas Konstrukt ist nachvollziehbar im Test abgebildet(nicht korrekte (nicht valide) Aufgabenstellung: Schreiben Sie eine Zusammenfassung des gehörten Texts)M. Kolesnik-Eigentler, 2011
ValiditätInhaltsvaliditätAlle Aspekte eines Konstrukts werden ausreichend gemessenz.B. Niveaubeschreibung nach GERSM. Kolesnik-Eigentler, 2011
ValiditätAugenscheinvaliditätSchüler, Eltern, Direktion, Landesschulinspektion überzeugen, dass ich das messe, was ich messen will und was gemessen werden sollM. Kolesnik-Eigentler, 2011
Validität (Gültigkeit)gibt die Eignung eines Messverfahrens oder einer Frage bezüglich ihrer Zielsetzung an
Eine Messung oder Befragung ist valide, wenn die erhobenen Werte geeignete Kennzahlen für die zu untersuchende Fragestellung liefern.Beispiel ValiditätBeispielsweise ist die Anzahl der Fehltage in einer Abteilung eine valide Kennzahl für die Gesundheit der Mitarbeiter, aber nicht für die Zufriedenheit der Mitarbeiter, da ihre Anwesenheit nicht das gleiche wie Zufriedenheit ist. Der Versuch, die Länge einer Schraube mit einem Thermometer zu messen, ist ebenfalls ein Beispiel für eine nicht-valide Messung.http://www.bb-sbl.de/tutorial/stichproben/reliabilitaetvaliditaetobjektivitaet.htmlM. Kolesnik-Eigentler, 2011
Objektivitätdie Antworten bzw. Messwerte sind unabhängig vom Interviewer bzw. Prüfer M. Kolesnik-Eigentler, 2011
Reliabilität (Zuverlässigkeit)wie genau ein Test das misst, was er messen soll, ohne dass dabei die Validität berücksichtigt wird die Angabe ob ein Messergebnis bei einem erneuten Versuch bzw. einer erneuten Befragung unter den gleichen Umständen stabil ist.Beispiel ReliabilitätEin Beispiel für eine reliable Frage ist "Wie viele Mitarbeiter hat Ihre Abteilung?„ Dagegen hat die Frage "Wie viele teamfähige Mitarbeiter hat ihre Abteilung" eine geringe Reliabilität, da unklar ist wie "teamfähig" definiert ist und dadurch unterschiedliche Einschätzungen zu Stande kommen können.http://www.bb-sbl.de/tutorial/stichproben/reliabilitaetvaliditaetobjektivitaet.htmlM. Kolesnik-Eigentler, 2011
Reliabilität (Zuverlässigkeit)Wie verhält sich Lerner/in beim TestTest-RetestR. (Stabilität; Testwiederholung; unterschiedliche Klassen)Paralleltest-R. (Äquivalenz, Teilung der Gruppe)Interne Konsistenz (Homogenität, Testhalbierung, Items eines Tests zu einander, KronbachAlfa)Häufigkeiten (wie viele Schüler haben wie viel % geschafft)TrennschärfeWie verhält sich Bewerter/in?Interrater- und Intrarater-R.M. Kolesnik-Eigentler, 2011
PraktikabilitätadministrierbarZeit
Räumlichkeiten
Finanzielle Ressoursen
Personelle RessoursenmessbarinterpretierbarM. Kolesnik-Eigentler, 2011
Weitere TestgütekriterienAuthentizitätOriginaltexteLebensnahe AufgabenAugenscheinvaliditätErwartungenWashback (Rückkoppelungseffekt)positiver und negativer Testen beeinflusst des Unterricht und LernenM. Kolesnik-Eigentler, 2011
Offene: Schreibaufgabe, Essay, AufsatzHalboffene: KurzantwortenGeschlossene: C-Test, Cloze-Test, Multi-choice, Zuordnung(Integrative: werden nicht verwendet, Vermischung der Fertigkeiten)TestformateM. Kolesnik-Eigentler, 2011

Weitere ähnliche Inhalte

Andere mochten auch

Trabajo tics
Trabajo ticsTrabajo tics
Trabajo tics
Paty Toapanta
 
Matriz de evaluación gestión 2011
Matriz de evaluación gestión 2011Matriz de evaluación gestión 2011
Matriz de evaluación gestión 2011
rosanagomezrn
 
Bo 11 04-2013-20 (1)
Bo 11 04-2013-20 (1)Bo 11 04-2013-20 (1)
Bo 11 04-2013-20 (1)
Ministério Educação E Desporto
 
Arquitectura de la información
Arquitectura de la informaciónArquitectura de la información
Arquitectura de la información
Cesar Salazar
 
Demandadealimentos
Demandadealimentos Demandadealimentos
Demandadealimentos
Lilianitha HC
 
Improving Project Management Skills with Lean Six Sigma
Improving Project Management Skills with Lean Six Sigma Improving Project Management Skills with Lean Six Sigma
Improving Project Management Skills with Lean Six Sigma
International Institute for Learning
 
Practica5 exportar objeto como bitmap
Practica5 exportar objeto como bitmapPractica5 exportar objeto como bitmap
Practica5 exportar objeto como bitmap
Lorenɑ' Rodrigueʓ♥
 
~Comercio electrónico~
~Comercio electrónico~~Comercio electrónico~
~Comercio electrónico~
Kathryne Quiroz
 
Competing for growth whitepaper
Competing for growth whitepaperCompeting for growth whitepaper
Competing for growth whitepaper
DaniellaBensimonShaker
 
El Secreto de Internet
El Secreto de InternetEl Secreto de Internet
El Secreto de Internet
edgtar
 
Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)
Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)
Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)
Juan Carlos González Herrera
 
3100656 funcion-de-organizacion
3100656 funcion-de-organizacion3100656 funcion-de-organizacion
3100656 funcion-de-organizacion
alezitap85
 
Coordenadas Polares.
Coordenadas Polares.Coordenadas Polares.
Coordenadas Polares.
Gian Avedano Orozco
 
Artigo publicado
Artigo publicadoArtigo publicado
Artigo publicado
Angela Pelaes
 
Sistemas operativos
Sistemas operativosSistemas operativos
Sistemas operativos
davidcristhian
 
Colegio nacional 2
Colegio nacional 2Colegio nacional 2
Colegio nacional 2
Brigidth
 
Diagrama E_R, RelaSional, Diccionario de DatoS
Diagrama E_R, RelaSional, Diccionario de DatoSDiagrama E_R, RelaSional, Diccionario de DatoS
Diagrama E_R, RelaSional, Diccionario de DatoS
Dilan999
 
Jubilada
JubiladaJubilada
Jubilada
resumi2
 

Andere mochten auch (18)

Trabajo tics
Trabajo ticsTrabajo tics
Trabajo tics
 
Matriz de evaluación gestión 2011
Matriz de evaluación gestión 2011Matriz de evaluación gestión 2011
Matriz de evaluación gestión 2011
 
Bo 11 04-2013-20 (1)
Bo 11 04-2013-20 (1)Bo 11 04-2013-20 (1)
Bo 11 04-2013-20 (1)
 
Arquitectura de la información
Arquitectura de la informaciónArquitectura de la información
Arquitectura de la información
 
Demandadealimentos
Demandadealimentos Demandadealimentos
Demandadealimentos
 
Improving Project Management Skills with Lean Six Sigma
Improving Project Management Skills with Lean Six Sigma Improving Project Management Skills with Lean Six Sigma
Improving Project Management Skills with Lean Six Sigma
 
Practica5 exportar objeto como bitmap
Practica5 exportar objeto como bitmapPractica5 exportar objeto como bitmap
Practica5 exportar objeto como bitmap
 
~Comercio electrónico~
~Comercio electrónico~~Comercio electrónico~
~Comercio electrónico~
 
Competing for growth whitepaper
Competing for growth whitepaperCompeting for growth whitepaper
Competing for growth whitepaper
 
El Secreto de Internet
El Secreto de InternetEl Secreto de Internet
El Secreto de Internet
 
Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)
Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)
Decreto Ejecutivo N° 1458 (de 06 de noviembre de 2012)
 
3100656 funcion-de-organizacion
3100656 funcion-de-organizacion3100656 funcion-de-organizacion
3100656 funcion-de-organizacion
 
Coordenadas Polares.
Coordenadas Polares.Coordenadas Polares.
Coordenadas Polares.
 
Artigo publicado
Artigo publicadoArtigo publicado
Artigo publicado
 
Sistemas operativos
Sistemas operativosSistemas operativos
Sistemas operativos
 
Colegio nacional 2
Colegio nacional 2Colegio nacional 2
Colegio nacional 2
 
Diagrama E_R, RelaSional, Diccionario de DatoS
Diagrama E_R, RelaSional, Diccionario de DatoSDiagrama E_R, RelaSional, Diccionario de DatoS
Diagrama E_R, RelaSional, Diccionario de DatoS
 
Jubilada
JubiladaJubilada
Jubilada
 

Ähnlich wie Testen und bewerten nrp

Kritik an Noten aus pädagogischer Sicht
Kritik an Noten aus pädagogischer SichtKritik an Noten aus pädagogischer Sicht
Kritik an Noten aus pädagogischer Sicht
Dirk Hinz
 
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...
L3T - Lehrbuch für Lehren und Lernen mit Technologie
 
Schaffert (2009). Grundlagen des E-Assessment -Teil 3
Schaffert (2009). Grundlagen des E-Assessment -Teil 3Schaffert (2009). Grundlagen des E-Assessment -Teil 3
Schaffert (2009). Grundlagen des E-Assessment -Teil 3
Sandra Schön (aka Schoen)
 
Diagnoseinstrumente
DiagnoseinstrumenteDiagnoseinstrumente
Diagnoseinstrumente
Seminar Nürtingen
 
Schaffert (2009). Grundlagen des E-Assessment - Teil 1
Schaffert (2009). Grundlagen des E-Assessment - Teil 1Schaffert (2009). Grundlagen des E-Assessment - Teil 1
Schaffert (2009). Grundlagen des E-Assessment - Teil 1
Sandra Schön (aka Schoen)
 
Qualität in Schulprojekten Globalen Lernens
Qualität in Schulprojekten Globalen LernensQualität in Schulprojekten Globalen Lernens
Qualität in Schulprojekten Globalen Lernens
Fachstelle GLiS - Globales Lernen in der Schule
 
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...
L3T - Lehrbuch für Lehren und Lernen mit Technologie
 
Lebenslanges lernen ohne_effektives_feedback[1]
Lebenslanges lernen ohne_effektives_feedback[1]Lebenslanges lernen ohne_effektives_feedback[1]
Lebenslanges lernen ohne_effektives_feedback[1]
mariamaria77
 

Ähnlich wie Testen und bewerten nrp (8)

Kritik an Noten aus pädagogischer Sicht
Kritik an Noten aus pädagogischer SichtKritik an Noten aus pädagogischer Sicht
Kritik an Noten aus pädagogischer Sicht
 
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E-...
 
Schaffert (2009). Grundlagen des E-Assessment -Teil 3
Schaffert (2009). Grundlagen des E-Assessment -Teil 3Schaffert (2009). Grundlagen des E-Assessment -Teil 3
Schaffert (2009). Grundlagen des E-Assessment -Teil 3
 
Diagnoseinstrumente
DiagnoseinstrumenteDiagnoseinstrumente
Diagnoseinstrumente
 
Schaffert (2009). Grundlagen des E-Assessment - Teil 1
Schaffert (2009). Grundlagen des E-Assessment - Teil 1Schaffert (2009). Grundlagen des E-Assessment - Teil 1
Schaffert (2009). Grundlagen des E-Assessment - Teil 1
 
Qualität in Schulprojekten Globalen Lernens
Qualität in Schulprojekten Globalen LernensQualität in Schulprojekten Globalen Lernens
Qualität in Schulprojekten Globalen Lernens
 
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...
Prüfen mit Computer und Internet - Didaktik, Methodik und Organisation von E...
 
Lebenslanges lernen ohne_effektives_feedback[1]
Lebenslanges lernen ohne_effektives_feedback[1]Lebenslanges lernen ohne_effektives_feedback[1]
Lebenslanges lernen ohne_effektives_feedback[1]
 

Mehr von Ivancic

WordPress_Kuga_13.3.2015
WordPress_Kuga_13.3.2015WordPress_Kuga_13.3.2015
WordPress_Kuga_13.3.2015
Ivancic
 
Hrvatski E-Portfolio Burgenland
Hrvatski E-Portfolio BurgenlandHrvatski E-Portfolio Burgenland
Hrvatski E-Portfolio Burgenland
Ivancic
 
Thomas häcker
Thomas häckerThomas häcker
Thomas häcker
Ivancic
 
Der kritische blick 2
Der kritische blick 2Der kritische blick 2
Der kritische blick 2
Ivancic
 
Hörverstehen russisch nrp
Hörverstehen russisch nrpHörverstehen russisch nrp
Hörverstehen russisch nrp
Ivancic
 
Reifeprüfung allgemein nrp
Reifeprüfung allgemein nrpReifeprüfung allgemein nrp
Reifeprüfung allgemein nrp
Ivancic
 
Aleksandra reklamne tehnike
Aleksandra reklamne tehnikeAleksandra reklamne tehnike
Aleksandra reklamne tehnike
Ivancic
 
Vedran dzihic understanding post dayton-bosnia 20.10.09
Vedran dzihic understanding post dayton-bosnia 20.10.09Vedran dzihic understanding post dayton-bosnia 20.10.09
Vedran dzihic understanding post dayton-bosnia 20.10.09
Ivancic
 
HeP Burgenland
HeP BurgenlandHeP Burgenland
HeP Burgenland
Ivancic
 

Mehr von Ivancic (9)

WordPress_Kuga_13.3.2015
WordPress_Kuga_13.3.2015WordPress_Kuga_13.3.2015
WordPress_Kuga_13.3.2015
 
Hrvatski E-Portfolio Burgenland
Hrvatski E-Portfolio BurgenlandHrvatski E-Portfolio Burgenland
Hrvatski E-Portfolio Burgenland
 
Thomas häcker
Thomas häckerThomas häcker
Thomas häcker
 
Der kritische blick 2
Der kritische blick 2Der kritische blick 2
Der kritische blick 2
 
Hörverstehen russisch nrp
Hörverstehen russisch nrpHörverstehen russisch nrp
Hörverstehen russisch nrp
 
Reifeprüfung allgemein nrp
Reifeprüfung allgemein nrpReifeprüfung allgemein nrp
Reifeprüfung allgemein nrp
 
Aleksandra reklamne tehnike
Aleksandra reklamne tehnikeAleksandra reklamne tehnike
Aleksandra reklamne tehnike
 
Vedran dzihic understanding post dayton-bosnia 20.10.09
Vedran dzihic understanding post dayton-bosnia 20.10.09Vedran dzihic understanding post dayton-bosnia 20.10.09
Vedran dzihic understanding post dayton-bosnia 20.10.09
 
HeP Burgenland
HeP BurgenlandHeP Burgenland
HeP Burgenland
 

Testen und bewerten nrp

  • 1. Testen und BewertenFortbildungsseminar für AHS-Lehrer22.09-23.09.2011, EisenstadtMag. Margarita Kolesnik-Eigentler Innsbruck
  • 2. Performanz testen (nicht auswendig gelerntes)situativer Kontextmöglichst authentisch und handlungsorientiert testenmöglichst objektiv und transparent bewerten(Hinger/Hosp)⇨ Standardisierung und/ oder die gleichen Prinzipien des Testens bei der TesterstellungKommunikative SprachtestsM. Kolesnik-Eigentler, 2011
  • 3. Fremdbewertung, Peer-Bewertung, SelbstbewertungSprachstandtests vs. Qualifikationsprüfungganzheitlich vs. analytischkontinuierlich vs. punktuellformativ vs. summativdirekt vs. indirektsubjektiv vs. objektivnormorienmtiert vs. kriterienorientiertGERS Kap. 9. Typen der BewertungM. Kolesnik-Eigentler, 2011
  • 4. Sprachstandstest (Leistungstest, achievementtest) überprüft, ob bestimmte Ziele erreicht wurdenwas unterrichtet worden istbezieht sich auf die Arbeit einer Woche, eines Semesters, das Lehrbuch oder den Lehrplan. orientiert sich am Kurs stellt eine Binnenperspektive dar.Qualifikationsprüfung (auch: Feststellungsprüfung; proficiencytest) was jemand kann oder weiß, wenn er/sie einen Lerngegenstand im 'wirklichen Leben' anwendet.stellt eine Außenperspektive darM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertunghttp://www.goethe.de/Z/50/commeuro/i0.htm
  • 5. Normorientierte Bewertung  bringt die Lernenden in eine Rangfolge die Bewertung ihrer Leistungen erfolgt relativ zu den anderen Lernenden der Gruppe.Kriteriumsorientierte Bewertungder Lernende wird lediglich in Bezug auf seine Fähigkeit in dem jeweiligen Gebiet bewertetunabhängig von der Fähigkeit der anderen LernendenM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 6. Kontinuierliche Beurteilung Beurteilung von Leistungen in der Klasse, von Arbeiten und Projekten während des ganzen Kursesdurch die Lehrenden und eventuell durch die Lernenden. Abschlussnote spiegelt den ganzen Kurs/das Lernjahr/das Semester.Punktuelle Beurteilung  (Leistungsmessung zu einem festen Zeitpunkt)eine Prüfung oder eine anderen Form der Beurteilung, die an einem bestimmten Tag stattfindetWas vorher stattgefunden hat, ist irrelevantentscheidend ist, was die Person zum aktuellen Zeitpunkt tun kannM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 7. Direkte Beurteilung was tut der Kandidat tatsächlichWenn z. B. eine kleine Gruppe etwas diskutiert, dann beobachtet der Beurteilende die Leistung, vergleicht sie mit einem Kriterienraster, bezieht die Leistungen auf die passendsten Kategorien des Rasters und gibt eine Beurteilung ab.beschränkt sich auf das Sprechen, Schreiben und Zuhören bei InteraktionenM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 8. Indirekte Beurteilung ein Test, üblicherweise ein schriftlicher, der Kompetenzen und Fertigkeiten prüft, die einer Leistung zugrunde liegen.Leseverstehen z. B. kann nur indirekt überprüft werden, indem man die Lernenden dazu bringt, Belege für Verstehen dadurch liefern, dass sie Kästchen ankreuzen, Sätze ergänzen, Fragen beantworten usw. Das Spektrum und die Beherrschung sprachlicher Mittel kann entweder direkt beurteilt werden, indem man feststellt, inwieweit sie bestimmten Kriterien entsprechen, oder indirekt dadurch, dass man die Antworten auf Testaufgaben interpretiert oder generalisiert. Ein klassischer direkter Test ist das Interview, und ein klassischer indirekter Test ist der Cloze-Test.M. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 9. Beurteilung der Performanz die Lernenden legen mündliche oder schriftliche Beispiele ihrer Sprachproduktion in einem direkten TestBeurteilung von Kenntnissen die Lösung von Aufgaben, die aus einem breiten Spektrum von Aufgabentypen stammen und die einen Nachweis für den Umfang der sprachlichen Kenntnisse und der Beherrschung sprachlicher Mittel liefern sollen.M. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 10. Subjektive Beurteilung das Urteil eines PrüfendenObjektive Beurteilung Subjektivität ist ausgeschlossenNormalerweise meint man dabei einen indirekten Test, bei dem die Items nur eine korrekte Antwort zulassen, z. B. multiple-choice  (Mehrfachwahlaufgaben). M. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 11. Reduzierung der Subjektivität bei der Beurteilunginhaltliche Vorgaben für die Beurteilung entwickeln, z. B. basierend auf einemReferenzrahmen für den betreffenden Kontext; sich auf gemeinsame Entscheidungen stützten bei der Auswahl von Inhalten und/oder der Beurteilung der Leistungen Standardverfahren verwenden, die festlegen, wie geprüft wirdverbindliche Bewertungsschlüssel für indirekte Tests zu Verfügung stellen auf spezifische, klar definierte Kriterien in direkten Tests stützenmehrfache Beurteilung und/oder die Gewichtung verschiedener Faktoren fordern entsprechendes Training in Bezug auf die Beurteilungsrichtlinien anbietendie Qualität von Leistungsbeurteilungen (Validität, Reliabilität) durch eine Analyse der Prüfungsdaten kontrollierenM. Kolesnik-Eigentler, 2011Typen von Beurteilung und Bewertung
  • 12. Ein qualifizierter Test muss die Forderungen nach Objektivität, Zuverlässigkeit (Reliabilität) und Gültigkeit (Validität) erfüllen. Die Objektivität eines Tests ist dann gegeben, wenn die Ergebnisse einer Testuntersuchung unabhängig von der Person des Untersuchers sind. Die Zuverlässigkeit (Reliabilität) betrifft den Exaktheitsgrad, mit dem ein Test individuelle psychische Unterschiede (Persönlichkeitsmerkmale) erfasst. Die Gültigkeit (Validität) betrifft die Frage, inwieweit die Testergebnisse tatsächlich dasjenige Persönlichkeitsmerkmal erfassen, das durch die Testuntersuchung bestimmt werden soll.Gütekriterien.http://www.medpsych.uni-freiburg.de/OL/glossar/body_gutekriterien.htmlM. Kolesnik-Eigentler, 2011
  • 13. Wen teste ich? Eine KlasseAlle Klassen eines JahrgangsWarum teste ich?SchularbeitReifeprüfungWas teste ich?FertigkeitenKompetenzenWie teste ich?TestformateBewertungsskalenKorrekturschlüsselWas messe ich?(Test)KonstruktM. Kolesnik-Eigentler, 2011
  • 16. ValiditätKonstruktvaliditätDas Konstrukt, z.B. die Fertigkeit Hören ist klar definiertDas Konstrukt ist nachvollziehbar im Test abgebildet(nicht korrekte (nicht valide) Aufgabenstellung: Schreiben Sie eine Zusammenfassung des gehörten Texts)M. Kolesnik-Eigentler, 2011
  • 17. ValiditätInhaltsvaliditätAlle Aspekte eines Konstrukts werden ausreichend gemessenz.B. Niveaubeschreibung nach GERSM. Kolesnik-Eigentler, 2011
  • 18. ValiditätAugenscheinvaliditätSchüler, Eltern, Direktion, Landesschulinspektion überzeugen, dass ich das messe, was ich messen will und was gemessen werden sollM. Kolesnik-Eigentler, 2011
  • 19. Validität (Gültigkeit)gibt die Eignung eines Messverfahrens oder einer Frage bezüglich ihrer Zielsetzung an
  • 20. Eine Messung oder Befragung ist valide, wenn die erhobenen Werte geeignete Kennzahlen für die zu untersuchende Fragestellung liefern.Beispiel ValiditätBeispielsweise ist die Anzahl der Fehltage in einer Abteilung eine valide Kennzahl für die Gesundheit der Mitarbeiter, aber nicht für die Zufriedenheit der Mitarbeiter, da ihre Anwesenheit nicht das gleiche wie Zufriedenheit ist. Der Versuch, die Länge einer Schraube mit einem Thermometer zu messen, ist ebenfalls ein Beispiel für eine nicht-valide Messung.http://www.bb-sbl.de/tutorial/stichproben/reliabilitaetvaliditaetobjektivitaet.htmlM. Kolesnik-Eigentler, 2011
  • 21. Objektivitätdie Antworten bzw. Messwerte sind unabhängig vom Interviewer bzw. Prüfer M. Kolesnik-Eigentler, 2011
  • 22. Reliabilität (Zuverlässigkeit)wie genau ein Test das misst, was er messen soll, ohne dass dabei die Validität berücksichtigt wird die Angabe ob ein Messergebnis bei einem erneuten Versuch bzw. einer erneuten Befragung unter den gleichen Umständen stabil ist.Beispiel ReliabilitätEin Beispiel für eine reliable Frage ist "Wie viele Mitarbeiter hat Ihre Abteilung?„ Dagegen hat die Frage "Wie viele teamfähige Mitarbeiter hat ihre Abteilung" eine geringe Reliabilität, da unklar ist wie "teamfähig" definiert ist und dadurch unterschiedliche Einschätzungen zu Stande kommen können.http://www.bb-sbl.de/tutorial/stichproben/reliabilitaetvaliditaetobjektivitaet.htmlM. Kolesnik-Eigentler, 2011
  • 23. Reliabilität (Zuverlässigkeit)Wie verhält sich Lerner/in beim TestTest-RetestR. (Stabilität; Testwiederholung; unterschiedliche Klassen)Paralleltest-R. (Äquivalenz, Teilung der Gruppe)Interne Konsistenz (Homogenität, Testhalbierung, Items eines Tests zu einander, KronbachAlfa)Häufigkeiten (wie viele Schüler haben wie viel % geschafft)TrennschärfeWie verhält sich Bewerter/in?Interrater- und Intrarater-R.M. Kolesnik-Eigentler, 2011
  • 28. Weitere TestgütekriterienAuthentizitätOriginaltexteLebensnahe AufgabenAugenscheinvaliditätErwartungenWashback (Rückkoppelungseffekt)positiver und negativer Testen beeinflusst des Unterricht und LernenM. Kolesnik-Eigentler, 2011
  • 29. Offene: Schreibaufgabe, Essay, AufsatzHalboffene: KurzantwortenGeschlossene: C-Test, Cloze-Test, Multi-choice, Zuordnung(Integrative: werden nicht verwendet, Vermischung der Fertigkeiten)TestformateM. Kolesnik-Eigentler, 2011
  • 30. Testspezifikationen 1Allgemeine InformationenZielgruppeAnzahl der AufgabenIntegrationen anderer Fertigkeiten oder Kompetenzen (Ausmaß)DauerZielsetzungM. Kolesnik-Eigentler, 2011
  • 31. Testspezifikationen 2Spezifische Informationen1. Merkmale der AufgabenstellungSprache der ArbeitsanweisungenSprachniveau der Aufgabe nach GERS2. Merkmale der TexteDiskursartThemenbereicheQuellenAuthentizitätSprachliche GestaltungSprachniveauM. Kolesnik-Eigentler, 2011
  • 32. Testspezifikationen 3Spezifische Informationen3. Merkmale der Test-ItemsTestformatSprachliche GestaltungKognitive Prozesse4. BewertungArt, Verfahren5. RückmeldungQualitativ (Note, verbales Feedback, Niveaustufe nach GERS …)M. Kolesnik-Eigentler, 2011
  • 33. Literatur: Testen allgemeinFulcher, G./ Davidson, F. (2007): Language Testing and Assessment. London and New York, Routledge.Grotjahn, R.: Testen und Evaluieren fremdsprachlicher Kompetenzen. Tübingen, Günter Narr Verlag.Hughes, A. (1989): Testing for Language Teachers. Cambridge, CUPDlaska, A./ Krekeler, Ch. (2009): Sprachtests. Baltmannsweiler, Schneider Verlag Hohengehren.Bei Erstellung dieser Präsentation wurden die Materialien des Kongresses: Die standardisierte Reifeprüfung in den Fremdsprachen im HUM-Bereich. 28.10.-29.10.2010, Innsbruck (Vortragenden Sabine Hosp und Barbara Hinger) sowie Informationen von BIFIE und BMUKK verwendet.GERS: http://www.goethe.de/Z/50/commeuro/i0.htmM. Kolesnik-Eigentler, 2011