Fragenauswertung und Aufgabenanalyse im Nachgang
Die globale Fragenanalyse, die Moodle in den Spalten der Fragensammlung abbildet (siehe Screenshot), wird durch die adaptiven Testversuche nicht berührt. Diese ist nur bei der Nutzung von Fragen in klassischen Quiz-Aktivitäten eingebunden.
Das Plugin bietet aber eine lokale Fragenauswertung innerhalb von jedem adaptiven Quiz (ähnlich der Test-Strukturanalyse in der Ergebnis-Statistik klassischer Tests, aber in reduzierter Form): Hier wird zu jeder verwendeten Frage nicht nur ihre Fragenschwierigkeits-Markierung (Spalte 2) aufgeführt, sondern auch die Anzahl der Nutzungen in dieser Testaktivität (Spalte 3).

In der Spalte 4 (% korrekt) wird die Häufigkeit der korrekten Beantwortung (innerhalb dieser Testaktivität) angegeben. Hier sollte sich ab einer bestimmten Anzahl an Nutzungen eine Tendenz hin zu 50% abzeichnen, da der Algorithmus die Fragen vorzugsweise so auswählt, dass er sie denjenigen Testteilnehmern präsentiert, die eine vermutete 50/50-Chance haben, die Aufgabe korrekt zu lösen. Sollte es starke Abweichungen geben, lohnt es sich, die Einstufung der Frage in die Schwierigkeitsniveaus zu überdenken. Wenn sie zu häufig richtig gelöst wurde, gehört sie evtl. eher zu einer niedrigeren Kategorie. Wenn sie hingegen zu selten korrekt gelöst wurde, sollte sie vielleicht besser in eine höhere Kategorie eingestuft werden. Wenn die Schwierigkeit einer Aufgabe dem eingestellten Startniveau (siehe Einstellungen) entspricht, ist die Beurteilung etwas schwieriger, da bei einem gehäuften Aufruf als Startfrage die Lösungshäufigkeit hier evtl. in Abhängigkeit von der gesamten Leistungsfähigkeit der teilnehmenden Kohorte verzerrt sein kann. Um die fortlaufende Gültigkeit der Einordnung der Fragen in die Schwierigkeitsstufen zu gewährleisten, haben wir daher eine Benachrichtigungsautomatik eingerichtet, die der Lehrperson die Nutzung dieser durch das Plugin generierten Fragenauswertung empfiehlt. Hierzu sollte in den Einstellungen ein entsprechender Wert gesetzt werden, damit nach einer gewissen Anzahl an Testversuchen automatisch das Erinnerungsfenster eingeblendet wird. Die in der Spalte 5 angegebene Diskriminierung einer Frage wird (bei ausreichend vielen Testversuchen) aus einem Vergleich der Gruppe der Besten (Fähigkeitsmaß abzgl. Standardfehler > Fragenschwierigkeit) mit der der Schlechtesten (Fähigkeitsmaß zzgl. Standardfehler < Fragenschwierigkeit) als Differenz der Lösungshäufigkeiten in beiden Gruppen berechnet. Sie ist damit eine grobe Näherung für die (unkorrigierte) Trennschärfe der Items. Sie ist bei unseren bisherigen Einsätzen aufgrund der geringen Probandenzahl nicht auswertbar gewesen. Die in diesem Zusammenhang angezeigte übersichtliche Analyse jeder einzelnen Aufgabe kann aber auch schon eher wertvolle Hinweise liefern, ob die Schwierigkeitseinstufung der Aufgaben transitiv angelegt wurde: Wenn eine bestimmte Aufgabe von Testteilnehmern mit einem geschätzten Fähigkeitsmaß oberhalb der dieser Aufgabe zugewiesenen Schwierigkeitsstufe häufig falsch gelöst wurde oder aber umgekehrt eine Aufgabe von Probandinnen mit einem errechneten Fähigkeitsmaß unterhalb der Aufgabenschwierigkeit häufig richtig gelöst wurde, dann ist vermutlich eine Überarbeitung der Aufgabe nötig.
|