Standardisierter Test

Ein standardisierter Test ist ein Test, der verwaltet und auf eine konsequente oder "normale", Weise eingekerbt wird. Standardisierte Tests werden auf solche Art und Weise entworfen, dass die Fragen, Bedingungen für das Verwalten, Verfahren und Interpretationen einkerbend, entsprechen und verwaltet und auf eine vorher bestimmte, normale Weise eingekerbt werden.

Jeder Test, in dem derselbe Test auf dieselbe Weise allen Testnehmern gegeben wird, ist ein standardisierter Test. Standardisierte Tests brauchen nicht Tests der hohen Anteile, zeitbeschränkte Tests oder Auswahltests zu sein. Das Gegenteil eines standardisierten Tests ist ein nichtstandardisierter Test. Nichtstandardisierte Prüfung gibt bedeutsam verschiedene Tests verschiedenen Testnehmern, oder gibt denselben Test unter bedeutsam verschiedenen Bedingungen (z.B, einer Gruppe wird viel weniger Zeit erlaubt, um den Test zu vollenden, als die folgende Gruppe), oder bewertet sie verschieden (z.B, dieselbe Antwort wird direkt für einen Studenten aufgezählt, aber für einen anderen Studenten falsch).

Standardisierte Tests werden wahrgenommen als, schöner zu sein, als nichtstandardisierte Tests. Die Konsistenz erlaubt auch zuverlässigeren Vergleich von Ergebnissen über alle Testnehmer.

Geschichte

China

Die frühsten Beweise der standardisierten Prüfung waren in China, wo die Reichsüberprüfungen die Sechs Künste bedeckt haben, die Musik, Bogenschießen und Reitkunst, Arithmetik, das Schreiben und die Kenntnisse der Rituale und Zeremonien sowohl von öffentlichen als auch von privaten Teilen eingeschlossen haben. Später wurden die Studien (militärische Strategien, Zivilrecht, Einnahmen und Besteuerung, Landwirtschaft und Erdkunde) zur Prüfung hinzugefügt. In dieser Form wurden die Überprüfungen während des 6. Jahrhunderts CE unter der Sui-Dynastie institutionalisiert.

Großbritannien

Standardisierte Prüfung wurde in Europa am Anfang des 19. Jahrhunderts eingeführt, das auf den chinesischen Mandarine-Überprüfungen durch die Befürwortung für britische Kolonialverwalter modelliert ist, von denen der am meisten "beharrliche" Großbritanniens Konsul in Guangzhou, China, Thomas Taylor Meadows war. Meadows hat vor dem Zusammenbruch des britischen Reiches, wenn standardisiert, gewarnt Prüfung wurde überall im Reich sofort nicht durchgeführt.

Vor ihrer Adoption war standardisierte Prüfung nicht traditionell ein Teil der Westunterrichtsmethode; gestützt auf skeptisch und unbegrenzte Tradition der vom Alten Griechenland geerbten Debatte hat Westakademie nichtstandardisierte Bewertungen mit von Studenten geschriebenen Aufsätzen bevorzugt. Es ist wegen dessen, dass die erste europäische Durchführung der standardisierten Prüfung in Europa richtig, aber im britischen Indien nicht vorgekommen ist. Begeistert durch den chinesischen Gebrauch der standardisierten Prüfung, am Anfang des 19. Jahrhunderts, haben britische "Firmenbetriebsleiter angestellt und haben auf Wettbewerbsüberprüfungen gestützte Angestellte gefördert, um Bestechung und Bevorzugung zu verhindern." Diese Praxis der standardisierten Prüfung wurde später gegen Ende des 19. Jahrhunderts durch das britische Festland angenommen. Die parlamentarischen Debatten, die gefolgt haben, haben auf das "chinesische Mandarine-System angespielt."

Es war von Großbritannien, das Probeausbreitung standardisiert hat, nicht nur überall im britischen Commonwealth, aber nach Europa und dann Amerika. Seine Ausbreitung wurde durch die Industrielle Revolution angetrieben. In Anbetracht der Vielzahl von Schulstudenten während und nach der Industriellen Revolution, als obligatorische Ausbildungsgesetze Studentenbevölkerungen vergrößert haben, hat die unbegrenzte Bewertung aller Studenten abgenommen. Außerdem stellt der Mangel an einem standardisierten Prozess eine wesentliche Quelle des Maß-Fehlers vor, weil Sortierer Bevorzugung zeigen könnten oder mit einander über die Verhältnisverdienste von verschiedenen Antworten nicht übereinstimmen könnten.

Mehr kürzlich ist es teilweise durch die Bequemlichkeit und niedrigen Kosten des Sortierens von Auswahltests durch den Computer gestaltet worden. Das Sortieren von Aufsätzen durch den Computer ist schwieriger, aber wird auch getan. In anderen Beispielen werden Aufsätze und andere unbegrenzte Antworten gemäß einem vorher bestimmten Bewertungstitelkopf von erzogenen Sortierern sortiert.

Die Vereinigten Staaten

Der Gebrauch der standardisierten Prüfung in den Vereinigten Staaten ist ein Phänomen des 20. Jahrhunderts mit seinen Ursprüngen im Ersten Weltkrieg und den Armeealpha- und Beta-Tests, die von Robert Yerkes und Kollegen entwickelt sind.

In den Vereinigten Staaten, dem Bedürfnis nach der Bundesregierung, bedeutungsvolle Vergleiche über hoch dezentralisierten (lokal kontrolliert) zu machen, hat öffentliches Ausbildungssystem auch zur Debatte über die standardisierte Prüfung einschließlich des Gesetzes der Elementar- und Hauptschulbildung von 1965 beigetragen, der standardisierte Prüfung in öffentlichen Schulen verlangt hat. Amerikanischer Öffentlicher Recht 107-110, bekannt als Kein Kind Zurückgelassenes Gesetz von 2001 weiterer Band-Publikum-Schulfinanzierung zur standardisierten Prüfung.

Design und das Zählen

Standardisierte Prüfung kann aus Auswahl-, wahr-falschen, Aufsatz-Fragen, authentischen Bewertungen oder fast jeder anderen Form der Bewertung zusammengesetzt werden. Wahr-falsche und Auswahlsachen werden häufig gewählt, weil sie gegeben und billig und schnell durch das Zählen von speziellen Antwort-Platten durch den Computer oder über die computeranpassungsfähige Prüfung eingekerbt werden können. Einige standardisierte Tests haben kurze Antwort oder Aufsatz, Bestandteile schreibend, die eine Kerbe von unabhängigen Schätzern zugeteilt werden, die Titelköpfe (Regeln oder Richtlinien) verwenden und Papiere (Beispiele von Papieren für jede mögliche Kerbe) bewerten, um den einer Antwort zu gebenden Rang zu bestimmen. Die meisten Bewertungen werden jedoch von Leuten nicht eingekerbt; Leute werden verwendet, um Sachen einzukerben, die nicht im Stande sind, leicht durch den Computer (d. h., Aufsätze) eingekerbt zu werden. Zum Beispiel ist die Absolventenrekordprüfung eine computeranpassungsfähige Bewertung, die kein Zählen durch Leute (abgesehen vom Schreiben-Teil) verlangt.

Das Zählen von Problemen

Das menschliche Zählen ist häufig variabel, der ist, warum das Computerzählen, wenn ausführbar, bevorzugt wird. Zum Beispiel glauben einige, dass schlecht bezahlte Angestellte Tests schlecht einkerben werden. Die Abmachung zwischen Schreibern kann sich zwischen 60 bis 85 Prozent, abhängig vom Test und der Zählen-Sitzung ändern. Manchmal hat Zustandbezahlung, um zwei oder mehr Schreiber zu haben, jedes Papier gelesen; wenn ihre Hunderte nicht zustimmen, dann wird das Papier zu zusätzlichen Schreibern passiert.

Unbegrenzte Bestandteile von Tests sind häufig nur ein kleine Verhältnis des Tests. Meistens schließt ein Haupttest sowohl von den Menschen eingekerbte als auch computereingekerbte Abteilungen ein.

Kerbe

Es gibt zwei Typen von standardisierten Testkerbe-Interpretationen: eine mit der Norm Verweise angebrachte Kerbe-Interpretation oder eine mit dem Kriterium Verweise angebrachte Kerbe-Interpretation. Mit der Norm Verweise angebrachte Kerbe-Interpretationen vergleichen Testnehmer mit einer Probe von Gleichen. Mit dem Kriterium Verweise angebrachte Kerbe-Interpretationen vergleichen Testnehmer mit einem Kriterium (eine formelle Definition des Inhalts) unabhängig von den Hunderten von anderen Prüfungskandidaten. Diese können auch als standardbasierte Bewertungen beschrieben werden, weil sie nach der standardbasierten Ausbildungsreformbewegung ausgerichtet werden. Mit der Norm Verweise angebrachte Testkerbe-Interpretationen werden mit der traditionellen Ausbildung vereinigt, die Erfolg durch die Reihe misst, Studenten bestellend, die eine Vielfalt der Metrik, einschließlich Ränge und Testhunderte verwenden, während standardbasierte Bewertungen auf dem Glauben basieren, dass alle Studenten erfolgreich sein können, wenn sie gegen Standards bewertet werden, die aller Studenten unabhängig von der Fähigkeit oder dem Wirtschaftshintergrund erforderlich sind.

Standards

Die Rücksichten der Gültigkeit und Zuverlässigkeit werden normalerweise als wesentliche Elemente angesehen, für die Qualität jedes standardisierten Tests zu bestimmen. Jedoch haben Fachmann und Praktiker-Vereinigungen oft diese Sorgen innerhalb von breiteren Zusammenhängen gelegt, wenn sie Standards entwickeln und gesamte Urteile über die Qualität jedes standardisierten Tests als Ganzes innerhalb eines gegebenen Zusammenhangs machen.

Einschätzungsstandards

Im Feld der Einschätzung, und in der besonderen Bildungseinschätzung hat das Gemeinsame Komitee auf Standards für die Bildungseinschätzung drei Sätze von Standards für Einschätzungen veröffentlicht. Die Personaleinschätzungsstandards wurden 1988 veröffentlicht, Die Programm-Einschätzungsstandards (2. Ausgabe) wurde 1994 veröffentlicht, und Die Studenteneinschätzungsstandards wurden 2003 veröffentlicht.

Jede Veröffentlichung präsentiert und arbeitet eine Reihe von Standards für den Gebrauch in einer Vielfalt von Bildungseinstellungen sorgfältig aus. Die Standards stellen Richtlinien für das Entwerfen, das Einführen, das Festsetzen und die Besserung der identifizierten Form der Einschätzung zur Verfügung. Jeder der Standards ist in eine von vier grundsätzlichen Kategorien gelegt worden, um Bildungseinschätzungen zu fördern, die richtig, nützlich, ausführbar, und genau sind. In diesen Sätzen von Standards werden Gültigkeit und Zuverlässigkeitsrücksichten unter dem Genauigkeitsthema bedeckt. Zum Beispiel helfen die Studentengenauigkeitsstandards sicherzustellen, dass Studenteneinschätzungen gesunde, genaue und glaubwürdige Auskunft über den Studenten geben werden, der erfährt und Leistung.

Prüfung von Standards

Im Feld von psychometrics legen die Standards für die Pädagogische und Psychologische Prüfung Standards über die Gültigkeit und Zuverlässigkeit, zusammen mit Fehlern des Maßes und der Probleme, die mit der Anpassung von Personen mit Körperbehinderungen verbunden sind. Das dritte und endgültige Hauptthema bedeckt Standards, die mit der Prüfung von Anwendungen, credentialing, plus die Prüfung in der Programm-Einschätzung und Rechtsordnung verbunden sind.

Vorteile

Einer der Hauptvorteile der standardisierten Prüfung ist, dass die Ergebnisse empirisch dokumentiert werden können; deshalb, wie man zeigen kann, haben die Testhunderte einen Verhältnisgrad der Gültigkeit und Zuverlässigkeit, sowie Ergebnisse, die generalizable und replicable sind. Dem wird häufig mit Rängen auf einer Schulabschrift gegenübergestellt, die von individuellen Lehrern zugeteilt werden. Es kann schwierig sein, für Unterschiede in der Bildungskultur über Schulen, Schwierigkeit eines Lehrplans eines gegebenen Lehrers, Unterschiede im lehrenden Stil, und Techniken und Neigungen verantwortlich zu sein, die das Sortieren betreffen. Das macht standardisierte Tests nützlich zu Bekenntnis-Zwecken in der Hochschulbildung, wo eine Schule versucht, Studenten von jenseits der Nation oder überall in der Welt zu vergleichen.

Ein anderer Vorteil ist Ansammlung. Ein gut bestimmter standardisierter Test stellt eine Bewertung einer Beherrschung einer Person eines Gebiets von Kenntnissen oder Sachkenntnis zur Verfügung, die an einem Niveau der Ansammlung nützliche Auskunft geben wird. D. h. während individuelle Bewertungen zu praktischen Zwecken, den Mittelhunderten von Klassen, Schulen, Zweigen einer Gesellschaft nicht genau genug sein können, oder andere Gruppen nützliche Auskunft wegen der Verminderung des vollbrachten Fehlers gut geben können, indem sie die Beispielgröße vergrößern.

Standardisierte Tests, die definitionsgemäß allen Testnehmern denselben Test unter demselben (oder vernünftig gleich) Bedingungen geben, werden auch wahrgenommen als, schöner zu sein, als Bewertungen, die verschiedene Fragen oder verschiedene Bedingungen für Studenten gemäß ihrer Rasse, sozioökonomischem Status oder anderen Rücksichten verwenden.

Nachteile und Kritik

Standardisierte Tests sind nützliche Werkzeuge, um Studentenzu-Stande-Bringen zu bewerten und können verwendet werden, um Instruktion auf gewünschten Ergebnissen, wie das Lesen und die Mathesachkenntnisse einzustellen. Jedoch finden Kritiker dass Übergebrauch und Missbrauch dieser Testschäden das Unterrichten und Lernen, indem sie den Lehrplan einengen. Gemäß der Gruppe verwenden FairTest, wenn standardisierte Tests der primäre Faktor in der Verantwortlichkeit, Schulen sind, die Tests, um Lehrplan und Fokus-Instruktion zu definieren. Kritiker sagen dass, "dem Test" Missfallen das höherwertige Lernen unterrichtend. Während es möglich ist, einen standardisierten Test zu verwenden, ohne seinen Inhalt Lehrplan und Instruktion oft bestimmen zu lassen, was nicht geprüft wird, wird nicht unterrichtet, und wie das Thema geprüft wird, häufig wird ein Modell dafür, wie man das Thema unterrichtet.

Der kritiklose Gebrauch von standardisierten Testhunderten, um Lehrer und Schulleistung zu bewerten, ist unpassend, weil die Hunderte der Studenten unter Einfluss drei Dinge sind: Was Studenten in der Schule erfahren, was Studenten außerhalb der Schule und der angeborenen Intelligenz der Studenten erfahren. Die Schule hat nur Kontrolle über einen dieser drei Faktoren. Das Mehrwertmodellieren ist vorgeschlagen worden, um mit dieser Kritik durch das statistische Steuern für die angeborene Fähigkeit und außerschulischen Kontextfaktoren fertig zu werden. In einem Mehrwertsystem der Interpretation von Testhunderten schätzen Analytiker eine erwartete Kerbe für jeden Studenten, der auf Faktoren wie die eigenen vorherigen Testhunderte des Studenten, primäre Sprache oder sozioökonomischer Status gestützt ist. Wie man wagt, ist der Unterschied zwischen der erwarteten Kerbe des Studenten und wirklicher Kerbe in erster Linie zu den Anstrengungen des Lehrers erwartet.

Unterstützer der standardisierten Prüfung antworten, dass diese nicht sind, schließt, standardisierte Prüfung entweder für die nichtstandardisierte Prüfung oder von keiner Bewertung überhaupt, aber eher Kritiken schlecht bestimmter Proberegime aufzugeben. Sie behaupten, dass Prüfung tut und Bildungsmittel auf die wichtigsten Aspekte der Ausbildung — das Geben eines vorherbestimmten Satzes von Kenntnissen und Sachkenntnissen einstellen sollte — und dass andere Aspekte entweder weniger wichtig sind, oder zum Probeschema hinzugefügt werden sollten.

Im Roman von Cathy Davidson Jetzt Sehen Sie Es, Davidson kritisiert standardisierten Test. Sie beschreibt unsere Jugend als "Montageband-Kinder auf einem Montageband-Modell." Die Bedeutung unserer Ausbildungssysteme hat standardisierten Test verwendet, weil eine Größe die ganze Theorie passt, die nicht immer eine wirksame Weise ist, die Kenntnisse und das Verständnis der Jugend des heutigen Tages und Alters zu messen. Wie Davidson feststellt, "weil wir das Spektrum von Sachkenntnissen einengen, die wir in Schulen prüfen, immer mehr werden Kinder, die Sachkenntnisse außerhalb des Spektrums von Sachkenntnissen haben, als Misserfolge etikettiert", Wenn diese Kinder "fehlen" oder den auf diesen erwarteten Standards nicht entsprechen, prüfen, sie werden mit dem Lernen von Körperbehinderungen und/oder Unordnungen diagnostiziert. Sie müssen dann mit der Behandlung für eine Unordnung durchziehen, die sie vielleicht nicht haben. Unser System scheitert zu verstehen, dass diese Testumleitung die Geschenke standardisiert haben, die diese Kinder anbieten müssen und ihre Sachkenntnisse nicht herausfordern, deshalb Zimmer für diese Diagnostik verlassend, die gemacht ist ungenau sein.

Das Zählen des Informationsverlustes

Wenn Tests richtig-falsch eingekerbt werden, ist eine wichtige Annahme über das Lernen gemacht worden. Wie man annimmt, sind die Zahl von richtigen Antworten oder die Summe von Artikel-Hunderten (wo teilweiser Kredit gegeben wird) das passende und genügend Maß des aktuellen Leistungsstatus. Außerdem wird eine sekundäre Annahme gemacht, dass es keine bedeutungsvolle Information in den falschen Antworten gibt.

An erster Stelle kann eine richtige Antwort mit memorization ohne jedes tiefe Verstehen der zu Grunde liegenden zufriedenen oder begrifflichen Struktur des aufgeworfenen Problems erreicht werden. Zweitens, wenn mehr als ein Schritt für die Lösung erforderlich ist, gibt es häufig eine Vielfalt von Annäherungen an das Antworten, das zu einem richtigen Ergebnis führen wird. Die Tatsache, dass die Antwort richtig ist, zeigt nicht an, welches von den mehreren möglichen Verfahren verwendet wurde. Wenn der Student die Antwort liefert (oder die Arbeit zeigt), ist diese Information aus den Originalurkunden sogleich verfügbar.

Zweitens, wenn die falschen Antworten blinde Annahmen wären, würde es keine unter diesen Antworten zu findende Information geben. Andererseits, wenn falsche Antworten Interpretationsabfahrten von der erwarteten widerspiegeln, sollten diese Antworten eine bestellte Beziehung dazu zeigen, dass der gesamte Test misst. Diese Abfahrt sollte auf das Niveau der psycholinguistischen Reife der Studentenauswahl oder des Gebens der Antwort in der Mundart abhängig sein, in der der Test geschrieben wird.

In diesem zweiten Fall sollte es möglich sein, diese Ordnung von den Antworten bis die Testsachen herauszuziehen. Solche Förderungsprozesse, das Modell von Rasch zum Beispiel, sind Standardpraxis für die Artikel-Entwicklung unter Fachleuten. Jedoch, weil die falschen Antworten während des Zählen-Prozesses, Versuche verworfen werden, diese Antworten für die Information zu interpretieren, die sie enthalten könnten, wird selten übernommen.

Drittens, obwohl Thema-basierte Subtesthunderte manchmal zur Verfügung gestellt werden, soll mehr übliche Praxis die Gesamtkerbe oder eine wiederschuppige Version davon melden. Dieses Wiederschuppen ist beabsichtigt, um diese Hunderte mit einem Standard von einer Sorte zu vergleichen. Dieser weitere Zusammenbruch der Testergebnisse entfernt systematisch die ganze Information, über die besondere Sachen verpasst wurden.

So verliert das Zählen eines richtig-falschen Tests 1), wie Studenten ihre richtigen Antworten 2) erreicht haben, was sie zu unannehmbaren Antworten und 3) irregeführt hat, wo innerhalb des Körpers des Tests diese Abfahrt von der Erwartung vorgekommen ist.

Dieser Kommentar weist darauf hin, dass das aktuelle zählende Verfahren die Dynamik des testnehmenden Prozesses verbirgt und die Fähigkeiten zu den Studenten verdunkelt, die bewerten werden. Aktuelle zählende Praxis vereinfacht diese Daten im anfänglichen zählenden Schritt grob. Das Ergebnis dieses Verfahrensfehlers ist, der diagnostischen Information zu verdunkeln, die Lehrern helfen konnte, ihren Studenten besser zu dienen. Es verhindert weiter diejenigen, die diese Tests davon fleißig vorbereiten im Stande zu sein, die Information zu beobachten, die sie zur Anwesenheit dieses Fehlers sonst alarmiert hätte.

Eine Lösung dieses Problems, bekannt als Response Spectrum Evaluation (RSE), wird zurzeit entwickelt, der scheint, dazu fähig zu sein, alle drei dieser Formen des Informationsverlustes wieder zu erlangen, während er noch eine numerische Skala zur Verfügung stellt, um aktuellen Leistungsstatus zu gründen und Leistungsänderung zu verfolgen.

Diese RSE-Annäherung stellt eine Interpretation der Denken-Prozesse hinter jeder Antwort zur Verfügung (sowohl das Recht als auch die falschen), der Lehrern erzählt, wie sie für jede Antwort dachten, die sie zur Verfügung stellen. Unter anderen Ergebnissen berichtet dieses Kapitel, dass die wiedergutzumachende Information zwischen zwei und dreimal mehr von der Testveränderlichkeit erklärt als das Betrachten nur der richtigen Antworten. Dieser massive Verlust der Information kann durch die Tatsache erklärt werden, dass die "falschen" Antworten von der Testinformation entfernt werden, die während des Zählen-Prozesses wird sammelt, und nicht mehr verfügbar ist, um den dem richtig-falschen Zählen innewohnenden Verfahrensfehler zu offenbaren. Das Verfahren umgeht die Beschränkungen, die durch die geradlinigen Testdaten innewohnenden Abhängigkeiten erzeugt sind.

Prüfung der Neigung kommt vor, wenn ein Test systematisch eine Gruppe über einen anderen bevorzugt, wenn auch beide Gruppen auf dem Charakterzug die Testmaßnahmen gleich sind. Kritiker behaupten, dass Testschöpfer und Vermittler dazu neigen, einen Mittelstand, weißen Hintergrund zu vertreten. Kritiker behaupten, dass Probematch die Werte, Gewohnheiten und Sprache der Testschöpfer standardisiert hat. Jedoch seiend, dass die meisten Tests aus einem weißen Mittelstandshintergrund kommen, ist es wichtig zu bemerken, dass die höchsten zählenden Gruppen nicht Leute dieses Hintergrunds sind, aber eher dazu neigen, aus asiatischen Bevölkerungen zu kommen.

Nicht alle Tests werden zum Beispiel gut geschrieben, Auswahlfragen mit zweideutigen Antworten oder schlechten Einschluss des gewünschten Lehrplans enthaltend. Einige standardisierte Tests schließen Aufsatz-Fragen ein, und einige haben die Wirksamkeit der Sortieren-Methoden kritisiert. Kürzlich ist das teilweise computerisierte Sortieren von Aufsätzen für einige Tests eingeführt worden, der noch mehr umstritten ist.

Bildungsentscheidungen

Testhunderte werden in einigen Fällen als ein alleiniges, obligatorisches oder primäres Kriterium für Bekenntnisse oder Zertifikat verwendet. Zum Beispiel verlangen einige amerikanische Staaten Graduierungsüberprüfungen der Höheren Schule. Entsprechende Hunderte auf diesen Ausgangsprüfungen sind für die Graduierung der Höheren Schule erforderlich. Der Allgemeine Bildungsentwicklungstest wird häufig als eine Alternative zu einem Abiturzeugnis verwendet.

Andere Anwendungen schließen das Verfolgen ein (entscheidend, ob ein Student in die "schnelle" oder "langsame" Version eines Kurses eingeschrieben werden sollte), und Verleihungsgelehrsamkeiten. In den Vereinigten Staaten übersetzen viele Universitäten und Universitäten automatisch Hunderte auf Fortgeschrittenen Stellen-Tests in den Universitätskredit, die Befriedigung von Graduierungsvoraussetzungen oder das Stellen in fortgeschritteneren Kursen. Verallgemeinerte Tests solcher als das GESESSENE oder GRE werden öfter als ein Maß unter mehreren verwendet, wenn man Bekenntnis-Entscheidungen trifft. Einige öffentliche Einrichtungen haben Abkürzungshunderte für das GESESSENE, GPA oder die Klassenreihe, um Klassen von Bewerbern zu schaffen, um automatisch zu akzeptieren oder zurückzuweisen.

Das schwere Vertrauen auf standardisierten Tests auf die Beschlussfassung ist häufig aus den Gründen umstritten, die oben bemerkt sind. Kritiker haben häufig vor, kumulative oder sogar nichtnumerische Maßnahmen, wie Klassenzimmer-Ränge oder kurze individuelle Bewertungen (geschrieben in der Prosa) von Lehrern zu betonen. Unterstützer behaupten, dass Testhunderte einen klaren, objektiven Standard zur Verfügung stellen, der das Potenzial für den politischen Einfluss oder die Bevorzugung minimiert.

Die Nationale Akademie von Wissenschaften empfiehlt, dass Hauptbildungsentscheidungen nicht allein auf einer Testkerbe basieren. Der Gebrauch von minimalen Kürzungshunderten für den Eingang oder die Graduierung bezieht keinen einzelnen Standard ein, da Testhunderte fast immer mit anderen minimalen Kriterien wie Zahl von Krediten, erforderlichen Kursen, Bedienung verbunden werden, usw. werden Testhunderte häufig als die "alleinigen Kriterien" einfach wahrgenommen, weil sie am schwierigsten sind, oder die Erfüllung anderer Kriterien automatisch angenommen wird. Eine Ausnahme zu dieser Regel ist der GED, der vielen Menschen erlaubt hat, ihre Sachkenntnisse anerkennen zu lassen, wenn auch sie traditionellen Kriterien nicht entsprochen haben.

Siehe auch

Hauptthemen:

  • Konzeptwarenbestand
  • Bildungsbewertung
  • Einschätzung
  • Liste von standardisierten Tests im USA-
  • Psychometrics
  • Standardbasierte Bewertung
  • Test (Bewertung)

Andere Themen:

Weiterführende Literatur

  • Ravitch, Diane, "Der Gebrauch und Missbrauch von Tests", in Den Schulen Verdienen Wir (New York: Grundlegende Bücher, 1985), Seiten 172-181.
  • Huddleston, Mark W. Boyer, William W.The höherer öffentlicher Dienst in den Vereinigten Staaten: Suche nach der Reform. (Universität der Pittsburger Presse, 1996)
  • Phelps, Richard P., Hrsg., die Scheinbeweise über die Pädagogische und Psychologische Prüfung Korrigiert. (Washington, Bezirk: Amerikanische Psychologische Vereinigung, 2008)
  • Phelps, Richard P., Standardisierte Probezündvorrichtung. (New York, New York: Peter Lang, 2007)

Links


George William Forbes / Peg Woffington
Impressum & Datenschutz