Nadat de gescoorde data door Stichting Cito zijn gecontroleerd en geanalyseerd volgt
de landelijke (toetsoverstijgende) normeringsprocedure.
De normering wordt door Stichting Cito uitgevoerd met behulp van het gezamenlijke
anker. De berekeningen worden uitgevoerd in daarvoor voorgeschreven gevalideerde software.
De normeringsprocedure bestaat uit de volgende stappen:
Periodiek worden de onderdeelgewichten en de cesuren voor de referentieniveaus en
de toetsadviescategorieën geanalyseerd en zo nodig geactualiseerd. Hiervoor worden
onder andere gegevens uit het meest recente Toelatings- en doorstroomonderzoek gebruikt.
3.3.1. Kalibratie gezamenlijk ankeropgaven
Voor ieder van de wettelijk verplichte onderdelen Lezen, Rekenen en Taalverzorging
wordt de afnamedata van alle toetsaanbieders samengenomen. Deze data worden gekalibreerd
in het 2PL-itemresponsmodel, waarbij iedere toets als afzonderlijke populatie in de
MML-kalibratie wordt behandeld. Alleen leerlingen van regulier basisonderwijs worden
hierin meegenomen. Verder worden opgaven niet gebruikt wanneer:
-
– de opgave minder dan 200 observaties heeft;
-
– er sprake is van een item met slechts één responscategorie
-
– de opgave een discriminatieparameter in het 2PL heeft van a < 0.1.
In deze kalibratie worden de gezamenlijk ankeropgaven die al in eerdere jaren opgenomen
zijn geweest in de doorstroomtoetsen gefixeerd op de destijds vastgestelde parameters.
Deze worden voorafgaand aan de campagne gedeeld door met de toetsaanbieders. Door
deze parameterfixatie worden alle toetsen en ook gezamenlijk ankeropgaven die voor
het eerst worden afgenomen op dezelfde schaal gebracht.
Alle gezamenlijk ankeropgaven worden gecontroleerd op mogelijk differentieel functioneren
(DIF) tussen toetsen onderling, maar ook in vergelijking met doorstroomtoetsafnames
uit het verleden (parameterdrift). Dit gebeurt door middel van een visuele inspectie
van de itemcurves en een impactanalyse rondom de cesuurpunten van de referentieniveaus.
Bij het constateren van differentieel functioneren wordt hiervoor gecompenseerd met
de ingrepen zoals besproken in 2.2.1E. De bevindingen worden teruggerapporteerd aan
de toetsaanbieders. Na het uitvoeren van deze procedure worden de parameters van de
gezamenlijk ankeropgaven vastgesteld door het CvTE en gedeeld met de toetsaanbieders.
Teruglevering itemparameters gezamenlijk anker
Stichting Cito levert de toetsaanbieders een csv-bestand met gekalibreerde itemparameters,
zowel van de bestaande als de nieuwe items van het gezamenlijk anker. Hierin staan
de volgende kolommen:
Kolomnaam
|
Omschrijving
|
item_id
|
Itemlabel
|
item_score
|
Score van het item (1)
|
beta
|
Moeilijkheidsparameter
|
SE_beta
|
Standaardfout op moeilijkheidsparameter
|
alpha
|
Discriminatieparameter
|
SE_alpha
|
Standaardfout op discriminatieparameter
|
onderdeel
|
Het onderdeel van het item
|
Als bestandsnaam wordt gebruikt:
ankerparameters_JAAR.csv
Tevens levert Stichting Cito dan aan de toetsaanbieders een bestand met uitgeschakelde
items die een te lage discriminatieparameter kregen in de initiële 2PL-kalibratie.
Kolomnaam
|
Omschrijving
|
item_id
|
Itemlabel
|
onderdeel
|
Het onderdeel behorende bij het item
|
alpha
|
Discriminatieparameter
|
beta
|
Moeilijkheidsparameter
|
SE_alpha
|
Standaardfout op discriminatieparameter
|
SE_beta
|
Standaardfout op moeilijkheidsparameter
|
Als bestandsnaam wordt gebruikt:
TOETS_uitgeschakeld_ankerkalibratie.csv
3.3.2. Doorrekening normering doorstroomtoetsen
De toetseigen opgaven van de verplichte onderdelen van iedere toetsaanbieder worden
apart gekalibreerd in het 2PL-itemresponsmodel, waarbij het gezamenlijk anker wordt
gefixeerd op de in stap 1 (kalibratie anker) verkregen parameters. Hierdoor worden
de opgaven van iedere toets op dezelfde, vergelijkbare schaal gebracht. In deze procedure
worden dezelfde eisen gesteld aan opgaven als in stap 1, en worden eveneens alleen
resultaten van leerlingen uit het regulier basisonderwijs meegenomen.
Met deze parameters worden vervolgens vaardigheidsschattingen uitgevoerd voor alle
leerlingen voor ieder verplicht toetsonderdeel. De vaardigheidsschattingen worden
vergeleken met de meest recent bepaalde cesuurpunten voor de referentieniveaus 1F
en 2F/1S voor de drie wettelijk verplichte onderdelen.
Voor iedere leerling van wie de gegevens zijn aangeleverd door de toetsaanbieder worden
de vaardigheden op alle onderdelen die meetellen voor het toetsadvies samengevoegd
tot een gemiddelde latente vaardigheid (GLV). De GLV’s worden vervolgens vergeleken
met de meest recent door Stichting Cito vastgestelde cesuurpunten voor de toetsadviescategorieën
om op basis hiervan een toetsadvies toe te kennen.
Referentieniveaus
Nadat de itemparameters geschat zijn, worden voor de drie verplichte onderdelen vaardigheidsschattingen
uitgevoerd voor iedere leerling met behulp van Warm’s gewogen waarschijnlijkheidsschatter.
Deze vaardigheidsschattingen worden vervolgens vergeleken met de cesuurpunten voor
ieder van de referentieniveaus:
Tabel 1: cesuurpunten voor de referentieniveaus in de IRT-normering.
referentieniveau
|
cesuur
|
Lezen 1F
|
– 2.12085
|
Lezen 2F
|
– 0.81552
|
Rekenen 1F
|
– 1.59269
|
Rekenen 1S
|
0.02194
|
Taalverzorging 1F
|
– 2.00258
|
Taalverzorging 2F
|
– 0.43391
|
Van iedere doorstroomtoets zal de proportie referentieniveau behaald uitgerekend worden.
Toetsadviezen
De cesuurpunten voor de toetsadviezen zijn gedefinieerd op de GLV-schaal. De wegingsfactoren
van de verschillende onderdelen in de GLV zijn:
Tabel 2: wegingsfactoren van de onderdelen voor de GLV.
lezen
|
rekenen
|
taal
|
0.3000
|
0.4500
|
0.2500
|
De GLV’s worden vervolgens vergeleken met cesuurpunten om iedere leerling op basis
hiervan een toetsadvies toe te kennen:
Tabel 3: cesuurpunten voor de toetsadviezen op de GLV-schaal in de IRT-normering.
grenspunt
|
cesuur
|
pro/vmbo bb → vmbo bb/kb
|
– 2.16753
|
vmbo bb/kb → vmbo kb/gl-tl
|
– 1.13056
|
vmbo kb/gl-tl → vmbo gl-tl/havo
|
– 0.48615
|
vmbo gl-tl/havo → havo/vwo
|
0.18100
|
havo/vwo → vwo
|
0.79278
|
Teruglevering uitgeschakelde items
Dit bestand bevat de items die uitgeschakeld zijn in de IRT-kalibratie omdat ze een
discriminatieparameter met een waarde lager dan 0.1 hebben gekregen in de initiële
2PL-kalibratie of te weinig observaties hadden. Als er geen items uitgeschakeld zijn
wordt een leeg bestand opgeleverd. De volgende kolommen zijn opgenomen:
Kolomnaam
|
Omschrijving
|
item_id
|
Itemlabel
|
onderdeel
|
Het onderdeel behorende bij het item
|
alpha
|
Discriminatieparameter
|
beta
|
Moeilijkheidsparameter
|
SE_alpha
|
Standaardfout op discriminatieparameter
|
SE_beta
|
Standaardfout op moeilijkheidsparameter
|
Als bestandsnaam wordt gebruikt:
TOETS_uitgeschakeld.csv
Teruglevering itemparameters
Dit bestand bevat de itemparameters zoals geschat in de IRT-normering volgens het
2PL-model. De volgende kolommen zijn opgenomen:
Kolomnaam
|
Omschrijving
|
item_id
|
Itemlabel
|
onderdeel
|
Het onderdeel behorende bij het item
|
alpha
|
Discriminatieparameter
|
beta
|
Moeilijkheidsparameter
|
SE_alpha
|
Standaardfout op discriminatieparameter
|
SE_beta
|
Standaardfout op moeilijkheidsparameter
|
Als bestandsnaam wordt gebruikt:
TOETS_itemparameters.csv
Teruglevering populatieparameters
Bevat de MML-populatieparameters zoals geschat in de IRT-normering in het 2PL-model
voor alle onderdelen. De volgende kolommen zijn opgenomen:
Kolomnaam
|
Omschrijving
|
populatie
|
Naam van populatie/toetsboekje/covariaat indien van toepassing, anders de naam van
de toets
|
group_n
|
Aantal leerlingen in de populatie
|
onderdeel
|
Het onderdeel
|
mu
|
Populatiegemiddelde
|
sd
|
Standaarddeviatie van de populatie
|
SE_mu
|
Standaardfout op het populatiegemiddelde
|
SE_sd
|
Standaardfout op de standaarddeviatie van de populatie
|
Als bestandsnaam wordt gebruikt:
TOETS_populatieparameters.csv
Teruglevering vaardigheidsschattingen
Bevat voor iedere leerling de vaardigheid op ieder onderdeel in het 2PL-model, geschat
via Warm’s gewogen waarschijnlijkheidsschatter. Tevens zijn de berekende GLV’s en
de via de cesuren daaraan gerelateerde toetsadviezen hieraan toegevoegd. De volgende
kolommen zijn opgenomen:
Kolomnaam
|
Omschrijving
|
person_id
|
Leerlingidentificatiecode
|
schooltype
|
Schooltype, zelfde indeling als leerlinggegevens
|
theta_[onderdeel]
|
Vaardigheidsschatting voor ieder onderdeel
|
glv
|
GLV
|
toetsadvies
|
Toetsadvies volgens de IRT-normering
|
Als bestandsnaam wordt gebruikt:
TOETS_vaardigheden.csv
Teruglevering referentieniveaus
Bevat een overzicht van de behaalde referentieniveaus in de IRT-normering in het 2PL-model,
waarbij alleen leerlingen uit regulier BO zijn meegenomen. De volgende kolommen zijn
opgenomen:
Kolomnaam
|
Omschrijving
|
onderdeel
|
Het onderdeel
|
niveau
|
Het referentieniveau
|
perc_behaald
|
Percentage behaald
|
Als bestandsnaam wordt gebruikt:
TOETS_referentieniveaus.csv
Teruglevering toetsadviezen
Bevat een overzicht met behaalde toetsadviezen in de IRT-normering. Alleen leerlingen
uit regulier BO worden meegenomen. De volgende kolommen zijn opgenomen:
Kolomnaam
|
Omschrijving
|
toetsadvies
|
Het toetsadvies
|
perc_behaald
|
Percentage behaald
|
Als bestandsnaam wordt gebruikt:
TOETS_toetsadviezen.csv
Controle
Met behulp van een populatieschatting op basis van de voorlopige schooladviezen wordt
een vergelijking tussen de toetsaanbieders gemaakt van de prestaties op de referentieniveaus
en de verdeling van toetsadviezen. Hiervoor zal conditioneel op schooladvies een trekking
worden uitgevoerd uit de behaalde referentieniveaus en toetsadviezen van de volledige
landelijke populatie (voor zover de schooladviezen bekend zijn).
3.3.3. Toepassing normering doorstroomtoetsen
De in stap 2 (doorrekening normering doorstroomtoetsen) doorgerekende resultaten op
de normeringssteekproef dienen slechts ter controle. Iedere toetsaanbieder past de
vastgestelde normering, in de vorm van de in stap 1 (kalibratie gezamenlijk anker)
vastgestelde parameterfixaties voor het gezamenlijk anker en de in stap 2 vastgestelde
cesuren, zelf toe voor iedere deelnemende leerling ten behoeve van de rapportages.
Indien een toets gebruikmaakt van een opgavebank of de steekproef te beperkt was,
kunnen hierbij ook opgaven meegenomen worden die in de operationele afname van de
doorstroomtoets minder dan 200 observaties hadden, mits voor die opgaven voldaan wordt
aan de eisen voor itemparameterschattingen zoals genoemd in 5.2.1 doel B in het Beoordelingskader.
Nadat de toetsadviezen en referentieniveaus zijn uitgerekend voor de leerlingen in
de met het CvTE en Stichting Cito gedeelde normeringssteekproef wordt de normering,
inclusief de cesuren voor de referentieniveaus en de toetsadviescategorieën en de
onderdeelgewichten, door het CvTE definitief vastgesteld.