3. Onderwijskundige aspecten
3.1. Inleiding
In de volgende paragrafen worden de vakinhoudelijke kwaliteitseisen uitgewerkt voor
de wettelijk verplichte domeinen Lezen en Begrippenlijst en Taalverzorging, daaronder
niet begrepen het subdomein Begrippenlijst, van het terrein Nederlandse taal en de
wettelijk verplichte domeinen Getallen, Verhoudingen, Meten en Meetkunde en Verbanden
van het terrein Rekenen én de optionele domeinen Schrijven en Mondelinge taalvaardigheid
en het eveneens optionele subdomein Begrippenlijst van het terrein Nederlandse taal,
in lijn met het Toetsbesluit PO, de Wet doorstroomtoetsen po en zoals vastgesteld in het Besluit referentieniveaus Nederlandse taal en Rekenen. Voor alle wettelijk verplichte en optionele (sub)domeinen zijn in deze regeling
kwaliteitseisen geformuleerd.
Naast de wettelijk verplichte én optionele terreinen en (sub)domeinen staat het de
toetsaanbieder vrij om extra kennisgebieden aan de doorstroomtoets toe te voegen,
bijv. aardrijkskunde. De score die de leerling op deze extra kennisgebieden haalt,
mag de toetsaanbieder toevoegen aan het leerlingrapport. Deze extra kennisgebieden
tellen niet mee voor het berekende toetsadvies en tellen ook niet mee voor de berekende
score op de referentieniveaus. Alle toetsopgaven van de wettelijk verplichte en optionele
(sub)domeinen en terreinen, én de extra kennisgebieden worden inhoudelijk door een
adviseur van het CvTE beoordeeld. Zie in dit kader de kwaliteitseisen in paragraaf
3.2. Dit beoordelingskader schrijft niet voor wat de minimale en maximale toetslengte
in aantal toetsvragen van een doorstroomtoets dient te zijn. Eveneens worden er geen
richtlijnen gegeven over de verhouding van het aantal toetsvragen tussen de wettelijk
verplichte en optionele (sub)domeinen en terreinen, én extra kennisgebieden. Verder
worden er ook geen richtlijnen gegeven voor het aantal toetsvragen per referentieniveau
1F/2F/1S. Dit om de aanbieders de mogelijkheid te geven om zich van elkaar te onderscheiden
en volgens de eigen zienswijze een compleet beeld van de leerlingen te kunnen geven.
3.2. Inhoudsvaliditeit doorstroomtoets
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
V1
|
Is de toetsmatrijs een adequate representatie van het meetdoel voor in ieder geval
de wettelijk verplichte (sub)domeinen van Nederlandse taal en Rekenen én de, indien
van toepassing, optionele (sub)domeinen van Nederlandse taal?
|
ja/nee
|
V2
|
Voldoen de toetsopgaven van enerzijds de wettelijk verplichte (sub)domeinen van Nederlandse
taal en Rekenen én anderzijds de, indien van toepassing, optionele (sub)domeinen van
Nederlandse taal in de toets aan de kwaliteitscriteria voor de inhoudsvaliditeit (zijnde
de relevantie van de inhoud van de toets) van toetsopgaven?
|
ja/nee
|
V3
|
Zijn de toetsopgaven van wettelijk verplichte (sub)domeinen van Nederlandse taal en
Rekenen én de, indien van toepassing, optionele (sub)domeinen van Nederlandse taal
in de toets correct geconstrueerd?
|
ja/nee
|
Toelichting V1: De toetsmatrijs is voor wat betreft wettelijk verplichte (sub)domeinen van Nederlandse
taal en Rekenen én de, indien van toepassing, optionele (sub)domeinen van Nederlandse
taal een adequate representatie van het meetdoel. Dat betekent eveneens dat er via
de toetsmatrijs wordt voldaan aan de eisen uit de Toetswijzer PO.
Er is sprake van een adequate representatie wanneer de toetstermen het meetdoel representeren.
Dit blijkt uit het gegeven dat:
-
○ de leerdoelen zijn geoperationaliseerd in observeerbare en meetbare toetstermen die
ieder voor zich aansluiten bij de domeinbeschrijvingen en indeling van de referentieniveaus
voor de wettelijk verplichte en, indien van toepassing, optionele (sub)domeinen van
de terreinen Nederlandse taal en Rekenen;
-
○ de toetsmatrijs in ieder geval bevat: (1) het aantal vragen met bijbehorende scorepunten
per vraag, (2) de toetsvorm en/of het type vragen, (3) de verdeling over de (sub)domeinen,
(4) de verdeling van de verschillende vraag- en teksttypes in de toets, (5) de verdeling
over de referentieniveaus, (6) de toegestane hulpmiddelen, en (7) de geschatte toetsduur;
-
○ in het geval van een CAT dat de aanbieder verantwoordt hoe de wettelijk verplichte
en, indien van toepassing, optionele (sub)domeinen van de terreinen Nederlandse taal
en Rekenen op representatieve wijze voor alle individuele leerlingen aan bod komen;
Toelichting V2: De adviseur evalueert in opdracht van het CvTE de relevantie van de inhoud van alle
aangeleverde toetsopgaven van enerzijds de wettelijk verplichte (sub)domeinen van
Nederlandse taal en Rekenen én anderzijds van de, indien van toepassing, optionele
(sub)domeinen van Nederlandse taal op de kwaliteitseisen: relevantie, objectiviteit,
efficiëntie, specificiteit en neutraliteit, zoals beschreven in de Checklist voor
het beoordelen van de kwaliteit van observatie-categorieën en toetsopgaven.
Indien in de doorstroomtoets ook optionele productieve vaardigheden worden getoetst,
levert de aanbieder een beoordelaarsschema in, aangevuld met informatie over de beoordelaarsovereenstemming,
een en ander conform de voorschriften uit de Toetswijzer PO.
Toelichting V3: Een adviseur evalueert in opdracht van het CvTE of de toetsopgaven van in ieder geval
de wettelijk verplichte (sub)domeinen van Nederlandse taal en Rekenen én de optionele
(sub)domeinen van Nederlandse taal in de toets voldoen aan de constructievoorschriften
voor toetsvragen, zoals beschreven in de Checklist voor het beoordelen van de kwaliteit
van observatie-categorieën en toetsopgaven.
Ongewenste gevoeligheid van bijvoorbeeld opgaven, teksten en luisterfragmenten (denk
aan reclame) wordt ondervangen met de kwaliteitseis Neutraliteit in de Checklist voor
het beoordelen van de kwaliteit van observatie-categorieën en toetsopgaven. Het CvTE
beoordeelt niet of er rechtmatig gebruik wordt gemaakt van auteursrechtelijk materiaal.
3.3. Verantwoording
Kwaliteitseis
Beslisregel: Om aan deze categorie kwaliteitseis te voldoen, dient de vraag met JA
te worden beantwoord.
Code
|
Vraag
|
Mogelijke
antwoorden
|
H1
|
Is er (een set van) verantwoordingsdocumenten aangeboden aan het CvTE met daarin voor
wat betreft in ieder geval de wettelijk verplichte (sub)domeinen van Nederlandse taal
en Rekenen én, indien van toepassing, de optionele (sub)domeinen van Nederlandse taal
een verantwoording van de gemaakte keuzes ten aanzien van de toetsinhoud, de afnamevorm,
de psychometrische aspecten en de kwaliteitszorg rondom de itemconstructie van de
toets?
|
ja/nee
|
Toelichting H1: Er wordt gecontroleerd of de verantwoordingsdocumenten voor wat betreft de wettelijk
verplichte (sub)domeinen van de terreinen Nederlandse taal en Rekenen én de, indien
van toepassing, optionele (sub)domeinen van het terrein Nederlandse taal inhoudelijk
voldoen aan de wettelijke kwaliteitseisen uit het Toetsbesluit PO en aan de inhoudelijke eisen van de Toetswijzer PO. Meer specifiek dient de door
het CvTE te beoordelen set verantwoordingsdocumenten te bestaan uit de (separate)
documenten aansluitend bij hoofdstuk 1.3.
In het kader van transparantie, dient in de (set van) verantwoordingsdocumenten terug
te vinden te zijn welke terreinen en (sub)domeinen wel en niet meetellen voor het
berekenen van het toetsadvies. Alle documenten dient de toetsaanbieder jaarlijks te
updaten.
3.4. Terrein Nederlandse taal
In iedere doorstroomtoets worden voor wat betreft het terrein Nederlandse taal de
wettelijk verplichte domeinen Lezen (§ 3.4.1) en Begrippenlijst en Taalverzorging,
daaronder niet begrepen het subdomein Begrippenlijst, (§ 3.4.2) getoetst. Aanvullend
hierop kunnen optioneel één of meerdere van de domeinen Schrijven (§ 3.4.3) en Mondelinge
taalvaardigheid (§ 3.4.4) en het subdomein Begrippenlijst (§ 3.4.5) worden getoetst.
De gestelde vakinhoudelijke kwaliteitseisen voor deze vijf onderdelen en de vereiste
verdeling van de toetsopgaven over de (sub)domeinen in de toetsmatrijs en de toetssamenstelling
zijn opgenomen in de Toetswijzer PO.
3.4.1. Wettelijk verplicht domein: Lezen
Beslisregel:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
-
1. Taken: van L1.1 t/m L1.3 dienen tenminste twee van de drie vragen met JA te worden
beantwoord en dient L4 met JA te worden beantwoord.
-
2. Tekstkenmerken: vraag L2 en L5 dienen beide met JA te worden beantwoord.
-
3. Kenmerken van de taakuitvoering: alle vragen (L3.1 t/m L3.7a en L6.1 t/m L6.4a) dienen
met JA of N.V.T. te worden beantwoord.
3.4.1.1. Subdomein Zakelijke Teksten
Kwaliteitseisen
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
L1.1
|
Lezen de leerlingen minimaal één informatieve tekst en maken ze daar opdrachten bij?
|
ja/nee
|
L1.2
|
Lezen de leerlingen minimaal één instructieve tekst en maken ze daar opdrachten bij?
|
ja/nee
|
L1.3
|
Lezen de leerlingen minimaal één betogende tekst en maken ze daar opdrachten bij?
|
ja/nee
|
Tekstkenmerken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
L2
|
Voldoen de teksten die de leerlingen lezen aan de tekstkenmerken inhoud (thema), vorm
(taalgebruik en structuur) en bedoeling (doel), zoals gespecifieerd in Checklist 1
van deze regeling en zoals nader omgeschreven in het Referentiekader?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
L3.1
|
Wordt in de toets als kenmerk van de taakuitvoering techniek en woordenschat getoetst?
|
ja/nee
|
L3.2
|
Wordt in de toets als kenmerk van de taakuitvoering begrijpen getoetst?
|
ja/nee
|
L3.3
|
Wordt in de toets als kenmerk van de taakuitvoering interpreteren getoetst?
|
ja/nee
|
L3.4
|
Wordt in de toets als kenmerk van de taakuitvoering samenvatten getoetst?
|
ja/nee
|
L3.5
|
Wordt in de toets als kenmerk van de taakuitvoering opzoeken getoetst?
|
ja/nee
|
L3.6
|
Wordt in de toets als kenmerk van de taakuitvoering evalueren getoetst (conform de
Toetswijzer PO is het onderwerp ‘evalueren’ een optioneel en niet verplicht onderdeel
van de toets)?
|
ja/nee/n.v.t.
|
L3.7
|
Worden in de toets de verschillende kenmerken van de taakuitvoering evenwichtig getoetst
binnen het subdomein zakelijke teksten?
|
ja/nee
|
L3.7a
|
In geval van een digitale adaptieve toets (CAT of MST), verantwoordt de toetsaanbieder
op basis van welke beslisregel (het algoritme in het geval van een CAT en het module-design
in geval van een MST) er wordt gegarandeerd dat er een evenwichtige verdeling is tussen
opgaven rond zakelijke teksten?
|
ja/nee/n.v.t.
|
Toelichting L1.1 t/m L1.3: Tenminste twee van de drie taken dienen in de doorstroomtoets te worden opgenomen.
Toelichting L3.7: Evenwichtig wil zeggen dat de in L3.1 tot en met L3.5 (en eventueel L3.6) genoemde
kenmerken gezamenlijk een representatieve weergave zijn van de inhoud van het betreffende
subdomein van het terrein Nederlandse taal.
Toelichting L3.7a: Naast het algoritme of module-design is de werking van de beslisregel aan te tonen
door middel van het opleveren van enkele (voorbeeld)toetspaden, zoals die door de
beslisregel worden gegenereerd.
Toelichting L1 t/m L3: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010, p.
12-14) leidend.
3.4.1.2. Subdomein Fictionele, narratieve en literaire teksten
Kwaliteitseisen
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
L4
|
Lezen de leerlingen minimaal één fictionele, narratieve en/of literaire tekst en maken
ze daar opdrachten bij?
|
ja/nee
|
Tekstkenmerken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
L5
|
Voldoen de teksten die de leerlingen lezen aan de tekstkenmerken inhoud (thema), vorm
(taalgebruik en structuur) en bedoeling (doel), zoals gespecifieerd in Checklist 1
van deze regeling en zoals nader omgeschreven in het Referentiekader?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
L6.1
|
Wordt in de toets als kenmerk van de taakuitvoering begrijpen getoetst?
|
ja/nee
|
L6.2
|
Wordt in de toets als kenmerk van de taakuitvoering interpreteren getoetst?
|
ja/nee
|
L6.3
|
Optioneel: Wordt in de toets als kenmerk van de taakuitvoering evalueren getoetst
(conform de Toetswijzer PO is het onderwerp ‘evalueren’ een optioneel en niet verplicht
onderdeel van de toets)?
|
ja/nee/n.v.t.
|
L6.4
|
Worden in de toets de verschillende kenmerken van de taakuitvoering evenwichtig getoetst
binnen het subdomein fictionele, narratieve en literaire teksten?
|
ja/nee
|
L6.4a
|
In geval van een digitale adaptieve toets (CAT of MST), verantwoordt de toetsaanbieder
op basis van welke beslisregel (het algoritme in het geval van een CAT en het module-design
in geval van een MST) er wordt gegarandeerd dat er een evenwichtige verdeling is tussen
opgaven rond fictionele, narratieve en literaire teksten?
|
ja/nee/n.v.t.
|
Toelichting L6.4: Evenwichtig wil zeggen dat de in L6.1 en L6.2 (en eventueel L6.3) genoemde kenmerken
gezamenlijk een representatieve weergave zijn van de inhoud van het betreffende subdomein
van het terrein Nederlandse taal.
Toelichting L6.4a: Naast het algoritme of module-design is de werking van de beslisregel aan te tonen
door middel van het opleveren van enkele toetspaden, zoals die door de beslisregel
worden gegenereerd.
3.4.2. Wettelijk verplicht subdomein: Taalverzorging
Kwaliteitseisen
De leerlingen worden getoetst op verschillende taalverzorgingscategorieën, zoals gespecificeerd
in TV1 t/m TV3.
Beslisregel:
Om aan deze categorie kwaliteitseisen te voldoen, dienen de vragen TV1.1 t/m TV1.7a
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
TV1
|
Worden de leerlingen getoetst op verschillende categorieën van spellingsproblemen
en -regels?
|
ja/nee
|
TV1.a
|
Worden de leerlingen getoetst op regels voor lettergreepgrenzen?
|
ja/nee
|
TV1.b
|
Worden de leerlingen getoetst op morfologische spelling?
|
ja/nee
|
TV1.c
|
Worden de leerlingen getoetst op regels voor werkwoordspelling?
|
ja/nee
|
TV1.d
|
Worden de leerlingen getoetst op overige regels?
|
ja/nee
|
TV1.e
|
Worden de leerlingen getoetst op interpunctie (hoofdletters en leestekens)?
|
ja/nee
|
TV2
|
Verantwoordt de toetsaanbieder dat er een evenwichtige verdeling is tussen opgaven
rond niet-werkwoordspelling, werkwoordspelling en interpunctie?
|
ja/nee
|
TV3
|
In geval van een digitale adaptieve toets (CAT of MST), verantwoordt de toetsaanbieder
op basis van welke beslisregel (het algoritme in het geval van een CAT en het module-design
in geval van een MST) er wordt gegarandeerd dat er een evenwichtige verdeling is tussen
opgaven rond niet-werkwoordspelling, werkwoordspelling en interpunctie?
|
ja/nee/n.v.t.
|
Toelichting TV2: Evenwichtig wil zeggen dat de in TV1.a tot en met TV1.e genoemde categorieën van
spellingsregels gezamenlijk een representatieve weergave zijn van de inhoud van het
betreffende subdomein van het terrein Nederlandse taal.
Toelichting TV3: Naast het algoritme of module-design is de werking van de beslisregel aan te tonen
door middel van het opleveren van enkele toetspaden, zoals die door de beslisregel
worden gegenereerd.
3.4.3. Optioneel domein: Schrijven
Kwaliteitseisen schrijven via indirecte meting
Beslisregel schrijven indirecte meting:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
S1.1
|
Lezen de leerlingen tekstsoorten uit de schrijftakencategorie: Correspondentie (om
te reviseren of te beoordelen)?
|
ja/nee
|
S1.2
|
Lezen de leerlingen tekstsoorten uit de schrijftakencategorie: Formulieren, berichten,
advertenties, aantekeningen (om te reviseren of te beoordelen)?
|
ja/nee
|
S1.3
|
Lezen de leerlingen tekstsoorten uit de schrijftakencategorie: Verslagen, werkstukken,
samenvattingen, artikelen (om te reviseren of te beoordelen)?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
S2.1
|
Maken leerlingen opgaven waarin ze teksten reviseren of beoordelen op het aspect:
samenhang?
|
ja/nee
|
S2.2
|
Maken leerlingen opgaven waarin ze teksten reviseren of beoordelen op het aspect:
afstemming op doel?
|
ja/nee
|
S2.3
|
Maken leerlingen opgaven waarin ze teksten reviseren of beoordelen op het aspect:
afstemming op publiek?
|
ja/nee
|
S2.4
|
Maken leerlingen opgaven waarin ze teksten reviseren of beoordelen op het aspect:
woordgebruik en woordenschat?
|
ja/nee
|
Toelichting S1 en S2: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010)
leidend.
Kwaliteitseisen schrijven directe meting
Beslisregel schrijven directe meting:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
-
1. Taken: De vragen bij S3.1 t/m S3.3 dienen alle met JA te worden beantwoord (minimaal
één taak per categorie).
-
2. Kenmerken van de taakuitvoering: de vragen bij S4 dienen met JA te worden beantwoord.
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
S3.1
|
Schrijven de leerlingen een tekst uit de schrijftakencategorie: Correspondentie?
|
ja/nee
|
S3.2
|
Schrijven de leerlingen een tekst uit de schrijftakencategorie: Formulieren, berichten,
advertenties en/of aantekeningen?
|
ja/nee
|
S3.3
|
Schrijven de leerlingen een tekst uit de schrijftakencategorie: Verslagen, werkstukken,
samenvattingen en/of artikelen?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
S4.1
|
Worden de teksten die de leerlingen schrijven beoordeeld op het aspect: samenhang?
|
ja/nee
|
S4.2
|
Worden de teksten die de leerlingen schrijven beoordeeld op het aspect: afstemming
op doel?
|
ja/nee
|
S4.3
|
Worden de teksten die de leerlingen schrijven beoordeeld op het aspect: afstemming
op publiek?
|
ja/nee
|
S4.4
|
Worden de teksten die de leerlingen schrijven beoordeeld op het aspect: woordgebruik
en woordenschat?
|
ja/nee
|
Toelichting S3.1 t/m S3.3: Minimaal één taak per categorie in de doorstroomtoets dient te worden opgenomen.
Toelichting S3 en S4: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010)
leidend.
3.4.4. Optioneel domein: Mondelinge taalvaardigheid
Kwaliteitseisen mondelinge taalvaardigheid via indirecte meting
A. Subdomein Gesprekken
Kwaliteitseisen
Beslisregel mondelinge taalvaardigheid indirecte meting, subdomein Gesprekken:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
-
1. Taken: van M1.1 en M1.2 dient één van de twee vragen met JA te worden beantwoord (taak
is minimaal één keer aanwezig).
-
2. Kenmerken van de taakuitvoering: de vragen bij M2 dienen met JA te worden beantwoord.
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M1.1
|
Luisteren en beoordelen de leerlingen gesprekken uit de takencategorie: discussie
en overleg?
|
ja/nee
|
M1.2
|
Luisteren en beoordelen de leerlingen gesprekken uit de takencategorie: informatie
uitwisselen?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M2.1
|
Maken leerlingen opgaven waarin ze gesprekken beoordelen op het aspect: beurten nemen
en bijdragen aan samenhang?
|
ja/nee
|
M2.2
|
Maken leerlingen opgaven waarin ze gesprekken beoordelen op het aspect: afstemming
op doel?
|
ja/nee
|
M2.3
|
Maken leerlingen opgaven waarin ze gesprekken beoordelen op het aspect: afstemming
op de gesprekspartners?
|
ja/nee
|
M2.4
|
Maken leerlingen opgaven waarin ze gesprekken beoordelen op het aspect: woordgebruik
en woordenschat?
|
ja/nee
|
Toelichting M1.1 en M1.2: Tenminste één van de twee taken dient in de doorstroomtoets te worden opgenomen.
Toelichting M1 en M2: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010)
leidend.
B. Subdomein Spreken
Kwaliteitseisen
Beslisregel mondelinge taalvaardigheid indirecte meting, subdomein Spreken:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M3
|
Luisteren en beoordelen de leerlingen een monoloog?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M4.1
|
Maken leerlingen opgaven waarin ze een monoloog beoordelen op het aspect: samenhang?
|
ja/nee
|
M4.2
|
Maken leerlingen opgaven waarin ze een monoloog beoordelen op het aspect: afstemming
op doel?
|
ja/nee
|
M4.3
|
Maken leerlingen opgaven waarin ze een monoloog beoordelen op het aspect: afstemming
op publiek?
|
ja/nee
|
M4.4
|
Maken leerlingen opgaven waarin ze een monoloog beoordelen op het aspect: woordgebruik
en woordenschat?
|
ja/nee
|
Toelichting M3 en M4: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010) leidend.
Kwaliteitseisen mondelinge taalvaardigheid via directe meting
A. Subdomein Gesprekken
Kwaliteitseisen
Beslisregel mondelinge taalvaardigheid directe meting, subdomein Gesprekken:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
-
1. Taken: van M5.1 en M5.2 dient één van de twee vragen met JA te worden beantwoord (taak
is minimaal één keer aanwezig).
-
2. Kenmerken van de taakuitvoering: de vragen bij M6 dienen met JA te worden beantwoord.
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M5.1
|
Nemen de leerlingen deel aan gesprekken uit de takencategorie: discussie en overleg?
|
ja/nee
|
M5.2
|
Nemen de leerlingen deel aan gesprekken uit de takencategorie: informatie uitwisselen?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M6.1
|
Worden de gesprekken die leerlingen voeren beoordeeld op het aspect: beurten nemen
en bijdragen aan samenhang?
|
ja/nee
|
M6.2
|
Worden de gesprekken die leerlingen voeren beoordeeld op het aspect: afstemming op
doel?
|
ja/nee
|
M6.3
|
Worden de gesprekken die leerlingen voeren beoordeeld op het aspect: afstemming op
de gesprekspartners?
|
ja/nee
|
M6.4
|
Worden de gesprekken die leerlingen voeren beoordeeld op het aspect: woordgebruik
en woordenschat?
|
ja/nee
|
Toelichting M5.1 en M5.2: Tenminste één van de twee taken dient in de doorstroomtoets te zijn opgenomen.
Toelichting M5 en M6: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010) leidend.
B. Subdomein Luisteren
Kwaliteitseisen
Beslisregel mondelinge taalvaardigheid indirecte meting, subdomein Luisteren:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
-
1. Taken: van M7.1 t/m M7.3 dienen twee van de drie vragen met JA te worden beantwoord
(taak is minimaal één keer aanwezig).
-
2. Kenmerken van de taakuitvoering: de vragen bij M8 dienen met JA te worden beantwoord.
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M7.1
|
Luisteren de leerlingen naar instructies?
|
ja/nee
|
M7.2
|
Luisteren de leerlingen als lid van een live publiek?
|
ja/nee
|
M7.3
|
Luisteren de leerlingen naar radio en/of televisie en/of naar gesproken tekst op internet
en/of naar overige door de aanbieder gehanteerde communicatiemiddelen?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M8.1
|
Wordt tijdens het luisteren getoetst of leerlingen de luistertekst kunnen begrijpen?
|
ja/nee
|
M8.2
|
Wordt tijdens het luisteren getoetst of leerlingen de luistertekst kunnen interpreteren?
|
ja/nee
|
M8.3
|
Wordt tijdens het luisteren getoetst of leerlingen de luistertekst kunnen samenvatten?
|
ja/nee
|
Toelichting M7.1 t/m M7.3: Twee van de drie taken dienen in de doorstroomtoets te worden opgenomen.
Toelichting bij M7 en M8: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010) leidend.
C. Subdomein Spreken
Kwaliteitseisen
Beslisregel mondelinge taalvaardigheid indirecte meting, subdomein Spreken:
Om aan deze categorie kwaliteitseisen te voldoen, gelden de volgende beslisregels:
Taken:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M9
|
Houden de leerlingen een monoloog?
|
ja/nee
|
Kenmerken van de taakuitvoering:
Code
|
Vragen
|
Mogelijke
antwoorden
|
M10.1
|
Wordt de monoloog die de leerlingen houden beoordeeld op het aspect: samenhang?
|
ja/nee
|
M10.2
|
Wordt de monoloog die de leerlingen houden beoordeeld op het aspect: afstemming op
doel?
|
ja/nee
|
M10.3
|
Wordt de monoloog die de leerlingen houden beoordeeld op het aspect: afstemming op
publiek?
|
ja/nee
|
M10.4
|
Wordt de monoloog die de leerlingen houden beoordeeld op het aspect: woordgebruik
en woordenschat?
|
ja/nee
|
Toelichting M9 en M10: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010) leidend.
3.4.5. Optioneel subdomein: Begrippenlijst
Kwaliteitseis
Beslisregel Begrippenlijst:
Om aan deze categorie kwaliteitseis te voldoen, dient vraag B1 met JA te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
B1
|
Worden de leerlingen getoetst met opgaven die betrekking hebben op de begrippenlijst?
|
ja/nee
|
Toelichting B1: Hierbij zijn de beschrijvingen op niveau 1F en 2F in het Referentiekader (2010, p.
17-19) leidend.
3.5. Terrein Rekenen
Het Referentiekader onderscheidt voor het terrein Rekenen vier wettelijk verplichte
domeinen, te weten Getallen (g), Verhoudingen (vh), Meten en meetkunde (m/mk) en Verbanden
(vb). In de doorstroomtoets dienen alle domeinen getoetst te worden. Dit betekent
dat alle doorstroomtoetsen moeten voldoen aan de gestelde kwaliteitseisen aan het
terrein Rekenen. De gestelde kwaliteitseisen voor de vier domeinen zijn opgenomen
in de Toetswijzer PO.
Een individuele rekenopgave kan betrekking hebben op meerdere domeinen van het terrein
Rekenen. In dat geval dient de aanbieder dit duidelijk te vermelden, bijvoorbeeld
door te kiezen voor het domein dat het beste past bij het beoogde toetsdoel van de
betreffende opgave. Tevens dient de aanbieder dan toe te lichten op welke wijze er
wordt voldaan aan de voorgeschreven verdeling van toetsopgaven over de domeinen van
het terrein Rekenen.
3.5.1. Verdeling toetsopgaven over domeinen in toetsmatrijs en toetssamenstelling
De doorstroomtoets bevat opgaven uit alle domeinen uit het referentiekader Rekenen.
Het betreft de domeinen Getallen (g), Verhoudingen (vh), Meten en meetkunde (m/mk)
en Verbanden (vb).
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
De opgaven dienen in de toets als volgt over de domeinen te zijn verdeeld:
Code
|
Vragen
|
Mogelijke
antwoorden
|
D.G
|
Ligt het percentage toetsopgaven uit het domein Getallen tussen de 30% en 40% van
het totaal aantal toetsopgaven van het terrein Rekenen?
|
ja/nee
|
D.Vh
|
Ligt het percentage toetsopgaven uit het domein Verhoudingen tussen de 20% en 30%
van het totaal aantal toetsopgaven van het terrein Rekenen?
|
ja/nee
|
D.M/mk
|
Ligt het percentage toetsopgaven uit het domein Meten & meetkunde tussen de 20% en
30% van het totaal aantal toetsopgaven van het terrein Rekenen?
|
ja/nee
|
D.Vb
|
Ligt het percentage toetsopgaven uit het domein Verbanden tussen de 15% en 20% van
het totaal aantal toetsopgaven van het terrein Rekenen?
|
ja/nee
|
D.1
|
In geval van een digitale adaptieve toets (CAT of MST), verantwoordt de toetsaanbieder
op basis van welke beslisregel (het algoritme in het geval van een CAT en het module-design
in geval van een MST) de vereiste verdeling van toetsopgaven over de domeinen?
|
ja/nee/n.v.t.
|
Toelichting D.G t/m D.Vb: De gestelde percentages toetsopgaven per domein gelden voor zowel papieren toetsen,
lineaire digitale toetsen, adaptieve toetsen op itemniveau (CAT) en adaptieve toetsen
op moduleniveau (MST).
Toelichting D.1: Naast het algoritme of module-design is de werking van de beslisregel aan te tonen
door middel van het opleveren van enkele toetspaden, zoals die door de beslisregel
worden gegenereerd.
3.5.2. Verdeling toetsopgaven over onderdelen
Elk domein is opgebouwd uit drie onderdelen (zie ook Checklist 3):
-
A. Notatie, taal en betekenis, waarbij het gaat om de uitspraak, schrijfwijze en betekenis
van getallen, symbolen en relaties en om het gebruik van wiskundetaal.
-
B. Met elkaar in verband brengen, waarbij het gaat om het verband tussen begrippen, notaties,
getallen en dagelijks spraakgebruik.
-
C. Gebruiken, waarbij het er om gaat rekenkundige vaardigheden in te zetten bij het oplossen
van problemen.
De toets bevat opgaven uit alle onderdelen.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
De relatieve (procentuele) verdeling van opgaven over de onderscheiden onderdelen is als volgt:
Code
|
Vragen
|
Mogelijke
antwoorden
|
O.A
|
Is iedere toetsopgave, met uitzondering van onderdeel A, onder één onderdeel geplaatst1?
|
ja/nee
|
O.B
|
Is het percentage toetsopgaven uit onderdeel B ten minste 20 procent van het totaal
aantal toetsopgaven van het terrein Rekenen?
|
ja/nee
|
O.C
|
Is het percentage toetsopgaven uit onderdeel C ten minste 30 procent van het totaal
aantal toetsopgaven van het terrein Rekenen?
|
ja/nee
|
O.BC
|
Is het percentage toetsopgaven uit onderdeel C hoger dan het percentage toetsopgaven
uit onderdeel B?
|
ja/nee
|
O.1
|
In geval van een digitale adaptieve toets (CAT of MST), verantwoordt de toetsaanbieder
op basis van welke beslisregel (het algoritme in het geval van een CAT en het module-design
in geval van een MST) de vereiste verdeling van toetsopgaven over de onderdelen?
|
ja/nee/n.v.t.
|
1 Voor onderdeel A is geen minimum vereist, omdat deze inhouden ook kunnen worden gebruikt
en toegepast bij de inhouden van B en C.
Toelichting O.A: De toetsopgaven die onder onderdeel A geplaatst zijn, kunnen ook worden gebruikt
en toegepast bij de inhouden van B en C. Vandaar dat hier de uitzondering van het
slechts plaatsen bij één onderdeel niet geldt en er ook geen percentage vereist wordt.
Toelichting O.A t/m O.BC: De gestelde percentages toetsopgaven per domein gelden voor zowel papieren toetsen,
lineaire digitale toetsen, computergestuurde adaptieve toetsen op itemniveau (CAT)
en adaptieve toetsen op moduleniveau (MST). Naast het algoritme of module-design is
door aanbieders van adaptieve toetsen (CAT en MST) de werking van de beslisregel aan
te tonen door middel van het opleveren van enkele toetspaden.
Toelichting O.1: Naast het algoritme of module-design is de werking van de beslisregel aan te tonen
door middel van het opleveren van enkele toetspaden, die voldoen aan de vereiste verdeling
van toetsopgaven over de onderdelen, zoals die door de beslisregel worden gegenereerd.
3.5.3. Opgaven met en zonder context
In het terrein Rekenen van een doorstroomtoets moeten zowel opgaven met context als
opgaven zonder context (zogenoemde ‘kale opgaven’) worden opgenomen, een en ander
conform de Toetswijzer PO.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
C1
|
Is het percentage toetsopgaven van het type contextopgaven voor het domein Getallen
ten minste 30 procent van het totaal aantal toetsopgaven van het domein Getallen?
|
ja/nee
|
C2
|
Is het percentage toetsopgaven van het type contextloze opgaven voor het domein Getallen
ten minste 20 procent van het totaal aantal toetsopgaven van het domein Getallen?
|
ja/nee
|
C3
|
Is het percentage toetsopgaven van het type contextopgaven voor het domein Verhoudingen
ten minste 30 procent van het totaal aantal toetsopgaven van het domein Verhoudingen?
|
ja/nee
|
C4
|
Is het percentage toetsopgaven van het type contextloze opgaven voor het domein Verhoudingen
ten minste 20 procent van het totaal aantal toetsopgaven van het domein Verhoudingen?
|
ja/nee
|
C5
|
In geval van een digitale adaptieve toets (CAT of MST), verantwoordt de toetsaanbieder
op basis van welke beslisregel (het algoritme in het geval van een CAT en het module-design
in geval van een MST) de vereiste percentuele verdelingen zoals in C1 t/m C4 geschetst?
|
ja/nee/n.v.t.
|
Toelichting C1 t/m C4: De gestelde percentages toetsopgaven per domein gelden voor zowel papieren toetsen,
lineaire digitale toetsen, computergestuurde adaptieve toetsen op itemniveau (CAT)
en adaptieve toetsen op moduleniveau (MST).
Toelichting C5: Toetsaanbieders van adaptieve toetsen (CAT en MST) tonen naast het algoritme of
module-design met de werking van de beslisregel aan, door middel van het opleveren
van enkele toetspaden, zoals die door de beslisregel worden gegenereerd, de vereiste
percentuele verdelingen zoals in C1 t/m C4 geschetst.
3.5.4. Gebruik kladpapier
Kwaliteitseis
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
K1
|
Mogen de leerlingen bij het beantwoorden van de (digitale) toetsopgaven fysiek en/of
niet programmeerbaar kladpapier gebruiken?
|
ja/nee
|
K2
|
Wordt in de handleiding voor leraren en/of het toetsreglement aangegeven dat zij leerlingen
nadrukkelijk dienen te wijzen op het toegestane gebruik van fysiek en/of niet programmeerbaar
kladpapier?
|
ja/nee
|
3.5.5. Gebruik rekenmachine
Kwaliteitseis
Beslisregel: Om aan deze categorie kwaliteitseis te voldoen, dient deze vraag met
JA te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
R1
|
Mogen de leerlingen bij maximaal 20% van de (digitale) toetsopgaven een niet-grafische
en/of niet-programmeerbare rekenmachine gebruiken?
|
ja/nee
|
Toelichting: Gebruik van een niet-grafische en/of niet-programmeerbare rekenmachine is bij maximaal
20% van de toetsopgaven toegestaan. Gebruik van een grafische en/of programmeerbare
rekenmachine is niet toegestaan.
3.6. Toetsopgaven Nederlandse taal en Rekenen op niveau 1F en 2F/1S
In het document Referentiekader taal en Rekenen (SLO, 2011) is vastgelegd wat leerlingen eind groep 8 van de basisschool moeten kennen
en kunnen als het gaat om basisvaardigheden voor Nederlandse taal en Rekenen. Deze
kennis en vaardigheden worden in het referentiekader gespecificeerd in een aantal
referentieniveaus. De verschillende niveaus worden beschreven in twee kwaliteiten:
fundamentele kwaliteit (F) en streefkwaliteit (S). De niveaus zijn cumulatief. Een
leerling moet op een hoger niveau alle vaardigheden beheersen die op een lager niveau
genoemd worden. Deze worden niet telkens herhaald. De beschrijvingen van de niveaus
voor Nederlandse taal en Rekenen verschillen. Dit komt doordat de vakken verschillen.
Voor Nederlandse taal zijn vier niveaus beschreven: 1F, 2F, 3F en 4F en voor Rekenen
zijn zes niveaus beschreven: 1F, 2F, 3F en 1S, 2S en 3S. Voor het po zijn voor het
terrein Nederlandse taal de niveaus 1F en 2F wettelijk vastgelegd. Voor het terrein
Rekenen zijn dit voor het po de niveaus 1F en 1S.
Dit betekent dat, in lijn met de Toetswijzer PO, de doorstroomtoets, ongeacht de toetsvorm,
voor de terreinen Nederlandse taal en Rekenen toetsopgaven moet bevatten die de inhouden
van de niveaus 1F (fundamentele kwaliteit) en 2F / 1S (streefkwaliteit) meten.
Kwaliteitseis
Beslisregel: Om aan deze categorie kwaliteitseis te voldoen, dient vraag TN1 met JA
te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
TN1
|
Zijn de opgaven van de toets voor de terreinen Nederlandse taal en Rekenen breed samengesteld
qua referentieniveaus 1F en 2F / 1S?
|
ja/nee
|
Toelichting TN1: Dit aspect dient uit de toetsmatrijs naar voren te komen. Dat wil zeggen dat in
de toetsmatrijs de verhouding 1F en 2F / 1S vragen is gespecificeerd en dat in zowel
de toetsmatrijs als in de varianten van de doorstroomtoets de verhouding 1F en 2F
/ 1S vragen evenwichtig is. Evenwichtig wil zeggen dat het aantal en de verhouding
1F en 2F / 1S vragen gezamenlijk inhoudelijk de referentieniveaus 1F en 2F/1S van
de terreinen Nederlandse taal en Rekenen representeren, een en ander conform de voorschriften
uit de Toetswijzer PO.
Een CAT dient voor elke individuele leerling voor de terreinen Nederlandse taal en
Rekenen een uitspraak over het behaalde niveau 1F en/of 2F / 1S te geven. In het geval
van een CAT is er verantwoord hoe het 1F en/of 2F/1S niveau van de terreinen Nederlandse
taal en Rekenen op representatieve wijze voor alle individuele leerlingen aan bod
komt. De aanbieder kan dit verantwoorden aan de hand van de toetsmatrijs, aangevuld
met de procesbeschrijving van hoe het algoritme werkt, aangevuld met enkele mogelijke
itemsets inclusief de daarin aangeboden toetsopgaven en inclusief een toelichting
op het daarbij geldende stopcriterium.
Elke routing binnen het MST design dient voor de terreinen Nederlandse taal en Rekenen
een uitspraak over het behaalde niveau 1F en/of 2F / 1S te geven. In het geval van
een MST is er verantwoord hoe het 1F en/of 2F/1S niveau van de terreinen Nederlandse
taal en Rekenen op een bij de moeilijkheidsgraad van de betreffende route passende
wijze voor alle individuele leerlingen aan bod komt. De aanbieder kan dit verantwoorden
aan de hand van de toetsmatrijs, aangevuld met de beschrijving van de samenstelling
van het MST design, aangevuld met enkele toetspaden uit het design inclusief de daarin
aangeboden toetsopgaven.
4. Organisatorische aspecten
4.1. Leerlingrapport
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
LR1
|
Stelt de toetsaanbieder voor elke individuele leerling die de doorstroomtoets aflegt
een leerlingrapport op?
|
ja/nee
|
LR2
|
Bevat het leerlingrapport het toetsadvies, uitgedrukt in één van de toetsadviescategorieën?
|
ja/nee
|
LR3
|
Geeft het leerlingrapport aan welk referentieniveau Lezen de leerling beheerst?
|
ja/nee
|
LR4
|
Geeft het leerlingrapport aan welk referentieniveau Taalverzorging de leerling beheerst?
|
ja/nee
|
LR5
|
Geeft het leerlingrapport aan welk referentieniveau Rekenen de leerling beheerst?
|
ja/nee
|
LR6
|
Bevat het leerlingrapport een deugdelijke toelichting bij het toetsadvies en de beheersing
van de referentieniveaus van de leerling die (ook) voor leerlingen, ouders, verzorgers,
voogden en afnemers begrijpelijk is?
|
ja/nee
|
LR7
|
Zijn de andere uit te geven rapporten naast het leerlingrapport, en/of niet verplichte
gegevens op het leerlingrapport, deugdelijk en helder voor de beoogde gebruiker?
|
ja/nee/n.v.t.
|
Toelichting LR1: De toetsaanbieder geeft één of meerdere (model)rapportages ter beoordeling. Wanneer
er meer dan één variant van het leerlingrapport bestaat, moeten al deze varianten
aangeboden worden, met een uitleg wanneer welke variant wordt gebruikt. Aangezien
alle varianten aan de eisen moeten voldoen, worden alle voorbeeldrapporten beoordeeld
op de kwaliteitseisen LR2 tot en met LR6. Mochten er rapporten ontbreken (d.w.z. LR1
= nee), dan krijgt de toetsaanbieder een onvoldoende voor ‘leerlingrapport’. Wanneer
het leerlingrapport wel wordt aangeboden, worden de kwaliteitseisen LR2 tot en met
LR6 beoordeeld op basis van die versie(s) van het leerlingrapport.
Toelichting LR2: De toetsaanbieder dient in het leerlingrapport een toetsadvies te geven. De aanbieder
hanteert hierbij de door de Rijksoverheid vastgestelde toetsadviescategorieën. Dit
toetsadvies is gebaseerd op in ieder geval de resultaten van de wettelijk verplichte
(sub)domeinen Lezen, Taalverzorging en Rekenen. Aanvullend mag de toetsaanbieder in
de bepaling van het toetsadvies ook één of meerdere van de optionele (sub)domeinen
van Nederlandse taal meenemen die in dit kader in Hoofdstuk 3 beschreven zijn. In
de wetenschappelijke verantwoording moet zijn aangegeven op basis van metingen van
welke (sub)domeinen het toetsadvies tot stand is gekomen.
Toelichting LR3: In het leerlingrapport moet aangegeven zijn op welk referentieniveau de leerling
gepresteerd heeft op het domein Lezen. In het leerlingrapport moet in ieder geval
aangegeven worden in welk van de volgende drie categorieën de leerlingprestatie past:
onder niveau 1F, op niveau 1F, of op streefniveau 2F. Hoewel in de theorie de categorieën
elkaar niet uitsluiten, en de leerling ook op een hoger niveau zou kunnen presteren
dan het maximaal gegeven niveau, is in deze regeling vastgesteld dat in de rapportage
een leerlingprestatie in één (niet meer en niet minder) van deze drie categorieën
geclassificeerd wordt.
Toelichting LR4: In het leerlingrapport moet aangegeven zijn op welk referentieniveau de leerling
gepresteerd heeft op het subdomein Taalverzorging. In het leerlingrapport moet in
ieder geval aangegeven worden in welk van de volgende drie categorieën de leerlingprestatie
past: onder niveau 1F, op niveau 1F, of op streefniveau 2F. Hoewel in de theorie de
categorieën elkaar niet uitsluiten, en de leerling ook op een hoger niveau zou kunnen
presteren dan het maximaal gegeven niveau, is in deze regeling vastgesteld dat in
de rapportage een leerlingprestatie in één (niet meer en niet minder) van deze drie
categorieën geclassificeerd wordt.
Toelichting LR5: In het leerlingrapport moet aangegeven zijn op welk referentieniveau de leerling
gepresteerd heeft op het terrein Rekenen. In het leerlingrapport moet in ieder geval
aangegeven worden in welk van de volgende drie categorieën de leerlingprestatie past:
onder niveau 1F, op niveau 1F, of op streefniveau 1S. Hoewel in de theorie de categorieën
elkaar niet uitsluiten, en de leerling ook op een hoger niveau zou kunnen presteren
dan het maximaal gegeven niveau, is in deze regeling vastgesteld dat in de rapportage
een leerlingprestatie in één (niet meer en niet minder) van deze drie categorieën
geclassificeerd wordt.
Toelichting LR6: Bij het rapport dient een toegankelijke toelichting te worden geboden, waarin begrijpelijke
handvatten gegeven worden voor de interpretatie van het toetsadvies en de beheersing
van de referentieniveaus van de leerling door diverse betrokkenen. De aanbieder toont
aan op welke wijze de rapportage rekening houdt met de verschillende doelgroepen,
te weten leerlingen, ouders, verzorgers, voogden en afnemers.
Toelichting LR7: De toetsaanbieder geeft één of meerdere (model)rapportages zoals bijvoorbeeld een
groepsrapportage, schoolrapportage of bovenschoolse rapportage ter beoordeling. Bij
de uitgegeven rapporten dient een toegankelijke toelichting te worden geboden aan
de beoogde gebruiker, waarin begrijpelijke handvatten gegeven worden voor de interpretatie
van gerapporteerde gegevens. De aanbieder toont aan op welke wijze de rapportage rekening
houdt met de verschillende doelgroepen, te weten leerkrachten, intern begeleiders,
en directeuren of vertegenwoordigers van schoolbesturen of samenwerkingsverbanden.
4.2. Leerlingen
De doorstroomtoets is geschikt voor alle leerlingen, ook voor leerlingen met een specifieke
ondersteuningsbehoefte, met uitzondering van leerlingen die onder de ontheffingsgronden vallen.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA te worden beantwoord. In de toelichting wordt bij enkele kwaliteitseisen aangegeven
waar een doorverwijzing naar een andere doorstroomtoets voldoende kan zijn.
Code
|
Vragen
|
Mogelijke
antwoorden
|
LL1
|
Kunnen alle leerlingen, ook met specifieke ondersteuningsbehoeften (uitgezonderd leerlingen
die vallen onder de ontheffingsgronden), deelnemen aan de toets?
|
ja/nee
|
LL1.a
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor leerlingen
met een visuele beperking, zoals leerlingen die slechtziend, blind of kleurenblind
zijn?
|
ja/nee
|
LL1.b
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor dove/slechthorende
leerlingen?
|
ja/nee
|
LL1.c
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor leerlingen
met een taalontwikkelingsstoornis (TOS)?
|
ja/nee
|
LL1.d
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor leerlingen
met dyslexie?
|
ja/nee
|
LL1.e
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor leerlingen
met ernstige rekenproblemen of dyscalculie?
|
ja/nee
|
LL1.f
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor leerlingen
met een motorische beperking?
|
ja/nee
|
LL1.g
|
Is de toets aantoonbaar geschikt, al dan niet door extra ondersteuning, voor leerlingen
met ondersteuningsbehoeften voortkomend uit chronische/langdurige ziekte, een psychische
aandoening en/of gedragsproblemen of voortkomend uit hier niet nader gespecificeerde
beperkingen?
|
ja/nee
|
LL2
|
Staat in de handleiding voor de afnemer bij de toets in volledigheid beschreven op
welke wijze de toets rekening houdt met leerlingen met ondersteuningsbehoeften?
|
ja/nee
|
LL2.a
|
Staat omschreven welke hulpmiddelen zijn te gebruiken tijdens de toetsafname?
|
ja/nee
|
LL2.b
|
Staat omschreven welke aanpassingen in de afnamecondities mogelijk zijn?
|
ja/nee
|
LL2.c
|
Is de toets plaatsonafhankelijk af te nemen?
|
ja/nee
|
LL2.d
|
Wordt beschreven wat de mogelijkheden zijn als de geboden ondersteuning niet toereikend
is?
|
ja/nee
|
Toelichting LL1: Er is aantoonbaar aandacht besteed aan alle in LL1.a t/m LL1.g genoemde doelgroepen
en hun ondersteuningsbehoeften. Dit houdt het volgende in:
-
○ De aanbieder neemt bij het maken van de toets zoveel mogelijk elementen op die zorgen
dat de toets voor alle leerlingen (digitaal) toegankelijk is. Bij de itemconstructie
wordt generiek minstens op de volgende wijze rekening gehouden met (digitale) toegankelijkheid:
richtlijnen voor kleurgebruik en contrast bij items, richtlijnen met betrekking tot
een ondubbelzinnige lay-out en tekstuele vormgeving, richtlijnen met betrekking tot
figuurlijk taalgebruik (als dat geen toetsdoel is) en richtlijnen met betrekking tot
het gebruik van ik, gebiedende wijs en vraagzinnen.
-
○ De toets is plaatsonafhankelijk te maken. Afname van de toets kan ook plaatsvinden
buiten de schoolomgeving, zoals in het ziekenhuis, dagbehandeling of thuis.
-
○ De toets kent geen tijdslimiet en het is mogelijk om pauzes te nemen.
-
○ °e toets voorziet in een voorleesfunctie. De wijze waarop kan per toets(soort) verschillen.
Waar de bovengenoemde standaard onvoldoende tegemoet komt aan de doelgroepen genoemd
onder LL1.a t/m LL1.g is aantoonbaar geprobeerd de belemmeringen die deze leerlingen
ervaren bij het maken van de toets weg te nemen door de mogelijkheid tot inzet van
hulpmiddelen of ondersteuning, aanpassing van de afnamecondities of door het aanbieden
van aangepaste versies.
De aanbieder licht in de handleiding voor de afnemer toe voor welke leerlingen de
toets wel en/of niet toegankelijk is. Wanneer de toets niet toegankelijk is voor bepaalde
groepen leerlingen geeft de aanbieder aan waarom dit het geval is en welke onderdelen
het betreft.
Toelichting LL1.a: De toets wordt door de aanbieder (op bestelling) geleverd in een format dat zich leent
voor de hulpmiddelen die door leerlingen met een visuele beperking worden gebruikt
en met inachtneming van de toetseisen inhoudelijk geschikt zijn gemaakt voor de leerlingen
met een visuele beperking. De toetsaanbieder specificeert dit per type visuele beperking
(kleurenblind, slechtziend, blind).
Leerlingen die kleurenblind zijn. Bij de constructie van de toets is rekening gehouden met leerlingen die kleurenblind
zijn. Dit kan onder andere door kleurgebruik alleen ondersteunend te laten zijn. Daarnaast
is er bijvoorbeeld de mogelijkheid tot het aanbieden van een zwart/wit-variant. Relevant
voor bij de normering is dat waar het ontbreken van een kleuren(afbeelding) invloed
op de moeilijkheid van het item kan hebben, er dit aangegeven dient te worden, bijvoorbeeld
door middel van een andere itemidentificatie dan de opgave waar deze op gebaseerd
is.
Bij twijfel mag de leerling gebruik maken van de volgende procedure: voor kleurenblinde
leerlingen kan een opzoekhulp worden ingezet die op verzoek van de leerling de kleur
van een door de leerling aangewezen vlakdeel benoemt, of een door de leerling aangewezen
kleur aanwijst in toets of hulpmiddel.
(Zeer) slechtziende en blinde leerlingen
Aanbieders houden bij het maken van de toets rekening met (digitale) toegankelijkheid
voor leerlingen met een visuele beperking, middels bijvoorbeeld contrast, mogelijkheid
tot inzoomen en mogelijkheid tot het gebruik van hulpmiddelen, waaronder audio-ondersteuning.
Een aanbieder kan voor(zeer) slechtziende en blinde leerlingen aanvullende aanpassingen
voor de toegankelijkheid van hun toets aan te bieden. Bijvoorbeeld door gebruik te
maken van digitale brailleleesregels, tekenboeken of het aanbieden van een braillevariant.
Het uitgangspunt is dat zo min mogelijk wordt afgeweken van de reguliere toetsen.
Daar waar gekozen wordt om de toets aan te passen, verantwoordt de aanbieder deze
aanpassingen.
Het aanbieden van een brailleversie van de doorstroomtoets is facultatief. Wel moeten
toetsaanbieders leerlingen met die behoefte in de verantwoordingsdocumenten en handleiding
voor de afnemer doorverwijzen naar www.rijksoverheid.nl voor een toets van een aanbieder
die voorziet in die behoefte.
Afwijkende beoordeling calamiteitentoets: Van de calamiteitentoets moet een versie
beschikbaar zijn in braille, in zwart-wit en voorzien zijn van een vorm van audio-ondersteuning
om te voldoen aan LL1.a.
Toelichting LL1.b: De aanbieder levert bijvoorbeeld (op bestelling) een aangepaste toets indien de
toets gebruikmaakt van functioneel geluid (zoals bijvoorbeeld bij dictee-opgaven).
Indien een aanbieder hier niet in kan voorzien, dient deze de school in de verantwoordingsdocumenten
en handleiding voor de afnemer te verwijzen naar www.rijksoverheid.nl waar is aangegeven
welke toets van weke aanbieder voorziet in die behoefte.
Toelichting LL1.c: De aanbieder geeft aan hoe rekening is gehouden met leerlingen met een taalontwikkelingsstoornis
(TOS). Hierbij kan gedacht worden aan de mogelijkheid tot het inzetten van de voorleesfunctie
en mogelijke aanpassingen in de afnamecondities, zoals het werken met een afdekblad
en het markeren van tekst.
Toelichting LL1.d: De aanbieder geeft aan hoe bij de lay-out en typografie met deze doelgroep rekening
wordt gehouden. Denk hierbij bijvoorbeeld aan een schreefloos lettertype met minimale
puntgrootte 12, afstand tussen letters, woorden, regels en alinea’s, gebruik van witruimte
en een eenduidige, rustige lay-out.
Als een leerling door dyslexie moeite heeft met het lezen van teksten op papier of
beeldscherm, moet de leerling gebruik kunnen maken van een door de aanbieder geleverde
voorleesfunctie. De wijze waarop kan per toets(soort) verschillen.
Andere voorbeelden van hulpmiddelen ter ondersteuning van deze doelgroep zijn de beschikbaarheid
van een zoomfunctie en een markeerstift.
Toelichting bij LL1.e: Voor leerlingen met dyscalculie wordt geen aangepaste toets geleverd. In de afnamecondities
kan (bijvoorbeeld door in de planning meer pauzes of spreiding van de toetsmomenten
op te nemen) rekening worden gehouden met deze ondersteuningsbehoefte. De mogelijkheden
staan genoemd in de verantwoordingsdocumenten.
Toelichting bij LL1.f: De aanbieder beschrijft hoe de toets toegankelijk is gemaakt voor leerlingen met motorische
beperkingen. Er kan bij digitale toetsen bijvoorbeeld worden gedacht aan het bedienbaar
maken van functionaliteiten met het toetsenbord in plaats van de muis en bij schriftelijke
toetsen aan de mogelijkheid tot het typen van antwoorden op een antwoordblad.
Indien het voor een leerling desondanks niet mogelijk is de fysieke handelingen uit
te voeren die nodig zijn om de toets te maken, wordt in de handleiding beschreven
dat de leerling dan gebruik kan maken van een hulp ter ondersteuning, zoals een schrijfhulp,
die antwoorden noteert op aanwijzing van de leerling.
Afwijkende beoordeling calamiteitentoets: kwaliteitseis LL1.f is niet van toepassing
voor de calamiteitentoets.
Toelichting bij LL1.g: De aanbieder toont aan welke ondersteuning wordt geboden voor andere beperkingen
zoals hier genoemd. Voor bijvoorbeeld leerlingen met ondersteuningsbehoeften voortkomend
uit ziekte, psychische aandoeningen en/of gedragsproblemen geeft de aanbieder aan
welke aanpassingen mogelijk zijn in de wijze van afnemen en van welke hulpmiddelen
zij gebruik kunnen maken tijden de afname. De aanbieder benoemt daarbij expliciet
welke aanpassingen en hulpmiddelen voor deze doelgroepen extra aandacht behoeven,
waarbij gedacht kan worden aan het bieden van voldoende tijd, een prikkelarme werkomgeving
of individuele afname, extra structureren van wijze van afname en regels die daarbij
gelden.
Afwijkende beoordeling calamiteitentoets: kwaliteitseis LL1.g is niet van toepassing
voor de calamiteitentoets.
Toelichting LL2: De vorm van de ondersteuning staat beschreven in de handleiding, waaronder de wijze
waarop rekening gehouden wordt met doelgroepen in de itemconstructie, door het aanbod
van varianten van de toets, de beschikbaarheid van hulpmiddelen en/of via de afnamecondities.
De aanbieder schrijft voor dat bij alle toets(vorm)en alle onderdelen de hulpmiddelen
zijn toegestaan binnen de gegeven kaders van de vigerende regelingen. In de Toetswijzer
PO staat van een aantal hulpmiddelen voorgeschreven dat deze altijd zijn toegestaan
of wanneer al dan niet deze zijn toegestaan. Aanvullend kan een aanbieder andere hulpmiddelen
toestaan.
De aanbieder wijst de afnemer er in de handleiding op dat er geen tijdslimiet bestaat
en dat de afnemer zelf kan besluiten wat een passende afnameduur (spreiding van de
toetsonderdelen over de dag, pauzes e.d.) is bij leerlingen met ondersteuningsbehoeften.
Daarnaast wijst de aanbieder de afnemer op de mogelijkheid van de voorleesfunctie
voor alle leerlingen die op basis van hun ondersteuningsbehoefte gebruik van moeten
kunnen maken.
Toelichting LL2.a: Hulpmiddelen kunnen in twee categorieën opgesplitst worden. Enerzijds gaat het om
hulpmiddelen die al in de toets(omgeving) zijn opgenomen of ingebouwd. Anderzijds
gaat het om de mogelijkheid tot het inzetten van hulpmiddelen van de school of leerling
zelf. Bij deze tweede categorie is het belangrijk dat de toets toegankelijk is voor
deze hulpmiddelen. De aanbieder beschrijft beide categorieën in de handleiding voor
de afnemer.
Toelichting LL2.b: De aanbieder geeft aan welke aanpassingen in de afnamecondities mogelijk zijn en beschrijft
hier ten minste de mogelijkheden voor het bieden van voldoende tijd (langer dan de
gegeven tijdsindicatie), de inzet van pauzes en de mogelijkheid tot individuele afname.
Voor veel aanpassingen in de afnamecondities geldt dat deze voor alle leerlingen ingezet
zouden kunnen worden. Voor leerlingen met ondersteuningsbehoeften vragen deze afnamecondities
echter extra aandacht. De aanbieder beschrijft de mogelijke aanpassingen in de handleiding
voor de afnemer en wijst de afnemer erop dat de afnamecondities voor leerlingen met
ondersteuningsbehoeften extra aandacht vragen.
Toelichting LL2.c: Wanneer een leerling aantoonbaar niet in de gelegenheid is om de toets op school
te maken, kan de toets op een andere locatie worden afgenomen. Denk hierbij aan leerlingen
die in het ziekenhuis liggen, of thuiszittende leerlingen. De aanbieder beschrijft
in de handleiding welke (technische) randvoorwaarden hieraan verbonden zijn en hoe
de school afname op een andere locatie kan organiseren.
Toelichting LL2.d: De aanbieder toont aan wat er aan maatwerk mogelijk is indien het beschreven aanbod
aan hulpmiddelen, toetsvarianten en aanpassingen van afnamecondities niet toereikend
zijn voor een leerling met specifieke ondersteuningsbehoeften.
4.3. Afname doorstroomtoets
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
A1
|
Is er een mogelijkheid voor een tweede afnamemoment binnen de wettelijke gestelde
termijn voor leerlingen die bij de eerste afname zijn verhinderd (indien mogelijk
met een inhoudelijk en psychometrisch vergelijkbare alternatieve variant)?
|
ja/nee/n.v.t.
|
A2.1
|
Staat in het toetsreglement/de verantwoordingsdocumenten vermeld hoe de directeur
de leerlingen voor de toets moet aanmelden?
|
ja/nee
|
A2.2
|
Staat in het toetsreglement/de verantwoordingsdocumenten vermeld welke hulpmiddelen
leerlingen mogen gebruiken?
|
ja/nee
|
A2.3
|
Worden in het toetsreglement/de verantwoordingsdocumenten de voorwaarden aan de (wijze
van) geheimhouding van de toetsopgaven door de toetsaanbieder beschreven?
|
ja/nee
|
A2.4
|
Worden in het toetsreglement/de verantwoordingsdocumenten de voorwaarden aan de (wijze
van) geheimhouding van de toetsopgaven door de deelnemende scholen beschreven?
|
ja/nee
|
A2.5
|
Worden in het toetsreglement/de verantwoordingsdocumenten de voorwaarden aan de (wijze
van) waarop toezicht op de leerlingen wordt gehouden beschreven?
|
ja/nee
|
A2.6
|
Worden in het toetsreglement/de verantwoordingsdocumenten de eisen beschreven waar
de ICT omgeving (computerconfiguratie) op de school aan moet voldoen om de digitale
toets af te kunnen nemen?
|
ja/nee/n.v.t.
|
A3
|
Worden in het toetsreglement/de verantwoordingsdocumenten vermeld op welke wijze de
afnamecondities moeten bijdragen aan optimale prestaties van de leerlingen?
|
ja/nee
|
Toelichting A1:
In de verantwoordingsdocumenten en het toetsreglement is beschreven hoe leerlingen,
die bij de eerste afname waren verhinderd, alsnog bij een tweede afnamemoment binnen
de wettelijk gestelde termijn een doorstroomtoets kunnen maken. Indien mogelijk is
dit een inhoudelijk en psychometrisch vergelijkbare alternatieve doorstroomtoets.
Afwijkende beoordeling calamiteitentoets: kwaliteitseis A1 is niet van toepassing
voor de calamiteitentoets.
Toelichting A2.1 t/m A2.6:
In de verantwoordingsdocumenten voor de afnemer is de volgende informatie gegeven:
-
○ A2.1: Hoe dient de schooldirecteur (of andere verantwoordelijke) de leerlingen voor
de toets aan te melden?
-
○ A2.2: Welke hulpmiddelen mogen de leerlingen gebruiken?
-
○ A2.3: Welke voorwaarden worden er gesteld aan de (wijze van) geheimhouding van de
toetsopgaven door de toetsaanbieder? De toetsaanbieder dient in te gaan op de borging
dat er geen itemexposure van ongewenste omvang kan plaatsvinden.
-
○ A2.4: Welke voorwaarden worden er gesteld aan de (wijze van) geheimhouding van de
toetsopgaven door de schooldirecteur (of andere verantwoordelijke) en de afnemers?
-
○ A2.5: Welke voorwaarden zijn er verbonden aan de (wijze) waarop toezicht op de leerlingen
moet worden gehouden?
-
○ A2.6: Wat zijn de eisen waar de ICT omgeving (computerconfiguratie) op de school aan
moet voldoen om de digitale toets af te kunnen nemen?
Bij het evalueren van deze vragen kijkt de adviseur niet alleen of deze informatie
er is, maar ook of deze duidelijk is en geen tegenstrijdigheden bevat. Mocht achteraf
blijken dat in de praktijk de door de aanbieders verstrekte informatie en communicatie
dusdanig verwarrend en/of tegenstrijdig zijn dat dit een negatieve impact heeft op
de afname en/of de resultaten van de leerlingen, dan kan dit in de jaarlijkse evaluatie
van de toets een negatief oordeel opleveren.
Toelichting A3:
Worden in het toetsreglement/de verantwoordingsdocumenten vermeld op welke wijze de
afnamecondities moeten bijdragen aan optimale prestaties van de leerlingen? Denk aan
voldoende tijd om de toets te kunnen maken en een goede voorbereiding van leerlingen
op de afname van de toets.
4.4. Beveiligingsaspecten
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
RB1
|
Heeft de toetsaanbieder een toetsveiligheidsplan opgesteld met daarin opgenomen een
risicoanalyse en een PDCA cyclus voor het beschermen van de beschikbaarheid, integriteit
en vertrouwelijkheid van informatie (BIV)?
|
ja/nee
|
RB1.1
|
Zijn de functies en verantwoordelijkheden van de functionarissen van de toetsaanbieder
die betrokken zijn bij de inhoud en de beveiliging van de doorstroomtoets beschreven?
|
ja/nee
|
RB1.2
|
Hebben de functionarissen van de toetsaanbieder die betrokken zijn bij de inhoud en
de beveiliging van de doorstroomtoets aantoonbaar een geheimhoudingsverklaring ondertekend?
|
ja/nee
|
RB1.3
|
Beschermt de toetsaanbieder het toetsconstructieproces door middel van een PDCA cyclus
van beveiligingsprocedures, inclusief aantoonbare maatregelen ter voorkoming van het
voortijdig uitlekken van de toetsinhoud?
|
ja/nee
|
RB1.4
|
Is voor het toetsafnameproces een PDCA cyclus van beveiligingsmaatregelen geïmplementeerd,
inclusief aantoonbare maatregelen ter voorkoming van het voortijdig uitlekken van
de toetsinhoud?
|
ja/nee
|
RB1.5
|
Zijn de fysieke en elektronische locaties waar de toetsaanbieder examens, systemen
en materialen bewaart, aantoonbaar voldoende beveiligd?
|
ja/nee
|
RB1.6
|
Is de digitale en fysieke informatie omtrent de examenketen zowel tijdens opslag als
verzending aantoonbaar voldoende beveiligd?
|
ja/nee
|
RB1.7
|
Verzorgt de toetsaanbieder periodiek training over beveiligingsbewustheid aan haar
functionarissen die betrokken zijn bij de inhoud en de beveiliging van de doorstroomtoets?
|
ja/nee
|
RB2
|
Waarborgt de toetsaanbieder, met behulp van passende technische en organisatorische
beveiligingsmaatregelen, de privacy en persoonsgegevens van de afnemer, leerling en
ouder conform de Algemene Verordening Gegevensbescherming (AVG)?
|
ja/nee
|
RB3
|
Heeft de toetsaanbieder een gedegen en compleet actieplan voor het omgaan met diefstal
van (delen van) de toetsinhoud en voor het doen verwijderen van internetpagina’s die
(delen van) de toetsinhoud onthullen?
|
ja/nee
|
RB4
|
Heeft de toetsaanbieder een gedegen en compleet fraudepreventieplan opgesteld met
daarin opgenomen een PDCA cyclus voor de beveiliging van het toetsproces en de toetsinhoud?
|
ja/nee
|
RB4.1
|
Zijn er gedegen en complete procedures voor het ontdekken en evalueren van verdachte
toetsresultaten en wijzigingen in kenmerken van toetsonderdelen en toetsscores in
de loop van de tijd?
|
ja/nee
|
RB4.2
|
Controleert de toetsaanbieder regelmatig het internet en andere media op het bekend
raken van (delen) van de inhoud van de toets of andere niet-openbare informatie over
de doorstroomtoets?
|
ja/nee
|
RB5
|
Voorziet de toetsaanbieder in een terugvaloptie, die in geval van kleine incidenten
op leerling-, klas- of schoolniveau volgens een bijbehorend calamiteitenplan kan worden
ingezet?
|
ja/nee/n.v.t.
|
Toelichting RB1 t/m RB4.2:
Indien de aanbieder ISO 27001 is gecertificeerd, volstaat het om dit certificaat en
het achterliggende Information Security Management System (ISMS) inclusief een verklaring
van toepasbaarheid (c.q. de scope van het certificaat) aan te leveren. Indien voorgaande
wordt aangeleverd, zijn bovenstaande kwaliteitseisen voldoende verantwoord.
In alle andere situaties moet de aanbieder overzichtelijk per kwaliteitseis aangeven
hoe daar aan is voldaan. Een voorbeeld daarvan is de verwijzing naar een verwerkersovereenkomst,
waar op de kwaliteitseisen RB1 t/m RB4.2 wordt ingegaan. Daarbij dient bewijslast
te worden overlegd van de bij BI.2, BI.3 en BI.4 gevraagde documenten, processen,
contracten en protocollen.
De verantwoordelijkheid voor het goed gebruik van de toets en de daarmee verzamelde
informatie in de dagelijkse praktijk ligt bij de school / de eindgebruiker zelf.
Toelichting RB5: Het doel van de terugvaloptie is dat in het geval van een incident of onregelmatigheid
de toetsaanbieder tijdig een toetsversie beschikbaar heeft zodat de leerling toch
een doorstroomtoets van de initiële toetsaanbieder kan afnemen tijdens de afname-
of inhaalperiode.
De toetsaanbieder beschrijft in een bijbehorend calamiteitenplan de procedure ter
voorbereiding op incidenten en calamiteiten. Hierin dient in ieder geval vastgelegd
te worden:
-
○ Hoe de bij de calamiteiten aangeboden toetsversies van de doorstroomtoets eruitzien:
bijvoorbeeld een itembank waaruit kan worden gekozen voor verschillende digitale versies
of verschillende versies van een papieren toets. Ook dient het risico dat iteminhoud
openbaar komt te worden afgedekt.
-
○ Hoe scholen incidenten bij de toetsaanbieder kunnen melden en welke procedures klaarliggen
om hiermee om te gaan. En hoe eventuele incidenten intern beoordeeld worden.
-
○ De aanpak hoe er richting het onderwijsveld gecommuniceerd wordt over eventuele incidenten
(d.w.z. via welke kanalen en welke inhoud).
-
○ Dat de benodigde gegevensoverdracht wordt gerealiseerd in het geval dat de calamiteitentoets
wordt ingezet.
-
○ Hoe meldingen gearchiveerd worden, in het kader van evaluatie (en indien mogelijk
openbaarheid).
Toetsaanbieders zijn bovendien zelf verantwoordelijk voor het in de gaten houden van
signalen vanuit scholen, het onderwijsveld en sociale media dat hun doorstroomtoets
mogelijk niet aan de voorwaarden voor doorgang vinden voldoet.
Afwijkende beoordeling calamiteitentoets: kwaliteitseis RB5 is niet van toepassing
voor de calamiteitentoets.
5. Psychometrische aspecten
5.1. Inleiding
De toetsaanbieder dient nieuw geconstrueerde items te pretesten. Dit om de psychometrische
kwaliteit van de items te schatten, om van daaruit te kunnen bepalen welke items mogen
worden gebruikt bij de definitieve toetssamenstelling.
De psychometrische kwaliteitsbeoordeling van de doorstroomtoets door de adviseur in
opdracht van het CvTE bestaat uit de volgende stappen:
-
1. Pretestprocedure voor het valideren van nieuw geconstrueerde items, uit te voeren
door de toetsaanbieder en bestaande uit:
-
a. Steekproefkader en samenstelling steekproef (paragraaf 5.2.1);
-
b. Kalibratie en kwaliteit van items (paragraaf 5.2.2);
-
c. Toetssamenstelling na pretest (paragraaf 5.2.3).
-
2. Landelijke item gerelateerde (toetsoverstijgende) normering, uit te voeren door een
adviseur in opdracht van het CvTE, zoals beschreven in de separate Regeling Beoordelingsnormen Doorstroomtoetsen po, en bestaande uit:
-
a. Het door de toetsaanbieder aanleveren van de ruwe itemscores, waarna een adviseur
deze controleert en analyseert;
-
b. Kalibratie van de gezamenlijk ankeritems;
-
c. Vaststellen van cesuren van referentieniveaus en toetsadviezen;
-
d. Het door de toetsaanbieder vaststellen van de behaalde referentieniveaus en het toetsadvies
per leerling.
-
3. Beoordeling van de kwaliteit en het functioneren van de doorstroomtoets (rapportage
achteraf), bestaande uit:
In het geval van een MST, geldt dat voor wat betreft de psychometrische kwaliteitseisen
uit hoofdstuk 5 het CvTE per kwaliteitseis mag beoordelen of en welke van de eisen
voor een lineaire doorstroomtoets en/of en welke van de eisen voor een computergestuurde
adaptieve doorstroomtoets op itemniveau (CAT) van toepassing zijn.
De psychometrische kwaliteitsbeoordeling van de calamiteitentoets wijkt af van bovengenoemd
kader. De calamiteitentoets bevat geen items uit het gezamenlijk anker. Ook de normering
van de calamiteitentoets wijkt af van de reguliere normering. Dit is nader uitgewerkt
in het Handboek Normering.
5.2. Pretestprocedure
De pretestprocedure heeft tot doel om de bruikbaarheid van items te bepalen om vervolgens
vast te kunnen stellen welke items in aanmerking komen voor opname in de definitief
samen te stellen varianten van de doorstroomtoets.
De pretest kan op twee manieren worden uitgevoerd:
-
1. Scenario 1 (eerste afname van items los van de operationele afname):
De toetsaanbieder biedt scholen een vrijwillige proeftoets aan, waarin de nieuw geconstrueerde
items zijn opgenomen.
-
○ Doel A (basis-kwaliteitscontrole):
-
○ In de meeste gevallen zal het doel van de proeftoets zijn om de kwaliteit en werking
van de items in de praktijk te onderzoeken. Dit betreft zowel het – in een minder
high-stakes situatie – onderzoeken van de moeilijkheidsgraad en het onderscheidend
vermogen van de items, als het onderzoeken van de kwaliteit van de afleiders. Na de
proeftoets selecteert de toetsaanbieder de items die in aanmerking komen voor gebruik
in een operationele setting. De gegevens worden alleen gebruikt om items te selecteren.
Voor parameterschattingen na de afname voor de vaardigheidsschattingen ten behoeve
van het leerlingrapport worden deze data niet gebruikt. Voor dit eerste scenario gelden
minder stringente eisen voor de steekproefgrootte en het steekproefkader.
-
○ Doel B (additionele dataverzameling ten behoeve van itemparameterschattingen):
-
○ Het is ook mogelijk een pretest te gebruiken om data te verzamelen die wel gebruikt
wordt voor itemparameterschattingen ten behoeve van de vaardigheidsschattingen tijdens
de afname. Dat is vooral relevant wanneer de afname niet zo ingericht kan zijn dat
van te voren bepaald kan worden dat de opgaven door voldoende leerlingen gemaakt zullen worden. Bij een MST of een lineaire toets is dat vaak wel mogelijk,
echter bij een CAT kan dat lastiger zijn. Zeker extreme opgaven worden beperkt geselecteerd
door het algoritme. Ook als een CAT of MST relatief weinig respondenten heeft kunnen
er relatief veel opgaven zijn met minder dan 500-1.000 observaties. Als deze opgaven
bij een leerling in de afname zitten, dan moeten er ook voor deze opgaven voldoende
gegevens zijn om de parameters te kunnen schatten. Onder voorwaarden die beschreven
worden onder het steekproefkader kan de data van de pretest ook gebruikt worden om
bij de afname deze opgaven te schalen. Deze voorwaarden zijn strenger dan bij Doel
A. Het is ook mogelijk om doel B na te streven bij MST of lineaire toetsen, waarbij
dan ook de strengere voorwaarden gelden.
-
2. Scenario 2 (eerste afname binnen de operationele afname; zaaien, d.w.z.):
Opgaven uitproberen als onderdeel van een werkelijke afname waardoor de opgave in
dezelfde omstandigheden gemaakt wordt als waarin ze toegepast moeten worden: De toetsaanbieder
zaait de nieuwe items in de operationele versie van de doorstroomtoets. Wanneer uit
de pretestprocedure blijkt dat de nieuwe items bruikbaar zijn, mag de toetsaanbieder
deze direct mee laten tellen voor de berekening van het toetsadvies en/of de score
op de referentieniveaus. Voor een leerling mag het niet herkenbaar zijn of een vraag
wel of niet meetelt. Voor dit tweede scenario gelden strengere eisen voor het minimaal
vereiste aantal observaties. Als aan alle eisen voldaan wordt, maar alleen te weinig
observaties per opgave waargenomen worden, hoeft dit niet tot een onvoldoende beoordeling
te leiden: het is dan mogelijk de resultaten verkregen onder scenario 2 te gebruiken
voor doel A, een basis-kwaliteitscontrole, mits het aantal observaties minimaal gelijk
is als in dat geval vereist is.
Voor de berekening van het toetsadvies en de berekening van de score op de referentieniveaus
mag alleen gebruik gemaakt worden van gekalibreerde (pretest)items die onderwijskundig
en psychometrisch goed functioneren. Wanneer de toetsaanbieder er toch voor kiest
om minder goed functionerende items mee te laten tellen, dan dient de toetsaanbieder
dit te beargumenteren in de wetenschappelijke verantwoording van de doorstroomtoets.
De pretestprocedure bestaat in beide scenario’s uit drie stappen: 1) Steekproefkader
en samenstelling steekproef vaststellen (§ 5.2.1), 2) Kalibratie en kwaliteit van
items vaststellen met de verzamelde pretestdata (§ 5.2.2), en 3) Definitieve doorstroomtoets
samenstellen (§ 5.2.3).
5.2.1. Steekproefkader en samenstelling steekproef
De onderwijskundig positief beoordeelde nieuw geconstrueerde items worden gepretest
volgens de kwaliteitseisen voor het steekproefkader en de samenstelling van de steekproef.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
N1.1
|
Is de gebruikte steekproef van voldoende kwaliteit, gezien het doel van de pretest?
|
ja/nee
|
N1.1a
|
Is de steekproef groot genoeg?
|
ja/nee
|
N1.1b
|
Is de steekproef relevant?
|
ja/nee
|
N1.2
|
Heeft de pretest plaatsgevonden conform het intern of het gecombineerd dataverzamelingsdesign;
en is het dataverzamelingsdesign van de pretest adequaat?
|
ja/nee/n.v.t.
|
N1.3
|
Is, in het geval van open opgaven in een pretest, de beoordelaarsovereenstemming gegeven?
|
ja/nee/n.v.t.
|
Toelichting N1.1:
De beantwoording van deze vraag is afhankelijk van het doel van de steekproef. Hierboven
is al verwezen naar de twee scenario’s die van toepassing zijn. De vraag naar de kwaliteit
van de steekproef is verder opgedeeld naar de grote en de relevantie van de steekproef.
Er is automatisch voldaan aan kwaliteitseis N1.1, wanneer is voldaan aan de kwaliteitseisen
N1.1a en N1.1b.
Toelichting N1.1a:
Als onder scenario 1doel A wordt nagestreefd, het bepalen of een opgave van voldoende kwaliteit is om opgenomen
te mogen worden in de operationele doorstroomtoets, is het benodigde aantal leerlingen
beperkt. Uit een relatief beperkt aantal observaties valt immers te achterhalen of
een opgave goed genoeg functioneert om opgenomen te worden in de afname. De focus
moet hierbij vooral liggen op het onderscheidend vermogen van de opgave en de werking
van de afleiders in het geval van een meerkeuze-opgave. Om de kans te verkleinen dat
het onderscheidend vermogen bij de afname negatief blijkt te zijn is het verstandig
een redelijke ondergrens van de Rir-waarde of de geschatte a-parameter te kiezen.
De aanbieder is hier vrij in, maar dient wel aan te geven welk criterium gehanteerd
is (en waarom). In de situatie dat een bestaande itembank wordt uitgebreid c.q. wordt
ververst, wordt het aantal observaties als voldoende gezien wanneer iedere opgave
door minstens 200 leerlingen gemaakt is. In de situatie dat er een geheel nieuwe doorstroomtoets
wordt gemaakt, geldt een minimum van 400 leerlingen. Uiteraard geven meer gegevens
meer zekerheid.
Wanneer onder scenario 1doel B wordt nagestreefd, de additionele dataverzameling ten behoeve van itemparameterschattingen,
dan dient het aantal observaties hoger te zijn. Op het moment van itemkalibratie t.b.v.
de parameterschattingen voor de rapportage, geldt bij een 2PL itemresponsemodel een
minimum van 600 observaties (dezelfde aantallen als gespecificeerd staan onder scenario
2 hieronder).
Onder scenario 2 worden de opgaven voor het eerst afgenomen direct onder operationele afnameconditie.
Deze opgaven moeten van tevoren door de aanbieder zelf of het CvTE via een vroegtijdige
onderwijskundige beoordeling onderwijskundig als kwalitatief voldoende beoordeeld
zijn. Deze opgaven mogen zich noch onderwijskundig opzicht, noch in psychometrisch
opzicht van de andere opgaven in de toets onderscheiden. Omdat leerlingen er tijd
en moeite in steken is het terecht als deze items dan meetellen voor de rapportage.
In dat geval kunnen deze items tijdens de campagne bijgeschaald worden (doel B).
Wanneer onder scenario 2 doel A wordt nagestreefd, de basis-kwaliteitscontrole van
items, is het minimaal vereiste aantal observaties gelijk aan dat bij doel A van scenario
1 (een minimum van 200 leerlingen bij een bestaande itembank en een minimum van 400
leerlingen voor een geheel nieuwe doorstroomtoets).
Wanneer onder scenario 2 doel B wordt nagestreefd, en items mee tellen voor de terugrapportage
naar de leerling, moeten de itemparameters goed geschat worden. Daartoe moeten er
voldoende observaties per item zijn. Voor dichotoom gescoorde items geldt bij een
2PL itemresponsemodel een minimum van 600 observaties (dezelfde aantallen als gespecificeerd
staan onder scenario 1, doel B, hierboven). Aanbieders mogen van deze aantallen afwijken,
mits dit gedegen en volledig wordt onderbouwd.
Voor alle items die meetellen voor de rapportage dienen de bovengenoemde aantallen
behaald te worden. Bij opgaven die bijvoorbeeld in een CAT of MST te weinig door het
algoritme geselecteerd worden, worden de aantallen niet altijd tijdens de afname gehaald.
In die gevallen mogen de gegevens van de pretest ook gebruikt worden voor de kalibratie
om die itemparameters te schatten. De genoemde aantallen observaties per opgave kunnen
dan gehaald worden met de som van de pretest-observaties en de afname-observaties.
Houd er dan rekening mee dat dan ook aan andere steekproefeisen voldaan moet zijn
aangaande representativiteit.
Gekloonde opgaven zijn in beginsel nieuwe opgaven, en worden zo ook beoordeeld. Wanneer
er sprake is van (zeer) kleine wijzigingen, zoals de aanpassing van een munteenheid
(van euro naar dollar), of de aanpassing van een naam (bijvoorbeeld ten behoeve van
inclusie), waarbij de opgave inhoudelijk hetzelfde blijft, dan kunnen dergelijke items
als onveranderd gezien worden. De toetsaanbieder dient dan wel duidelijk aan te geven
welke (inhoudelijke) aanpassing gedaan is, bij voorkeur met een rationale waaruit
blijkt waarom de aanpassing geen impact heeft.
Wanneer de gekloonde opgave in termen van relevantie en/of objectiviteit verandert
ten opzichte van het originele item, dan is er wel sprake van een nieuwe opgave. Meer
specifiek is er sprake van een nieuwe opgave wanneer:
-
○ de gekloonde opgave een relatie heeft met een ander of gewijzigd leerdoel;
-
○ de gekloonde opgave naar verwachting een andere of gewijzigde moeilijkheidsgraad heeft;
-
○ de gekloonde opgave naar een ander of gewijzigd modelantwoord leidt.
Wanneer eerder al data verzameld zijn bij het item in een andere vorm dient ook bij
kleine wijzigingen het gekloonde item een nieuw label te krijgen.
Toelichting N1.1b:
De steekproef dient relevant te zijn voor de toepassing. Dit betekent dat de steekproef
van de pretest overeenkomstig dient te zijn met de verwachtte populatie die de toets
van de aanbieder regulier afneemt.
Voor scenario 2, het zaaien in de afname, is dat relatief makkelijk in te richten
door de zaai-items verstandig op scholen in te zetten. Deze steekproefprocedure dient
door de aanbieder beschreven te worden. Een ander voordeel bij scenario 2 is dat de
afnamecondities per definitie identiek zijn aan reguliere afnamecondities.
In het geval van scenario 1 dient een aparte steekproef getrokken te worden. De eisen
aan deze steekproef en de afnamecondities verschillen voor doel A en doel B bij dit
scenario. Onder doel A, de basis-kwaliteitscontrole, is het belangrijk dat de steekproef
lijkt op de toets-populatie. Hierbij dient rekening te worden gehouden met de variabelen
in onderstaande tabel. Minstens twee niveaus van iedere variabele moeten mee genomen
worden. Voor de variabele schoolweging geldt een ondergrens van drie niveaus. Als
scenario 1 doel B nagestreefd wordt, dan wordt verwacht dat de afname onder dezelfde
condities plaatsvindt als de reguliere afname, een high-stakes afname is hierbij wenselijk.
Er dient door de aanbieder beschreven te worden hoe dat zoveel mogelijk bereikt wordt.
Tevens dient aangetoond te worden dat de verdeling van de steekproef goed gelijkend
is aan de toets-populatie. Daarvoor mag de toets-populatie van het voorgaande afnamejaar
als referentie en steekproefkader gebruikt worden. Deze populatie en steekproef dienen
dan beschreven te worden op basis van de variabelen en niveaus zoals beschreven in
de onderstaande tabel.
Variabele
|
#N
|
Welke niveaus (NB: #N = aantal niveaus)
|
regio
|
4
|
noord, zuid, oost, west
|
stedelijkheid
|
2
|
verstedelijkt, landelijk1
|
schoolgrootte
|
3
|
aantal leerlingen: <100 , 100-300, >300 leerlingen
|
schoolweging
|
5
|
gewichtscategorieën: <23 / 23-26,99 / 27-32,99 / 33-36,99 / ≥ 37
|
1De mate van verstedelijking is terug te voeren op de bij het CBS gebruikelijke indeling
naar vijf niveaus, namelijk zeer sterk, sterk, matig, weinig en niet verstedelijkt.
De vijfdeling is hier teruggebracht naar een tweedeling in enerzijds verstedelijkt
(zeer sterk en sterk) en anderzijds landelijk (matig, weinig en niet verstedelijkt)
die in de praktijk goed lijkt te volstaan (c. f. van Boxtel en Hemker, 2009). De toetsaanbieder
kan ervoor kiezen om van deze indeling af te wijken, mits deze keuze is voldoende
onderbouwd.
Onder scenario 1 wordt een positief antwoord op deze vraag gegeven wanneer aan de volgende vijf voorwaarden
is voldaan:
-
1) Op alle in de tabel genoemde variabelen zitten er op minimaal twee niveaus per variabele
en op minimaal drie niveaus van de variabele schoolweging gegevens in de steekproef;
-
2) Er is aangegeven hoe de steekproef getrokken is;
-
3) Er is aangegeven onder welke omstandigheden de data verzameld zijn;
-
4) Er is aangegeven hoe de steekproef zich verhoudt tot de landelijke populatiewaarden
van leerlingen in groep 8 met betrekking tot de in de tabel genoemde niveaus per variabele;
-
5) Er is aangegeven of en hoeveel S(B)O scholen hebben mee gedaan.
Als drie (3) van deze omstandigheden afwijken van de werkelijke afname wordt aangegeven
welke impact verwacht wordt en hoe daar in de selectie van opgaven voor de operationele
afname rekening mee is gehouden.
Onder scenario 2 wordt een positief antwoord op deze vraag gegeven wanneer aan de volgende twee voorwaarden
is voldaan:
-
1) Er is aangetoond dat de populatie voor de zaai-items niet structureel anders is dan
de populatie(s) van de rest van de opgaven.
-
2) Bij de observaties is een steekproefkader gegeven (c.q. een design van hoe de toetsboekjes,
de CAT toetsversies en/of de MST toetspaden met zaai-items en ankeropgaven worden
ingezet) met een beschrijving van de procedure waarmee de steekproef van observaties
tot stand is gekomen.
Afwijkende beoordeling calamiteitentoets: De eis dat de steekproef van de pretest
overeen dient te komen met de populatie die de toets van de aanbieder regulier afneemt,
geldt niet voor de calamiteitentoets. Voor de calamiteitentoets is ‘leerlingen uit
groep 8’ de best passende operationalisering van de beoogde doelgroep.
Toelichting N1.2:
In Scenario 1 doel A, de basis-kwaliteitscontrole, is deze eis niet van toepassing,
omdat bij de normering de (definitieve) gebruikte parameters bepaald worden op basis
van de operationele afname. De kwaliteit van de pretest wordt dan alleen bepaald op
basis van N1.1.
Wanneer er sprake is van Scenario 2 of van Scenario 1, doel B is het van belang dat de parameters per (sub)domein op dezelfde schaal liggen. Hiervoor
is het van belang dat er sprake is van een afnamedesign waarbij dit mogelijk is. Wanneer
de pretest gedaan wordt door middel van ‘zaai-opgaven’ in de afname dan wordt aangeven
hoe dat ‘zaai-design’ er uitziet. Dit design is meegegeven in de technische verantwoording
van de pretest en bevat indien van toepassing in ieder geval informatie over:
-
○ het totaal aantal boekjes (‘booklets’);
-
○ aantal observaties per boekje;
-
○ het aantal items dat tussen de opgavenboekjes onderling overlapt;
-
○ het aantal items, en de kwaliteit van de items, dat de pretest verbindt met de bestaande
schaal.
Met behulp van deze informatie kan de aanbieder laten zien dat het plaatsen van de
itemparameters van alle opgaven op dezelfde schaal als waar de meting over gaat mogelijk
is, meestal door middel van een verbonden design.
Wanneer de pretestdata zijn verzameld met een CAT is het niet zinvol om het hele onvolledige
design weer te geven, omdat iedere leerling dan in principe een unieke verzameling
items maakt. Het dient wel duidelijk te zijn op welke gegevens de linking en normering
gebaseerd zijn. Bij een MST of een lineaire afname is het meeleveren van het design
wel zinvol.
In het geval van een CAT is, net als bij de andere toetsvormen, aangegeven hoeveel
zaai-items een kandidaat kan krijgen, en hoe die opgaven toegewezen worden.
Ook moet duidelijk zijn op welke posities de verschillende opgaven ingezet zijn, zodat
door de toetsaanbieder op gedegen en complete wijze beargumenteerd kan worden op welke
wijze er rekening is gehouden met vermoeidheids- en/of volgorde effecten.
Toelichting N1.3: De kwaliteit van de niet geautomatiseerd gescoorde open opgaven wordt ook beïnvloed
door de beoordelaarsovereenstemming. In de pretest moet er bij niet geautomatiseerd
gescoorde open opgaven daarom ook beoordelaarsovereenstemmingsonderzoek worden uitgevoerd.
De aanbieder toont aan dat de mate van overeenstemming tussen de experts resulteert
in een coëfficiënt voor beoordelaarsovereenstemming waarbij de proportie overeenstemming
representatief is voor een instrument voor belangrijke beslissingen (high-stakes instrument).
In het geval van doel A, de basis-kwaliteitscontrole, moet aangegeven worden op basis
van welk criterium items vanwege een lage beoordelaarsovereenstemming niet opgenomen
worden, en wanneer opgaven wel opgenomen kunnen worden. Bij doel B moet aangegeven
worden wat de impact is op de geschatte parameters.
5.2.2. Itemkalibratie en toetskwaliteit
Na het verzamelen van de observaties voert de toetsaanbieder een kalibratie uit met
de verzamelde testdata. In het geval dat opgaven al eerder zijn afgenomen (bij een
itembank of bij pretestgegevens) kan er een schaal gekalibreerd worden die op basis
van de afnamegegevens bestendigd moet worden. Op basis van de afnamegegevens kunnen
de (goed functionerende) zaai-items op de schaal geplaatst worden. Bij de beoordeling
wordt gekeken naar wat er in het verleden (vorige afname) gedaan is en wordt geëvalueerd
wat de plannen zijn voor bij de afname. Wanneer een aanbieder voor het eerst een afname
heeft, is de toelating voorlopig en kan deze na de eerste afname bevestigd worden
op basis van de resultaten bij deze afname, vergelijkbaar met hoe aanbieders met eerdere
afnames vooraf beoordeeld worden. In de kalibratie schat de toetsaanbieder de itemparameters,
zodat de kwaliteit van de gepreteste items kan worden vastgesteld.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
KA1
|
Zijn de nieuwe items psychometrisch gezien van voldoende kwaliteit?
|
ja/nee
|
KA2
|
Is er op gedegen en complete wijze beschreven dat de itemparameters van de geselecteerde
gekalibreerde items toepasbaar zijn?
|
ja/nee
|
KA3
|
Worden beslisregels voor adaptieve toetsen geëxpliciteerd?
|
ja/nee/n.v.t.
|
KA4
|
Is er een schatting gemaakt van de populatieparameters?
|
ja/nee
|
KA5
|
Zijn de metingen van de individuele leerlingen voldoende betrouwbaar om uitspraken
op individueel niveau te kunnen doen?
|
ja/nee
|
KA6
|
Past het psychometrisch model wat gebruikt wordt voor de toetssamenstelling bij de
data?
|
ja/nee
|
KA7
|
Is er een indicatie gegeven van het onderscheidend vermogen van de nieuwe items?
|
ja/nee
|
Toelichting KA1:
De toetsaanbieder schat van alle gepreteste items de moeilijkheidsgraad (p-waarde
of een vergelijkbare parameter), het discriminerend vermogen (Rir-waarde of vergelijkbare
parameters) en, in het geval van meerkeuzevragen de kwaliteit van de afleiders (a-waarde,
Rar-waarde of vergelijkbare waarden). De aanbieder dient te verantwoorden op basis
van welke criteria opgaven toegelaten worden voor de operationele afname.
De toetsaanbieder selecteert vervolgens de items die psychometrisch gezien van voldoende
kwaliteit zijn om te kunnen gebruiken in de samen te stellen doorstroomtoets. Dat
betekent dat de toetsaanbieder op gedegen en complete wijze onderbouwt dat de geselecteerde
items aan minimaal de volgende eisen voldoen:
-
○ de moeilijkheidsgraad is passend voor het meetdoel en de doelgroep (d.w.z. voor lineaire
toetsen vergelijkbaar met een p-waarde tussen de gokkans en 0.95 en voor adaptieve
toetsen passend bij de moeilijkheidsgraad van het betreffende design en/of toetspad);
-
○ het discriminerend vermogen is vergelijkbaar met een Rir-waarde > 0.15, rekening houdend
met de beperkte vaardigheidsrange van de leerlingen in het geval van een adaptieve
toets;
-
○ de kwaliteit van de afleiders is, in het geval van meerkeuzevragen, vergelijkbaar
met een a-waarde > 0.05;
-
○ de interbeoordelaarsovereenstemming, in het geval van open vragen, vergelijkbaar is
met een interbeoordelaarsovereenstemmingscoëfficiënt > 0.80.
De toetsaanbieder verantwoordt op gedegen en complete wijze de keuze voor de geselecteerde
items die in aanmerking komen voor de doorstroomtoets en waarom items die niet aan
deze eisen voldoen onder gegeven omstandigheden toch zijn mee genomen.
Toelichting KA2:
De toetsaanbieder beschrijft op gedegen en complete wijze dat de itemparameters van
de geselecteerde items toepasbaar zijn. Dit wordt gedaan door (1) aan te tonen dat
de itemparameters tussen verschillende afnamen en boekjes niet veranderen, en (2)
een DIF analyse (differential item functioning) op itemniveau uit te voeren op tenminste
de achtergrondvariabele stedelijkheid. Hierbij worden de itemparameterschattingen
uit de verschillende boekjes in de pretest vergeleken. Wanneer er sprake is van items
met DIF, dient de toetsaanbieder aan te tonen dat dit in overeenstemming is met de
verwachting op basis van de relevante literatuur. Het ontbreken van de genoemde DIF-analyse
en een gedegen uitleg kan resulteren in een onvoldoende voor deze kwaliteitseis.
Toelichting KA3 (alleen van toepassing voor adaptieve toetsen):
Een adaptieve toets is een toets die zich aanpast aan het individuele vaardigheidsniveau
van de persoon die de toets maakt. In plaats van alle deelnemers dezelfde set vragen
voor te leggen, past een adaptieve toets de complexiteit van de vragen aan op basis
van de correctheid van de eerdere antwoorden van de deelnemer. Het idee hierachter
is dat hierdoor een efficiënte schatting van het vaardigheidsniveau van de leerling
kan worden verkregen. Derhalve dienen van dit type doorstroomtoets de beslisregels
of de algoritmes voor de samenstelling van de toets te zijn geëxpliciteerd. Voor een
CAT dient de toetsaanbieder op gedegen en complete wijze te verantwoorden: (1) hoe
de toets wordt gestart, (2) hoe de keuze voor een volgend item en wordt gemaakt, en
(3) wanneer de toets wordt beëindigd (maximum aantal items en standard error). Voor
een MST dient de toetsaanbieder op gedegen en complete wijze te verantwoorden: (1)
hoe de toets wordt gestart, (2) hoe de keuze voor het volgende blokje wordt gemaakt
en (3) wanneer de toets wordt beëindigd. Naast dat de beslisregels voor de samenstelling
van de toets geëxpliciteerd dienen te zijn, is het belangrijk dat tevens beslisregels
geëxpliciteerd zijn om dekking van het inhoudelijke domein te waarborgen per individuele
afname. Dit houdt in dat indien er bijvoorbeeld vier verschillende domeinen van rekenen
worden bevraagd, de beslisregels van de adaptieve toets ervoor dienen te zorgen dat
ook uit alle domeinen voldoende opgaven worden afgenomen. Wanneer of de startprocedure
(CAT), of de selectieprocedure (CAT en MST) of de stopprocedure (CAT) niet op gedegen
en complete wijze is beschreven, kan dit resulteren in een onvoldoende voor deze kwaliteitseis.
Toelichting KA4:
De aanbieder van de toets dient informatie te verstrekken over de aannames die worden
gemaakt over het type verdeling (normaal of anders), evenals het gemiddelde, de standaardafwijking
en hun schattingsfout (standard error) op de vaardigheidsverdeling. Daarnaast moet
de toetsaanbieder verantwoorden hoe deze schattingen zijn verkregen en aangeven voor
welke populatie(s) deze parameters gelden. Deze gegevens dienen in ieder geval gegeven
te worden voor de leerlingpopulatie van het reguliere basisonderwijs.
Voor doorstroomtoetsen die eerder zijn afgenomen is deze schatting gebaseerd op de
daadwerkelijke populatievaardigheid van het voorgaande jaar. Bij een eerste afname
is dat niet mogelijk, en dient de toetsaanbieder diens verwachtingen aan te geven
zoals ook beschreven bij de jaarlijkse rapportage na de afname (zie hoofdstuk 5.4).
Toelichting KA5:
De meting van de vaardigheid van een leerling moet voldoende betrouwbaar zijn. Dit
betekent dat de schattingsfout (standard error) van iedere geschatte vaardigheid beperkt
is. Deze schattingsfout zal in de praktijk (waarschijnlijk) niet voor iedere leerling
even groot zijn. Daarom dient aangegeven te worden wat de verdeling van de schattingsfouten
is. Om de grootte van de schattingsfout op waarde te kunnen schatten zal de standaardafwijking
zoals deze gegeven wordt in KA4 als referentie dienen.
De eis van de minimale betrouwbaarheid (de manier om de schattingsfout van de persoonsparameters
in te schatten) wordt op drie manieren beoordeeld:
-
○ Is er een gedegen en complete beschrijving van de procedure, waaruit blijkt dat de
betrouwbaarheid op de juiste manier is berekend?
-
○ Is de hoogte van de betrouwbaarheid rond de cesuurpunten van de referentieniveaus
groter dan 0,70?
-
○ Is de hoogte van de betrouwbaarheid van de schaal waarop de toetsadviezen gegeven
worden minimaal 0,80?
Toelichting KA6:
Alle psychometrische modellen werken met aannames en voorwaarden waaraan voldaan moet
worden, wil het model bruikbaar zijn. Past het – voor de toetssamenstelling gebruikte
model – bij de data? Om dit aan te tonen dient de aanbieder gebruik te maken van bij
de data en het psychometrisch model passende passings- en robuustheidsmaten.
Toelichting KA7:
De aangeboden opgaven moeten voldoende onderscheidend zijn. In het geval van een adaptieve
toets met een itembank (CAT) zullen items met weinig onderscheidend vermogen zelden
of nooit aangeboden worden. Deze items vormen daarmee een overschatting van de vulling
van de bank in aantallen opgaven. In het geval van een lineaire toets of een MST,
is het onwenselijk dat een leerling tijd besteed aan opgaven met een extreem laag
gewicht.
Om een positief oordeel op deze kwaliteitseis te krijgen wordt aangetoond dat alle
opgaven een voldoende onderscheidend vermogen hebben. Dat kan door te laten zien dat
het onderscheidend vermogen van de opgaven in de bank of toets, aangetoond door de
a-parameter, niet kleiner is dan 10% van het gemiddelde onderscheidend vermogen van
de gezamenlijke ankeritems van de meest recent gekalibreerde jaarset.
5.2.3. Toetssamenstelling
Na afronding van de kalibratie van de nieuwe items, stelt de toetsaanbieder de definitieve
doorstroomtoets samen.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
T1
|
Bevat de doorstroomtoets voor de terreinen Nederlandse taal en Rekenen in ieder geval
vragen met een moeilijkheidsgraad tussen de cesuur van referentieniveau 1F en 2F/1S?
|
ja/nee
|
T2
|
Bevat de doorstroomtoets het door het CvTE voorgeschreven minimaal aantal gezamenlijke
ankeritems voor de wettelijk verplichte terreinen Nederlandse taal en Rekenen en is
de volledige subset van gezamenlijke ankeritems op de in de Regeling Beoordelingsnormen Doorstroomtoetsen po beschreven wijze opgenomen in de (varianten van de) doorstroomtoets?
|
ja/nee/n.v.t.
|
T3
|
Bestaat een papieren toets of een lineaire digitale toets jaarlijks vrijwel uit nieuwe
items voor de wettelijk verplichte terreinen Nederlandse taal (domein Lezen en subdomein
Taalverzorging) en Rekenen, met uitzondering van de items van het gezamenlijk anker?
|
ja/nee/n.v.t.
|
T4
|
Is er in het geval van een CAT of MST sprake van een adequate verversingsstrategie?
|
ja/nee/n.v.t.
|
T5
|
Heeft de itembank van een CAT een omvang van minimaal 6x het aantal items van een
maximale operationele toetsversie?
|
ja/nee/n.v.t.
|
Toelichting T1: Voor zowel een MST als papieren en digitale lineaire doorstroomtoetsen geldt dat de
toets voor de terreinen Nederlandse taal en Rekenen in ieder geval vragen moet bevatten
die inhoudelijk aansluiten bij de referentieniveaus 1F en 2F/1S en die een moeilijkheidsgraad
tussen de cesuur van referentieniveau 1F en 2F/1S hebben. In het geval van een CAT
is de itemselectie geoptimaliseerd rond de opeenvolgende vaardigheidsschattingen.
Toelichting T2: De door het CvTE toegewezen subset van gezamenlijke ankeritems is opgenomen in (de
varianten van) de doorstroomtoets. Eventuele (minimale) aanpassingen op deze items
t.o.v. het moederitem zijn alleen toegestaan met akkoord en na beoordeling van het
CvTE.
De door het CvTE toegewezen subset van gezamenlijke ankeritems moet op een zodanige
wijze over de toets worden verspreid, dat de positie in de toets zo min mogelijk invloed
op de prestatie van de leerling heeft en de ankeritems qua lay-out en tekstuele vormgeving
niet als opvallend afwijkend in de toets herkenbaar zijn, een en ander zoals gespecificeerd
in de Regeling Beoordelingsnormen Doorstroomtoetsen po en nader uitgewerkte (procedure)afspraken zoals opgenomen in het handboek gezamenlijk
anker. Omdat de vergelijkbaarheid van de ankeritems tussen verschillende toetsaanbieders
gewaarborgd moet worden, is het desondanks belangrijk dat de ankeritems nagenoeg onveranderd
in de toets worden opgenomen. Daarom dient de toetsaanbieder de voorgenomen veranderingen
aan de ankeritems uit te leggen en te rechtvaardigen.
Afwijkende beoordeling calamiteitentoets: kwaliteitseis T2 is niet van toepassing
voor de calamiteitentoets.
Toelichting T3 (alleen van toepassing voor lineaire toetsen): Een lineaire toets bestaat jaarlijks vrijwel volledig uit nieuwe gekalibreerde items
voor de wettelijk verplichte terreinen Nederlandse taal en Rekenen, met uitzondering
van de items van het gezamenlijk anker en een intern anker. Als een intern anker wordt
gebruikt moet de noodzakelijkheid ervan voldoende worden uitgelegd.
Afwijkende beoordeling calamiteitentoets: kwaliteitseis T3 is niet van toepassing
voor de calamiteitentoets.
Toelichting T4 (alleen van toepassing bij al eerder erkende of vastgestelde adaptieve
toetsen):
In het geval van een MST die bestaat uit meerdere lagen van modules (c.q. routes)
of in het geval van een CAT, moet er sprake zijn van een adequate verversingsstrategie.
De verversing moet op itemniveau gedocumenteerd zijn. Daarbij geldt het volgende:
-
a. De aanbieder hanteert jaarlijks een adequate verversingsstrategie voor de opgaven
van de itembank. De toetsaanbieder geeft op gedegen en complete wijze aan hoeveel
procent van de opgaven is ververst en onderbouwt dat de toegepaste vernieuwing voldoende
is om overmatige blootstelling van items te voorkomen (exposure control).
-
b. Items die uitgelekt lijken, moeten verwijderd worden. De toetsaanbieder geeft op gedegen
en complete wijze aan hoeveel items er vermoedelijk zijn uitgelekt en hoeveel van
deze items uit de itembank zijn verwijderd.
-
c. Voor items die over de jaren heen andere itemparameters hebben, moet de toetsaanbieder
op gedegen en complete wijze aangeven hoeveel items er veranderende itemparameters
hebben en hoeveel van deze items uit de itembank zijn verwijderd.
-
d. Voor items die in het vorige jaar door de algoritme niet geselecteerd zijn, geeft
de toetsaanbieder op gedegen en complete wijze aan, waarom deze niet of wel uit de
itembank zijn verwijderd.
De punten b en c kunnen onderzocht worden met een statistische toets voor DIF en/of
met een statistische toets voor Item Parameter Drift (IPD).
Afwijkende beoordeling calamiteitentoets: kwaliteitseis T4 is niet van toepassing
voor de calamiteitentoets.
5.3. Normering ten behoeve van leerlingrapportage
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
NR1
|
Is de gekozen normeringsmethode voldoende omschreven?
|
ja/nee
|
NR2
|
Zijn de gerapporteerde scores voldoende nauwkeurig?
|
ja/nee/n.v.t.
|
Toelichting NR1: Vanuit de landelijke normering worden aan alle aanbieders 2PL parameterschattingen
geleverd. Hoe past de toetsaanbieder deze toe bij diens normering? Zodra de gehanteerde
methode afwijkt van de landelijke normering zoals omschreven in de Regeling beoordelingsnormen doorstroomtoetsen PO (bijvoorbeeld een normering via een discrete (standaard)scoreschaal of verschillen
in de meegekalibreerde onderwijstypen), dient de toetsaanbieder de gehanteerde normering
te verklaren en deze te onderbouwen aan de hand van relevante literatuur.
Toelichting NR2: Indien de gekozen normeringsmethode verschilt van de landelijke normering zoals omschreven
in de Regeling beoordelingsnormen doorstroomtoetsen PO, dient de toetsaanbieder de nauwkeurigheid van de methode ten opzichte van een 2PL-vaardigheidsschatter
en de landelijk gehanteerde cesuurpunten van de toetsadviezen en referentieniveaus
via een tabel weer te geven (verwarringsmatrix) en verantwoordt mogelijk verschillen.
Ook dient de toetsaanbieder deze te duiden door middel van bijvoorbeeld de plus-minus
2 niveau-index (Pilliner 1969) of de marginal classification accuracy. De aanbieder
legt uit waarom voor een bepaalde statistische methode en de gehanteerde grenzen is
gekozen.
5.4. Gegevenslevering
Deze kwaliteitseisen zijn alleen van toepassing voor al eerder afgenomen toetsen.
De beoordeling van de kwaliteit en het functioneren van de calamiteitentoets vindt
alleen plaats nadat de operationele toets daadwerkelijk is ingezet. Het CvTE beslist
of de calamiteitentoets meedoet aan het Toelatings- en doorstroomonderzoek.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
GL1
|
Heeft de toetsaanbieder na de afname van de vorige doorstroomtoets alle benodigde
gegevens verstrekt ten behoeve van de landelijke normering?
|
ja/nee/n.v.t.
|
GL2
|
Heeft de toetsaanbieder na de afname van de vorige doorstroomtoets alle benodigde
gegevens verstrekt ten behoeve van toelatings- en doorstroomonderzoek?
|
ja/nee/n.v.t.
|
Toelichting GL1: De toetsaanbieder heeft na de afname van de vorige doorstroomtoets de (persoons)gegevens
verstrekt ten behoeve van de landelijke normering zoals uiteengezet in het handboek
normering. Tenminste zijn aangeleverd:
-
○ Leerlinggegevens (leerlingidentificatiecode, populatie specificering, schooltype en
schooladvies);
-
○ Scoringsgegevens (leerlingidentificatiecode, item label en item score);
-
○ Representativiteitsgegevens (aantal leerlingen met verschillende schooladviezen);
-
○ Controlegegevens (item label, naam (sub)domein, aantal observaties, p-waarde van het
item);
-
○ Optioneel: lijst van no-score items.
Toelichting GL2: De toetsaanbieder heeft na de afname van de vorige doorstroomtoets de (persoons)gegevens
verstrekt ten behoeve van toelatings- en doorstroomonderzoek zoals uiteengezet in
het handboek normering. Tenminste zijn aangeleverd per individuele leerling:
-
○ Pseudoniem;
-
○ Toetsscore;
-
○ Toetssoort;
-
○ Toetsadvies;
-
○ Afnamemodus van de doorstroomtoets;
-
○ Kalenderjaar van de doorstroomtoets;
-
○ Referentieniveaus;
-
○ Score op de gewogen latente vaardigheidsschaal;
-
○ Scores op de latente vaardigheidsschalen van de losse (sub)domeinen.
5.5. Kwaliteit en functioneren van de doorstroomtoets (rapportage achteraf)
De beoordeling van de kwaliteit en het functioneren van de calamiteitentoets vindt
alleen plaats nadat de operationele toets daadwerkelijk is ingezet. Het CvTE beslist
of de calamiteitentoets meedoet aan het Toelatings- en doorstroomonderzoek.
Kwaliteitseisen
Beslisregel: Om aan deze categorie kwaliteitseisen te voldoen, dienen alle vragen
met JA of N.V.T. te worden beantwoord.
Code
|
Vragen
|
Mogelijke
antwoorden
|
KF1
|
Verantwoordt de toetsaanbieder op een gedegen manier of en waarom opgaven met inhoudelijke
fouten, psychometrisch disfunctioneren, DIF of te weinig waarnemingen al dan niet
zijn meegenomen voor de scorerapportage?
|
ja/nee/n.v.t.
|
KF2
|
Zijn verschillen in percentage referentieniveaus voldoende verantwoord?
|
ja/nee/n.v.t.
|
KF3
|
Zijn verschillen in de verdeling van populatievaardigheden ten opzichte van de verantwoording
van het afgelopen jaar en de onderdelen onderling voldoende verantwoord?
|
ja/nee/n.v.t.
|
KF4
|
Zijn DIF-analyse-gegevens met betrekking tot parameters van de meest recente operationele
afname en de eerdere afname(n) aangeleverd en voldoende onderbouwd?
|
ja/nee/n.v.t.
|
KF5
|
Zijn afwijkingen van het landelijke gemiddelde in de relatie tussen toets- en schooladviezen
voldoende verantwoord?
|
ja/nee/n.v.t.
|
Deze kwaliteitseisen zijn alleen van toepassing voor al eerder afgenomen toetsen.
De toetsaanbieder verantwoordt jaarlijks na de toetsafname-periode de kwaliteit en
het functioneren van de afgenomen doorstroomtoets op basis van de boven genoemde vijf
kwaliteitscriteria. Er wordt beoordeeld of de inhoud van de informatie die door de
toetsaanbieder is aangeleverd voldoet aan de vooraf gestelde eisen. De resultaten
en de kwaliteit van de informatie van het voorafgaande jaar worden gebruikt bij de
beoordeling van de doorstroomtoets, dan wel de jaarlijkse her-evaluatie. Als er een
nieuwe aanbieder is die dit nog niet op kan leveren naar aanleiding van een vorige
afname, spelen deze eisen bij de eerste evaluatie geen rol, maar heeft het wel een
groter gewicht bij de jaarlijkse her-evaluatie die volgt na de eerste afname.
Toelichting KF1: De toetsaanbieder dient informatie te verstrekken over de aantallen opgaven per vaardigheid:
aantal wel en aantal niet meegenomen voor de scorerapportage naar de leerlingen wegens
(1) een inhoudelijke fout, (2) psychometrisch disfunctioneren, (3) DIF, (4) te weinig
waarnemingen (in tabelformaat). Wanneer er zaai-items ingezet worden kunnen deze in
een aparte tabel weergegeven worden. Het leveren van een lijst welk item dit betreft
wordt aangeraden. De aanbieder wordt gevraagd om de resultaten voldoende verantwoorden.
Toelichting KF2: De toetsaanbieder dient informatie te verstrekken over de percentages referentieniveaus
van de wettelijk verplichte en optionele (sub)domeinen van het terrein Nederlandse
taal (domein lezen en subdomein taalverzorging) en het terrein Rekenen plus een overzicht
van de percentages toetsadviezen (de zes categorieën) van dit jaar ten opzichte van
het vorige jaar (in tabelformaat). Eventuele verschillen tussen de beide jaren worden
door de toetsaanbieder verantwoord.
Toelichting KF3: De toetsaanbieder dient informatie te verstrekken over de verdeling van de populatievaardigheid
(gemiddelde en standaardafwijking) van in ieder geval het regulier basisonderwijs
inclusief de schattingsfout (standard error) op de vaardigheidsverdeling, op dezelfde
schaal als de itemparameters. De verdelingen worden door middel van histogrammen inzichtelijk
gemaakt. In deze informatie wordt onderscheid gemaakt tussen de verschillende onderwijstypen.
Eventuele verschillen ten opzichte van de verantwoording van het afgelopen jaar en
de landelijke normering in het afnamejaar worden door de toetsaanbieder verantwoord.
Verschillen tussen de onderdelen worden door de toetsaanbieder verklaard.
Toelichting KF4: Als opgaven al eerder zijn afgenomen (in een eerder jaar of bij pretest), dient de
toetsaanbieder informatie te verstrekken over DIF-analyse-gegevens met betrekking
tot parameters van de meest recente operationele afname en de eerdere afname(s) (in
tabelformaat), een en ander ter onderbouwing van de bij de kwaliteitseisen T4 en T4.1
beoordeelde verversingsstrategie van de aanbieder.
Toelichting KF5: De toetsaanbieder dient informatie te verstrekken over de relatie tussen de toetsadviezen
en de eerder gegeven (voorlopige) schooladviezen voor zover deze bekend zijn (in tabelformaat).
Als de relatie tussen toets- en schooladviezen sterk afwijkt van de landelijke gemiddelde
verdeling, dient de toetsaanbieder de reden van de afwijking voldoende te onderbouwen.