Een so’tje werkwoordspelling nakijken is simpel, zou je zeggen. De leerling schrijft ‘je vind’ en dan reken je dat fout en dan tel je de fouten bij elkaar op en dan verzin je een norm – laat ons zeggen twee fouten per punt – en dan rolt daar een cijfer uit, dat zo en zo vaak meetelt op het geheel. Je ziet al meteen allerlei subjectieve zaken opduiken: op grond waarvan bepaal je die norm bijvoorbeeld? Toch blijven de problemen helder en kan het niet zo ingewikkeld zijn om met de collega’s zo’n ‘norm’ af te spreken. De voordelen daarvan zijn evident: de leerlingen worden door alle docenten op dezelfde manier behandeld en dat is wel zo eerlijk. Bovendien is het niet mogelijk dat leerlingen docenten tegen elkaar gaan uitspelen. Immers, alle docenten hanteerden dezelfde norm en daarmee zijn alle deuren dichtgeknald.
De manier waarop je een so’tje beoordeelt zou je ‘analytisch’ kunnen noemen. Je benoemt heldere, objectief te beoordelen criteria en het geheel is vervolgens gelijk aan de som der delen. Maar er bestaat ook allerlei schoolwerk waarvoor zo’n analytische aanpak geen pas geeft. Zulk soort werk kun je niet analytisch beoordelen, hoogstens ‘holistisch’, zoals een recensent een boek recenseert en een aantal sterren uitdeelt. Ik heb het dan over werkstukken, presentaties en schrijfopdrachten.
Vaak wordt er voor dat soort opdrachten desondanks een formuliertje gebruikt, met een lange reeks beoordelingspunten en bijbehorende wegingsfactoren, bijna alsof het een so’tje werkwoordspelling is. Dit suggereert objectiviteit. Het idee is dan dat twee docenten onafhankelijk van elkaar tot hetzelfde oordeel over een schrijfproduct zullen komen als ze het formuliertje invullen. Je voelt meteen aan dat het zo niet werkt en dat twee docenten ondanks dat formuliertje flinke verschillen zullen laten zien in hun oordeel, of omgekeerd, op iets vergelijkbaars uitkomen op grond van een verschillend samengesteld oordeel.
Subjectiviteit is hier onvermijdelijk. Laat docenten zich daar alsjeblieft bij neerleggen en elkaar niet gaan lopen opzadelen met onzinnige administratie – die subjectiviteit kan wel enigszins bestreden worden door vergelijkend te gaan beoordelen. We kunnen beter onze energie steken in zaken die we meer in de hand hebben: de didactiek. Ik leg het allemaal uit.
Ik neem bij wijze van voorbeeld een schrijfopdracht die op tal van scholen, terecht, vaak uitgedeeld wordt: het betoog. Dit is een mooie, rijke en veelzijdige opdracht. Leerlingen moeten verifieerbare kennis verzamelen om iets te melden te hebben, ze krijgen oog voor het structureren van langere teksten, ze leren die zodanig vormgeven dat er een persuasief effect vanuit gaat, ze gaan wellicht beter snappen hoe zeer spelfouten afbreuk doen aan de overtuigende kracht en het stelt bijvoorbeeld zeer hoge eisen aan de kunst van het formuleren. Ik vergeet ongetwijfeld van alles. Een zeer complexe opdracht dus, waarvoor een analytische beoordeling op grond van een reeks criteria dan ook volstrekt ondenkbaar is – terwijl die criteria wel heel bruikbaar zijn als leermiddel! Zo’n criterium heeft namelijk een drietal eigenschappen die het ontdoen van alle objectiviteit: 1. de interpretatie, 2. de weging en 3. de samenhang, oftewel, de bijdrage aan het geheel.
Bij punt 1, ‘interpretatie’. Aan criteria als ‘het verband tussen de alinea’s is helder’, of ‘in het slot wordt ingespeeld op de emoties’ of ‘het tegenargument wordt overtuigend weerlegd’ hebben leerlingen heel veel. Die snappen zo hopelijk een stuk beter wat er van ze verwacht wordt. Maar als beoordelingspunten zijn ze niet bruikbaar, omdat ze geïnterpreteerd moeten worden: wat betekenen de woorden ‘helder’ en ‘overtuigend’? En dat er ingespeeld wordt op emoties kun je misschien min of meer objectief vaststellen. Maar wérkt het ook en in hoeverre dan precies?
Zelfs bij ogenschijnlijk harde, objectieve criteria zoals het aantal woorden of het aantal spelfouten komt interpretatie kijken, alhoewel de ruimte allicht niet zo groot is. Toch sta je al nakijkend vaak voor de gekste keuzes. Als een leerling allerlei spatiefouten maakt van het type ‘er aan’ of ‘deur bel’, uit hoe veel woorden bestaat de tekst dan? Ga je een fout tegen de werkwoordspelling even zwaar tellen als een spatiefout? Als een evidente tikfout? Neem anders de proef op de som: beoordeel een schrijfproduct op spelfouten en kijk of je collega op precies hetzelfde aantal uitkomt… Dan rijst vervolgens de vraag hoe zwaar je die fouten gaat aanrekenen en wat de invloed is op het geheel, waarover nu meer.
Bij punt 2, ‘weging’. Oké, we hebben overeenstemming bereikt over wat een spelfout is en wat niet, of, – zéér hypothetisch -, we hebben overeenstemming bereikt over de vraag of het argument in alinea vier overtuigend gepresenteerd is, dan is de volgende vraag hoe zwaar we dat laten meetellen. ‘Maar daarover kunnen we afspraken maken!’ Nu heb je me. Maar afspraken maken kan alleen bij min of meer objectief vast te stellen criteria. De meeste zijn helemaal niet objectief. Verder kom je met het volgende punt alsnog in de knoei.
Bij punt 3, ‘samenhang, de bijdrage aan het geheel’. Een betoog is als een ‘mobiel’ in de babykamer: geef er een tikje tegen en alles danst mee. Als in de inleiding van een betoog de centrale stelling niet helemaal duidelijk is, dan kan een compleet betoog in elkaar storten, omdat na de inleiding dan niet meteen duidelijk is of je een argument of een tegenargument zit te lezen. Een betoog kan keurig gestructureerd en gedocumenteerd zijn, maar zo houtenklazerig geformuleerd, dat de overtuigingskracht verkruimelt. Of omgekeerd, een betoog kan inhoudelijk en structureel vrij matig zijn, maar ja, de auteur gebruikt een paar geestige kwinkslagen en stijfliguren waarmee het geheel nog net blijft drijven. Soms hebben grote ingrepen kleine gevolgen en kleine ingrepen grote. Alles naar bevind van zaken. Geen twee teksten zijn hetzelfde. Wie dat bot negeert met een lijstje criteria, die snapt er niets van.
Fouten
Stel, je hebt je lijstje afgewerkt en je komt uit op een 7. Maar je hebt de spel- en de stijlfouten opgeteld en je je moet er een half punt vanaf halen. Je moet er een 6,5 voor geven. Vervolgens hou je het vel op armafstand bij vandaan en denk je, dit klopt niet, deze leerling moet gewoon die 7 krijgen. Ik vind dat die spelfouten niet zo zwaar meewegen in het geheel. Dit cijfer doet geen recht aan de prestatie. Dat kan getuigen van een heel verkeerde, bevooroordeelde blik, maar vaak is dat ook gewoon zo. De vraag was immers wat de rol van een aspect is in het geheel. Ik besprak het zo-even. Dus weet je wat? Ik geef er gewoon een 7,5 voor, dan kom ik alsnog uit op die 7!
Zo werkt het altijd: je gebruikt die criteria op een strategische manier. Je brengt ze altijd in overeenstemming met het oordeel dat je toch al had over een leerling. Dit is een van de mechanismen die tot fouten kunnen leiden. Ze liggen helaas sterk op de loer bij een ‘holistische’ manier van nakijken. Zo zijn er nog meer van dit soort fouten te bedenken. Alleen, een analytische manier anderzijds is onmogelijk en net zo bevooroordeeld en net zo oneerlijk. De analytische aanpak is uiteindelijk ‘window dressing’, buitenkant, schone schijn, doen alsof, veinzerij, suggestie. Holistisch nakijken doe je toch; je trekt het hoogstens een objectief lijkend joppertje aan in de vorm van een beoordelingsmodel.
Bestrijden
Het beoordelen van schrijfwerk, presentaties en werkstukken is welbeschouwd altijd oneerlijk. De oneerlijkheid kan aardig bestreden worden door ‘vergelijkend te beoordelen’ (vakterm: ‘comparative judgement’). Dit komt erop neer dat je altijd twee teksten paarsgewijs vergelijkt, veronderstellend dat je die keuze altijd kunt maken. Mensen kunnen namelijk veel beter een relatief oordeel vellen dan in een absoluut oordeel. Ga maar na: er staan vijf mensen in een kamer. Je hebt geen idee hoe lang iedereen is, maar wie de langste is, dat zie je meteen. Zo zou het ook kunnen werken met betogen nakijken. Je zou met je collega’s overeenstemming kunnen bereiken over de vraag welke teksten een bepaald cijfer waard zijn, waarna je die teksten als ‘ijkpunt’, als ‘anker’ gaat gebruiken, waartegen je alle nog te beoordelen teksten gaat afzetten.
Het gevaar van uitgespeeld worden tegen elkaar kan tegengegaan worden door bij voorbaat aan de leerlingen uit te leggen dat subjectiviteit onvermijdelijk is en dat het dus geen zin heeft om bij een collega om een ‘second opinion’ te vragen. Ook omdat het oordeel sterk afhangt van wat er bij een bepaalde docent in de les aan de orde geweest, een aspect dat ik nog niet besproken had.
Paradoxaal genoeg bestrijd je het tegen elkaar uitgespeeld worden veel beter door gewoon te accepteren dat betogen beoordelen subjectief is. Als je tegen leerlingen zegt, ik bepaal jullie cijfer en niet mijn collega, dan zitten de deuren stevig dicht. Als je zegt, wij hebben afspraken gemaakt en wij beoordelen jullie allemaal hetzelfde, dan hebben leerlingen het volste recht om hun licht op te steken bij de buren en dan begint het gedonder…
Didactiek
Overtuigd? Toch zou het niet eerlijk zijn om al je vertrouwen op het oordeelkundig vermogen van docenten te baseren, vanwege hun ongetwijfeld grote inhoudelijke capaciteiten, omdat er nog een tweede pijler moet zijn voor dat vertrouwen: de didactiek. Een beetje neerlandicus kan vast wel een goed betoog schrijven en dat van een ander adequaat beoordelen. Daarvoor heeft die tenslotte doorgeleerd. Maar kan die ook lesgeven? Een leerling beoordelen heeft wel twee kanten: een eindproduct, maar ook een weg daarnaartoe.
Heeft de docent op een heldere manier consequent formatief gehandeld, zodat de leerlingen telkens wisten of ze al dan niet op de goede weg waren? Heeft de docent de vorderingen van de leerlingen in het snotje gehad? Was de instructie in orde? Is er een uitgewerkt voorbeeld gepresenteerd? Was voor alle leerlingen duidelijk wat ze moesten doen voor een mooi cijfer? Konden álle leerlingen daartoe redelijkerwijs aan het einde van de rit in staat worden geacht? Konden de leerlingen terecht met vragen? En dan komen die ‘analytische’ criteria toch weer om de hoek fietsen; je moet je leerlingen toch houvast bieden. Maar als een soort ‘checklist’ voor een optelsommetje, nee. Dat slaat nergens op.