Academia.eduAcademia.edu

Wanneer heeft iemand iets geleerd?

2011

Wanneer heeft iemand iets geleerd? Dominique Sluijsmans en Desirée Joosten-ten Brinke Eén van de meest complexe uitdagingen waarvoor leraren en lerarenopleiders in hun onderwijspraktijk staan is de vraag wanneer leerlingen c.q. studenten daadwerkelijk hebben geleerd. Om te kunnen vaststellen wanneer iemand heeft geleerd, is kennis over beoordelingsprocessen en aanpalende leertheorieën essentieel. Deze kennis kan het beste beschreven worden aan de hand van de volgende vijf vragen: 1) Waarom wordt beoordeeld? 2) Wat wordt beoordeeld? 3) Hoe wordt beoordeeld? 4) Wie beoordeelt? en 5) Wanneer wordt beoordeeld? Alvorens de vijf vragen worden beantwoord, zal het begrip beoordelen beknopt worden gedefinieerd en geplaatst in een historische context. Wat is beoordelen en waar heeft het zijn oorsprong? Hofstee (1999) definieert beoordelen in zijn algemeenheid als ‘het geval waarin mensen, op gezag van anderen, de kwaliteit(en) van iets van iemand vaststellen’ (p. 14). Het formele beoordelen in de context van leren kent een lange geschiedenis. Al in de 19e eeuw was het de leraar die mondeling de voortgang van de lerende rapporteerde aan de ouders. Pas toen aan het einde van die eeuw de populatie van lerenden sterk toenam, begon men klassen te formeren op basis van leeftijd, het zogenaamde leerstofjaarklassensysteem. Er verschenen nieuwe methoden van beoordelen, zoals formele voortgangsrapportages. Leraren schreven op welke vaardigheden de lerenden al beheersten en welke nog ontwikkeld moesten worden. Deze vorm van beoordelen was de eerste vorm van een zogenaamd ‘narratief rapport’. Door de leerplichtwet rond de start van de twintigste eeuw groeide de lerende-populatie enorm, met als gevolg dat de onderwijsinhouden specifieker en de populatie van lerenden meer divers werden. Terwijl de lagere scholen nog de narratieve rapporten aanhielden om voortgang in leren te documenteren, werkten leraren in het voortgezet onderwijs al snel met percentages en cijfers. Deze manier van beoordelen die wij tot op de dag van vandaag nog gebruiken komt voort uit een industrieel onderwijsmodel, met kenmerken als klassikaal onderwijs, vakgericht lesgeven, aanbod- en methodegestuurde leerstof. Het heersende beoordelingsmodel betreft het ‘normgerichte beoordelen’, waarbij lerenden worden afgezet tegen een gemiddelde van de groep. Deze vaak gestandaardiseerde beoordelingen veronderstellen uniforme lerenden en het bestaan van een ‘gemiddelde leerling/student’: het niveau van de groep is bepalend voor het individuele resultaat. Waarom beoordelen? Inmiddels laat onderzoek zien dat een industrieel onderwijsmodel, waarbij wordt uitgegaan van het bestaan van een gemiddelde student of leerling, de aangeboren nieuwsgierigheid en motivatie om te leren kan belemmeren en wellicht ontoereikend is in de 21e eeuw (Bolocofsky & Mescher, 1984). Velen vinden dat het cijfersysteem te ver af staat van het echte leren en onderwijzen. Er komt meer aandacht voor een zogenaamd ‘organisch’ onderwijsmodel dat is gericht op het leerpotentieel van elke lerende (Boud, 2000). Kenmerken van dit model zijn differentiatie in werkvormen, leermiddelen en leerstof naar niveau, tempo, timing, belangstelling en een werkwijze die recht doet aan de unieke lerende (De Vries, 2007; Sluijsmans, 2008). Het sluit aan bij de ontwikkeling van zogenaamde assessments. Het woord ‘assessment’ is afgeleid van het Latijnse ‘assedere’ dat zoveel betekent als ‘naast iemand zitten’: samen met een lerende werken aan de ontwikkeling van kennis, vaardigheden en houdingen. De paradigmashift van een industriële naar een organische benadering van onderwijs vertaalt zich ook in de functies c.q. doelen van beoordelen, waarbij meer aandacht komt voor beoordelen in functie van leren. Daarbij wordt de balans gezocht tussen drie soorten functies: de summatieve functie: deze is gericht op het nemen van een beslissing over het niveau van de lerende met de bedoeling hierover aan anderen te rapporteren en/of verzamelde informatie te gebruiken voor de eigen beleidscyclus. Aan de hand van de verzamelde informatie worden uitspraken gedaan over de ontwikkeling van de lerende met het oog op de gestelde leerdoelen dan wel over zijn/haar positie ten opzichte van een referentiegroep. Deze functie heeft vaak betrekking op beslissingen over zakken of slagen, of over toelaten of selecteren. Deze functie past bij het productiemodel van onderwijs; de formatieve functie: deze is gericht op het verzamelen van informatie over de lerende tijdens het leerproces. Deze informatie wordt verzameld, vastgelegd en geïnterpreteerd met de bedoeling deze te gebruiken in het onderwijsleerproces zelf. Bij formatief beoordelen zijn criteria en standaarden het uitgangspunt voor het verzamelen van informatie. In een review van 250 studies komen Black & Wiliam (1998) tot de conclusie dat toetsen die in functie van leren staan resulteren in significante en substantiële leeropbrengsten. Hoewel alle lerenden hiervan profiteren, is de leerwinst voor laag presterende lerenden groter dan voor andere lerenden; de duurzame functie: deze is gericht op het zelf leren reguleren van het leerproces, waarbij voldoende ruimte is voor het zogenaamde ‘gedifferentieerd uitdagen’ (De Vries, 2007). Duurzaam beoordelen vereist een andere kijk op beoordelen omdat het vooral gericht is om leren in de toekomst te stimuleren dan puur vast te stellen of in het verleden en heden iets is geleerd. In dit perspectief past duurzaam beoordelen bij het idee van een leven lang leren. Omdat kennisgebieden in hoog tempo verouderen en werkwijzen en technieken voortdurend veranderen, is het belangrijk lerenden te leren hoe zij voortdurend nieuwe kennis en vaardigheden eigen kunnen maken. Wat beoordelen? Voorts is voor elke vorm van beoordelen inzicht nodig wat en op welk niveau wordt beoordeeld. Wat beoordeeld moet worden is afhankelijk van de doelen van het onderwijs (kennis, vaardigheden, attitudes, competenties). Deze doelen worden afgeleid van de gewenste vaardigheden in een beroep of bepaald kennisdomein (bijvoorbeeld rekenen, taal of geschiedenis) en worden geoperationaliseerd in beoordelingscriteria en standaarden. Het vaststellen van beoordelingscriteria en standaarden gebeurt veelal door een groep van experts. Criteria kunnen betrekking hebben op de cognitieve, affectieve of motorische aspecten van de te leren kennis (kent de lerende de betekenis?), vaardigheid (kan de lerende de kennis zinvol toepassen?), en/of op attitudeaspecten (houdt de lerende zich aan de juiste regels en procedures?). Een overzicht van beoordelingscriteria voorziet in een gedetailleerde beschrijving van de gewenste leeruitkomsten. Om vervolgens vast te stellen of een lerende iets heeft geleerd zijn goede beoordelingstaken essentieel waarbij leren en beoordelen worden geïntegreerd, omdat deze lerenden aanzetten tot het werken aan beoordelingscriteria die gericht zijn op beklijving van kennis, vaardigheden en houdingen. Beoordelingstaken kunnen de lerende in dit perspectief in vele vormen worden aangeboden zoals opdrachten, situaties, problemen of projecten. Om betrouwbaar vast te kunnen stellen wat de lerende heeft geleerd zijn vele, gevarieerde beoordelingsvormen nodig, afhankelijk van de kennis en vaardigheden (en onderliggende criteria en standaarden) die moeten worden gedemonstreerd (Sluijsmans, Straetmans, & Van Merriënboer, 2008). Hoe beoordelen? 2 Bij het beantwoorden van deze vraag hebben we te maken met drie aspecten: het beoordelingsmodel, het beoordelingsinstrument en het resultaat van de beoordeling en de feedback. Er zijn grofweg drie beoordelingsmodellen te onderscheiden. Aan elk boordelingsmodel liggen heldere criteria en standaarden ten grondslag. Het eerste model betreft het normgericht beoordelen, waarbij leerlingen worden afgezet tegen een gemiddelde van de groep. Dit resulteert in een zogenaamde Gausscurve (genoemd naar de Duitse wiskundige Friedrich Gauss). Deze vaak gestandaardiseerde beoordelingen veronderstellen uniforme leerlingen en het bestaan van een ‘gemiddelde leerling’. Het niveau van de normgroep is bepalend voor het individuele resultaat. Een tweede beoordelingsmodel is het criteriumgericht beoordelen, een model dat we zowel nationaal als internationaal vooral terug zien in het middelbaar en hoger beroepsonderwijs en gebaseerd is op competenties en kwalificaties. Leraren/lerarenopleiders vergelijken lerenden in deze benadering niet zozeer met de norm van de groep, maar beoordelen hen op een aantal beoordelingscriteria en bijbehorende standaarden. Bij beoordelen gericht op duurzaam leren waarbij het bevorderen van betrokkenheid van lerenden centraal staat past een ipsatief beoordelingsmodel. In dit model worden beoordelingen van lerenden niet zozeer vergeleken met het gemiddelde van hun klas of met vooraf vastgestelde criteria en standaarden, maar worden individuele beoordelingen die zijn aangepast aan het niveau van de lerende vergeleken in de tijd. Er is sprake van duurzaam beoordelen omdat criteria en standaarden flexibel kunnen worden aangepast en de beoordelingen zich niet meer beperken tot een momentopname. Onderzoek van Slavin (1980) laat zien dat een ipsatief beoordelingsmodel tot beter leren leidt dan een normgericht beoordelingsmodel. Om te beoordelen zijn verschillende instrumenten beschikbaar. De keuze voor een instrument wordt ingegeven door het doel en de visie die de leraar/lerarenopleider heeft met betrekking tot de beoordeling en praktische randvoorwaarden zoals organiseerbaarheid en tijd. Schriftelijk of computerondersteunde kennistoetsen met verschillende vraagvormen, mondelinge toetsen, performance assessments, peer assessments, self assessments, of portfolio assessments zijn veel voorkomende instrumenten. Het resultaat van beoordelen kan ook variëren. Beoordelingen kunnen gepresenteerd worden in de vorm van cijfers, categorieën, bewijzen van deelname, ingevulde beoordelingsschema’s (‘rubrics’), ontwikkelingsplannen of mondelinge besprekingen. Voor degene die wordt beoordeeld moet duidelijk zijn wat de betekenis van de beoordeling is. Naast de keuze van een geschikte beoordelingsvorm, is in elke vorm van beoordelen de feedback die lerenden van leraren(opleiders) ontvangen op basis van hun prestaties een cruciaal aspect. Feedback is het instrument waarmee de leraar/lerarenopleider verzamelde informatie over het leren van lerenden omzet naar zinvolle adviezen om het leren te verbeteren (Sadler, 1989). Deze leerbevorderende feedback is gericht op het verminderen van de verschillen tussen een huidig begrip en/of gedrag van de lerende en een gewenst resultaat (Sluijsmans, Weijzen, Castelijns & van de Ven, 2011). Beoordelen zonder het bieden van effectieve feedback helpt het leren en de zelfregulatie van lerenden niet verder (Hattie & Timperley, 2007; Nicol & Macfarlane-Dick, 2006). Uit onderzoek blijkt dat vooral de laag presterenden baat hebben bij gedifferentieerde, specifieke en geïndividualiseerde manieren van feedback op taken (Oren, 1983). Onderzoek toont tevens aan dat de feedbackvaardigheid van de leerkracht één van de belangrijkste factoren is voor succesvol onderwijs (Hattie, 2008). Nu communiceren leraren/lerarenopleiders nog vaak alleen het resultaat van een beoordeling (‘Knowledge of Results’; voldoende, cijfer, geslaagd, goed gedaan), waardoor de lerende geen handvatten worden geboden voor verdere ontwikkeling. 3 Feedback is gericht op het beantwoorden van de volgende drie vragen: Waar gaat de lerende naar toe (wat zijn de geselecteerde taken)? Dit kan worden benoemd als de feedup; Hoe heeft de lerende de taak uitgevoerd (welke vooruitgang wordt geboekt)? Dit kan worden benoemd als de feedback; Hoe gaat de lerende verder (welke aanpak is nodig om tot groei te komen)? Dit kan worden benoemd als de feedforward. Er zijn vervolgens vier feedbackniveaus te onderscheiden. Feedback op taakniveau is effectief wanneer sprake is van misinterpretatie van de taak, en dient om de lerende aanwijzingen te geven om tot een juiste interpretatie van de opdracht te komen. Feedback op procesniveau is effectief wanneer lerenden op zoek zijn naar een strategie om een bepaalde taak uit te voeren. Feedback op het niveau van zelfregulatie ondersteunt de lerende bij het vasthouden van de aandacht en inzet bij de uitoefening van de taak, bij het intern attribueren van succes en de positieve feedback van anderen en daarmee bij het vergroten van het zelfvertrouwen. Feedback die betrekking heeft op het persoonlijk niveau (complimenteren, prijzen) kan leiden tot het tot het vermijden van lastige taken en het minimaliseren van inzet. Hoewel deze vorm van feedback waardevol kan zijn ‘in-het-moment’ toont onderzoek aan dat dit niet tot verbeterde leereffecten leidt (zie ook Black & Wiliam, 1998). Wie beoordelen? In het beoordelingsproces kunnen verschillende personen betrokken zijn. Welke beoordelaars worden ingezet is afhankelijk van de benodigde deskundigheid. In formele onderwijssituaties is de docent wettelijk verantwoordelijk voor het beoordelen van de student. Ter bevordering van de betrouwbaarheid van beoordelingen is het noodzakelijk om meerdere beoordelaars in te zetten. Het werkveld speelt bij competentiegericht beoordelen een belangrijke rol om de prestaties van de lerende vanuit de praktijkvisie te beoordelen. De beoordelaar kan hierbij een leidinggevende in het beroep zijn, maar ook klanten of patiënten zijn mogelijk inzetbaar als beoordelaar. Omdat de lerende echter de enige is die zichzelf ‘meeneemt’ in het leertraject en zichzelf voortdurend kan ‘zien’ en ook de kennisbronnen en omgevingen zo wisselend zijn, zal hij in toenemende mate in staat moeten zijn leren te reguleren. Dit betekent dat hij een grotere betrokkenheid krijgt in het beoordelingsproces en het beoordelen samen met leraar/lerarenopleider vormgeeft. In de historie van het beoordelen is de lerende lange tijd niet als volwaardige partner beschouwd. Het beoordelen was vooral een zaak van partijen buiten de lerende. Opgelegde vormen van beoordelen belemmeren leren omdat het beoordelen niet toebehoort aan de lerende, maar iets is dat de lerende ondergaat (Boud, 2000). Onderzoek laat zien dat beoordelingen die uitsluitend gericht zijn op certificering en selectie negatief zijn voor leren, omdat ze lerenden belemmeren om verantwoordelijkheid te nemen zich te motiveren en te reguleren (Hattie & Timperley, 2007; Ryan & Deci, 2000). Beoordelen op deze wijze leidt tot ‘aangeleerde afhankelijkheid’ (Yorke, 2003). De laatste jaren is in wetenschappelijke publicaties sprake van een groeiende belangstelling voor de actieve rol van de lerende in het onderwijsleerproces door het inzetten van vormen van zelf- en peer beoordeling (Sluijsmans, Dochy, & Moerkerke, 1999). Het geven van controle aan lerenden over de wijze waarop ze worden beoordeeld, wanneer ze worden beoordeeld en door wie ze worden beoordeeld, kan leiden tot een actievere betrokkenheid en verantwoordelijkheid van lerenden. Dit kan vervolgens tot een hogere motivatie en tot meer leren leiden dan wanneer het beoordelen extern wordt aangestuurd (Wulf, Raupach, & Pfeiffer, 2005). Wanneer beoordelen? 4 Uit de voorafgaande antwoorden op de vragen blijkt dat beoordelen – afhankelijke van de functie (formatief, summatief of duurzaam) op verschillende momenten in het leerproces kan worden ingezet. Vanuit een summatief perspectief is beoordelen zinvol aan het begin van een leerpad (Is de lerende geschikt voor de opleiding? Wat is de voorkennis?), tijdens het leerproces (Boekt de lerende voldoende voortgang op de beoogde criteria en standaarden? Is de lerende klaar voor een volgend niveau?) en aan het einde van een leertraject (Wat wordt de vervolgopleiding? Is de lerende klaar voor het beroep?). Formatieve beoordelingen zijn vooral tijdens het leerproces van belang, omdat deze de lerende informatie bieden over zijn ontwikkeling en de volgende te nemen stap. Bij duurzaam beoordelen vallen leren en beoordelen als het ware samen en is sprake van een continu beoordelings- c.q. leerproces. Bij duurzaam beoordelen wordt in alle fasen van het leerproces beoordelingsinformatie verzameld die de lerende vooral ondersteunt in het zelf leren reguleren van zijn leren. Van groot belang is dat op het niveau van de school en de lerarenopleiding een mix van beoordelingsvormen aan bod komt, waarmee de kwaliteit van het toetsprogramma wordt geborgd. Vragen die daarbij gesteld kunnen worden zijn: Is er voldoende informatie verzameld over de lerende op basis waarvan op een betrouwbare en valide wijze kan worden gesteld dat er is geleerd? Heeft de lerende voldoende laten zien dat hij of zij ook na het verlaten van de school of opleiding het leerproces kan reguleren? Passen de beoordelingsvormen van de lerarenopleiding bij de toekomstige beroepspraktijk? Zijn leraren(opleiders) voldoende onderlegd in kennis en kunde over beoordelen? In dit opzicht biedt Baartman en anderen (2006) een waardevol kader waarmee de kwaliteit van beoordelen op programmaniveau kan worden geanalyseerd om vanuit die analyse te komen tot een verantwoord beoordelingsmodel binnen de school en lerarenopleiding. Tot slot Om goed te kunnen vaststellen of er is geleerd, is niet alleen een nauwe aansluiting tussen leren en beoordelen noodzakelijk (Biggs, 1996), maar vooral een heldere visie op het doel van beoordelen. Aangezien beoordelen al lang niet meer uitsluitend de functie heeft van selectie en certificering, maar steeds meer is gericht op het versterken van (lange termijn) leren kan en mag de theorie over beoordelen niet meer los staan van andere theorieën over (ontwerpen van) leerprocessen bij studenten en lerenden. Veel theorie in de kennisbasis van lerarenopleiders is dan ook van toepassing op de wijze van beoordelen: Hoe ga ik om met heterogeniteit in beoordelen? Hoe begeleid ik lerenden in het beoordelingsproces? Hoe vindt beoordelen in de beroepscontext plaats? Hoe kan ik het samenwerkend leren binnen beoordelen vormgeven? Hoe borg ik de kwaliteit van beoordelen? De kennisbasis over beoordelen is in dit opzicht interdisciplinair en nauwelijks te begrenzen. Literatuur Baartman, L. K. J., Bastiaens, Th. J., Kirschner, P. A., & Van der Vleuten, C. P. M. (2006). The wheel of competency assessment: Presenting quality criteria for competency assessment programmes. Studies in Educational Evaluation, 32, 153-177. Biggs, J. (1996). Enhancing teaching through constructive alignment. Higher Education, 32, 347-364. Black, P., & Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education, 5, 7-74. Bolocofsky, D. N., & Mescher, S. (1984). Student characteristics: Using student characteristics to develop effective grading practices. The Directive Teacher, 6, 11-23. Boud, D. (2000). Sustainable assessment: Rethinking assessment for the learning society. Studies in Continuing Education, 22, 151-167. 5 De Vries, B. (2007). Vrijheid, blijheid? Over vraaggestuurd leren en flexibele scholen. Nijmegen: Hogeschool Arnhem en Nijmegen. Hattie, J. (2008). Visible Learning. A synthesis of over 800 meta-analyses relating to achievement. Taylor & Francis. Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77, 81-112. Hofstee, W. K. B. (1999). Principes van beoordeling. Lisse: Swets & Zeitlinger B. V. Nicol, D. J., & Macfarlane-Dick, D. (2006). Formative assessment and self-regulated learning: A model and seven principles of good feedback practice. Studies in Higher Education, 31, 199-218. Oren, D. L. (1983). Evaluation systems and attributional tendencies in the classroom: A sociological approach. Journal of Educational Research, 76, 307-312. Ryan, R. M., & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55, 68-78. Sadler, R. D. (1989). Formative assessment and the design of instructional systems. Instructional Science, 18, 119-144. Slavin, R. E. (1980). Effects of individual learning expectations on student achievement. Journal of Educational Psychology, 72, 520-524. Sluijsmans, D. M. A. (2008). Betrokken bij beoordelen (lectorale rede). Nijmegen: Hogeschool van Arnhem en Nijmegen. Sluijsmans, D. M. A., Dochy, F., & Moerkerke, G. (1999). Creating a learning environment by using self- peer- and co-assessment. Learning Environments Research, 1, 293-319. Sluijsmans, D. M. A., Straetmans, G., & Van Merriënboer, J. (2008). Integrating authentic assessment with competency based learning: The protocol portfolio scoring. Journal of Vocational Education and Training, 159-172. Sluijsmans, D. M. A. , Weijzen, S., Castelijns, J., & van de Ven, H. (2011). Leerkrachtfeedback als motor voor zelfregulerend leren. In J. Castelijns, M. Segers, & K. Struyven (Eds), Evalueren om van te leren. Bussum: Coutinho. Wulf, G., Raupach, M., & Pfeiffer, F. (2005). Self-controlled observational practice enhances learning. Research Quarterly for Exercise and Sport, 76, 107-111. Yorke, M. (2003). Formative assessment in higher education: Moves towards theory and the enhancement of pedagogic practice. Higher Education, 45, 477-501. 6 View publication stats