Dette sier evalueringene om anonym retting

En rekke skoler skal nok en gang gjennom forsøk med anonym retting. Tidligere evalueringer viser at det fører til strengere karakterer og masse merarbeid.

Publisert

Oslo, Trøndelag og Agder vil alle innføre forsøk med anonym retting av elevbesvarelser. Målet er å finne ut om «trynefaktor» har noe å si for karakterene elevene får.

– Det sørger for at elevene får den karakteren de fortjener basert på hva de presterer og ikke hvem de er. Dette er derfor i mine øyne et potensielt stort steg mot en skole der innsats og kunnskap alltid skal veie tyngst, skrev Arina Aamir, bystyrerepresentant for Oslo Høyre etter at vedtaket om et prøveprosjekt ble gjort i fjor høst.

En rekke lærere og tillitsvalgte har protestert mot at lokalpolitikere nok en gang skal kjøre nye forsøk med anonym retting. 

Leder i Utdanningsforbundet Oslo, Marianne Lange Krogh, mener  at «trynefaktor» ikke er et faktisk problem.

– Det er ikke den anonyme metoden vi er imot, men pålegget om å gjøre det. Det blir merarbeid, og vi har allerede en anonym eksamen i dag, sa Lange Krogh da Oslo-forsøket ble omtalt i august

I debatten blir det ofte pekt på at lignende forsøk er prøvd ut en rekke ganger før uten at evalueringene har vist store forskjeller fra ordinær karaktersetting.

Så hva viser egentlig evalueringene av tidligere forsøk? 

Utdanningsnytt har fått fatt i flere av dem, og her er oversikten over hva som kommer fram der.

Oslo-forsøket i 2017-18

Forsøket omfattet alle videregående skoler i Oslo, og det var organisert i to modeller. 

  • Modell 1 innebar at skolene skulle organisere anonym vurdering internt på egen skole i ett eller flere fellesfag som norsk, engelsk og matematikk. Metodene for vurdering varierte. Noen faglærere vurderte sine egne elevers besvarelser anonymt, mens andre faglærere byttet besvarelser og vurderte andre elever enn sine egne.
  • Modell 2 innebar at enkelte skoler vurderte anonyme besvarelser fra andre skoler innenfor programfagene historie og filosofi, teknologi og forskningslære og treningslære.

Evalueringen besto av en rundspørring til elever og en til faglærerne. 

Svarprosenten blant elevene var kun 13 prosent (365 av 2721 elever svarte). 80 prosent av dem som svarte hadde deltatt i forsøket gjennom modell 1.

Dette svarte elevene:

71 faglærere svarte på rundspørringen, noe som utgjorde en langt høyere svarprosent på over 70 prosent. 

Dette svarte lærerne:

Utdanningsetaten konkluderer blant annet med at:

  • Et stort flertall av elevene svarer ja på at anonym retting er nyttig. I kommentarene til flere elever kommer det fram at selv om elevene opplever at de kan gå ned i karakter, vil de likevel ha anonym retting fordi de blir tryggere på hvilket nivå de ligger på faglig.
  • Et flertall av faglærerne svarer derimot nei på at de vil delta på anonym retting. Mange begrunner det med at det tar for mye tid, at anonym retting innebærer merarbeid fordi de må lese gjennom besvarelsene på nytt for å kunne gi elevene sine en god tilbakemelding. Tilbakemeldingene gitt av ekstern faglærer oppleves ikke som gode nok i forhold til den tilbakemeldingen de skal gi elevene sine. Noen lærere leser gjennom besvarelsen én gang til for å forsikre seg om at vurderingen er riktig. Flere lærere understreker at de allerede har et tolkningsfellesskap og derfor er anonym retting overflødig.

Her finner du hele evalueringen.

Oslo-piloten i 2024

Høsten 2024 ble det gjennomført anonym vurdering på noen skoler i forbindelse med felles heldagsprøver i norsk på 10.trinn og på VG3. 

Disse deltok: 

  • Bøler skole
  • Ellingsrud skole
  • Nordstrand ungdomsskole
  • Rommen skole
  • Hartvig Nissen videregående skole
  • Oslo Handelsgymnasium
  • Etterstad videregående skole
  • Ulsrud videregående skole

I februar 2025 ble det gjennomført et evalueringsmøte med skolene, og sammendraget fra det møtet viste blant annet:

  • Karakter 4 ble ofte justert ned til karakter 3, mens elever med karakter 5 og 6 beholdt vanligvis sine opprinnelige karakterer. Omtrent en tredjedel av elevene opplevde en nedgang i karakter.
  • Elevene syntes anonym vurdering var spennende, men opplevde det som strengt i etterkant. 
  • Det ble tatt opp at det var lærerikt å utveksle vurderingsbunker med kollegaer. Ved noen skoler er praktiserer man allerede et to-lærersystem, der begge lærerne vurderer besvarelser.
  • Skolene meldte at samordnet vurdering mellom faglærerne hadde betydning, da manglende samordning kunne føre til større variasjon i karaktersetting. Fagseksjonen ble enige om å lese tekster på tvers av trinn og begrunne vurderingene, og det ble observert store forskjeller mellom faglærere på enkelte besvarelser. 

  • Alle skolene meldte at anonym vurdering førte til merarbeid. Det var krevende å organisere, i tillegg til selve vurderingsarbeidet måtte det også settes av tid til selve organiseringen.
  • Skolene fremhevet at det er viktig at elevens lærer også vurderer besvarelsen for å kunne veilede dem godt i underveisvurderingen, og for å ivareta kravene til vurdering i opplæringsforskriften. Lærerne må ha mulighet både til å vurdere andre elevers besvarelser, og sine egne. I tillegg må lærerne ha tid til å drøfte seg imellom for å sikre en likeverdig vurderingspraksis.
  • Det ble ansett som mer interessant å sammenligne på tvers av skoler enn internt på skolene.

Her finner du Utdanningsetatens referat fra evalueringsmøtet om pilotprosjektet.

Rogaland-forsøket 2013-14

Vedtaket i opplæringsutvalget i Rogaland fylkeskommune la opp til følgende:

  • Ved fastsetting av standpunktkarakter i fellesfag på alle utdanningsprogram, skulle den enkelte lærer velge ut 30 prosent av alle innleveringer som teller til sluttvurdering for anonym vurdering. Faglærer skulle selv stå for vurderingene.
  • For elever på yrkesfag Vg2, gjaldt ordningen for karakterer ved 1. halvårsvurdering.
  • Det ble også etablert en ordning der 60 elevbesvarelser på lokalgitt skriftlig eksamen hvert år ble trukket ut og vurdert anonymt av en ekstern sensorgruppe. Resultatene av dette arbeidet ble returnert til skolene som justering på egen vurderingspraksis.

Evalueringen  besto av tilbakemeldinger fra skolene, og en spørreundersøkelse blant elevene. En oppsummering fra fylkesrådmannen viste følgende:

  • Ifølge rapportene fra skolene ble det ikke påvist systematiske forskjeller mellom besvarelser som ble rettet anonymt og besvarelser som ble rettet ordinært.
  • Skolene poengterte at vurderingssituasjonene er forskjellige, og at elevene prøves i forskjellige læringsmål, så en systematisk forskjell kunne være vanskelig å påvise.
  • Der det var forskjeller, var det ofte i elevenes disfavør, at de ble vurdert strengere i den anonyme vurderingen.
  • Én av skolene tallfestet forskjellene. I matematikk på Vg1 kom rundt 25 prosent av elevene dårligere ut, sammenlignet med de andre vurderingssituasjonene som var gjennomført, 3% kom bedre ut. De resterende kom på samme nivå. Om dette skyldtes måten det ble vurdert på, eller tema for prøven er vanskelig å fastslå, ifølge skolen. 
  • Flere skoler rapporterte at gjennomføringen var tidkrevende.

Rundt halvparten av alle elevene fikk invitasjon til å delta i en spørreundersøkelse. Av 7535 elever, var det 1765 som svarte. En svarprosent på 23. Oppsummeringen fra fylkesrådmannen viste at:

  • Blant jentene var 49 prosent for anonym vurdering da det ble innført, 12 prosent var mot, og 39 prosent hadde ingen formening. Blant guttene hadde 46 prosent ingen formening, 40 prosent var for og 14 prosent var mot.
  • Tre av fire elever svarte at de enten aldri eller ikke visste hvor mange ganger de hadde opplevd å få bedre karakter enn de fortjener. Under ti prosent svarte at de hadde opplevd dette mange ganger. Flere oppga at de mente de hadde opplevd å få dårligere karakter enn de fortjener. 

  • På spørsmål om hvordan karakteren på besvarelsen som ble anonymt vurdert ble, svarte 38 prosent av elevene at det ikke var noen endring. Litt flere jenter enn gutter fikk bedre karakterer enn de pleide å få. En betydelig andel elever oppga at de fikk dårligere karakter på besvarelsen som ble anonymt vurdert.

Her finner du saksutredningen med evalueringen av forsøket i Rogaland.

Bergen-forsøket 2015

Ble gjennomført for vårtentamen på ti ungdomsskoler i Bergen. 

En lærer ved skolen, som ikke var elevens faglærer, vurderte elevbesvarelsen anonymt og satte karakter. Elevens faglærer vurderte samme besvarelse og satte karakter som vanlig. Etterpå ble faglærers og ekstern vurderer sin karakter sammenholdt.

Resultatene ble oppsummert slik en byrådssak i 2015:

  • Elevenes faglærer ga gjennomgående litt høyere karakter enn læreren som vurderte anonyme besvarelser.
  • Det var forskjeller mellom fagene i hvor stort avvik det var mellom faglærer sin vurdering og ekstern vurderer. Avviket var minst i matematikk og størst i norsk hovedmål.
  • Tolkingen av resultatene var imidlertid usikre. Det så ut til å være større avvik mellom lærere og enkeltskoler enn mellom vurderinger av enkeltbesvarelser, men ut fra tallmaterialet var det vanskelig å si i hvilken grad lærernes vurderinger slo ut i en bestemt retning for en bestemt elev eller for hver elev i en gruppe. Undersøkelsen kunne derfor ikke si noe om urettferdigheten mellom enkeltelevene i en gruppe.

  • Samtidig kunne resultatene gi grunnlag for å hevde at noen lærere var generelt strengere eller mildere i sin bedømmelse av elever som gruppe, og at vurderingspraksisen var mer usikker i språkfag enn i matematikk.

  • Metoden med anonyme elevbesvarelser var svært arbeids- og kostnadskrevende.

Her finner du Bergen kommunes oppsummering av forsøket.

Forsøk i Møre og Romsdal fylkeskommune i 2013 og Hordaland fylkeskommune i 2012-13

Utdanningsnytt har ikke funnet selve evalueringene fra disse forsøkene, men i byrådssaken i Bergen kommune (over) oppsummerer de disse kort på følgende vis:

  • I Møre og Romsdal fylkeskommune sier rapporteringen etter prøveordningen i videregående skole at skolene generelt melder at det ikke er signifikante avvik mellom retting av anonyme prøver og de ordinære prøvesituasjonene, og at det heller ikke er noe som tyder på at vurdering og karaktersetting ikke blir gjennomført på en profesjonell og rettferdig måte. En artikkel fra NRK oppsummerer også dette forsøket med tilsvarende konklusjoner. Her kan du lese oppsummeringen av saken i utdanningsutvalget i Møre og Romsdal fylkeskommune fra 2013.
  • I Hordaland fylkeskommune viser rapporten fra forsøket fra 2013 at tilbakemeldingene fra elevene som har deltatt gjennomgående er positive. Tilbakemeldingene fra lærerne og skolelederne er entydig negative.

I 2017 ble det også gjennomført et prosjekt med anonym vurdering ved to ungdomsskoler i Bærum kommune. Ifølge en sak i Kommunal Rapport viste forsøket at karakterene i svært liten grad ble annerledes med anonym retting.