Når karakterene slutter å bety det samme
Debatt: Når tekst kan poleres på sekunder, kan ikke innleveringen stå alene. Markedet selger kontroll. Norsk skole trenger en tydeligere definisjon av hva kompetanse er nå.
Det skjer oftere nå enn før: Jeg leser en elevtekst og stopper opp ved formuleringer jeg ikke hadde forventet. Begreper som sitter godt, resonnementer som er ryddige, en språklig sikkerhet som for noen år siden ville gjort meg oppriktig glad på elevens vegne. Den gangen var reaksjonen ofte enkel: “Endelig. Nå har noe løsnet.” Nå kommer en annen reaksjon snikende inn før jeg rekker å glede meg. Ikke fordi jeg vil mistenkeliggjøre elever, men fordi erfaringen har lært meg at tekstens overflate ikke alltid forteller det den pleide å fortelle.
Så jeg gjør det jeg alltid har gjort når jeg skal vurdere: jeg ber eleven forklare. Hvorfor akkurat det ordet? Hva betyr det her? Hvordan henger dette sammen? Og oftere enn før må jeg lene meg litt ekstra fram for å høre hva som ligger bak setningene.
Jeg vet at jeg ikke er alene. I samtaler med kolleger kommer vi tilbake til de samme spørsmålene: Hva er det egentlig vi ser etter når vi vurderer nå? Handler det om fagforståelse, eller om å få en tekst til å ligne en “god tekst”? Vi ser svært ulik bruk. Noen elever kommer dypere inn i stoffet enn før. Samtidig hender det at elever vi opplevde som sterke, strever med å forklare begreper de selv har brukt når de blir spurt.
Meningene er også delte blant oss voksne. Noen bruker kunstig intelligens (KI) for å spare tid på rapporter og dokumentasjon. Andre bruker det i planlegging: tilpasning, variasjon, idébank. Noen holder avstand. Elevene merker det. Når de oppdager at jeg bruker KI, kommer det ofte et blikk som om de har “avslørt” noe. Når jeg forklarer hva jeg gjør med det, blir “gotcha”-øyeblikket ofte til forvirring. Vi bruker samme teknologi, men vi mener tydeligvis ikke det samme med den.
Når praksisen spriker, spriker også vurderingen. I mange kollegier prøver vi oss fram med ulike måter å holde fast i det samme målet; at eleven lærer, og at vurderingen treffer det den skal treffe. Noen legger mer vekt på muntlig; mer samtale, flere små forklaringer. Andre strammer inn; mer arbeid i timen, mer penn og papir, strengere rammer. Jeg lener selv i én retning, men har vanskelig for å kalle den andre “feil”. Det som er nytt, er at vi nå bruker ulike metoder for å prøve å måle det samme – uten noen klar enighet om hva som egentlig er det tryggeste tegnet på kompetanse.
LES: Kunnskapsministeren varsler grep mot økende KI-bruk i skolen
Med de spørsmålene i bakhodet endte jeg opp i London på utdanningsmessen Bett 2026 (tidligere “British Educational Training and Technology”). Håpet var at andre hadde kjent på den samme vurderingsuroen, og at det allerede ble diskutert.
Det første som møtte meg, var likevel det velkjente edtech-landskapet, bare i gigantformat: store skjermer, fargerike flater, løfter om mer “engagement”. Et eksempel som festet seg, var en 3D-projisert fotballbane på gulvet. Sensorer registrerte bevegelse, og den digitale ballen rullet mot målet når du sparket. Jeg tok meg i å tenke at en tusj og en tennisball hadde gjort mye av den samme jobben.
Etter hvert ble det tydelig at mye av KI-løsningene først og fremst var rettet mot læreren. Det er jo logisk: Det er vi som kan kjøpe inn, ta ansvar og få ting til å passe inn i regelverk. “GDPR” sto også påfallende ofte på plakater og i brosjyrer. Løftene var gjenkjennelige: effektivisering, avlastning, “no human left behind”. Men når jeg skrapte litt i lakken, dukket vurdering opp: Systemer som genererer prøver fra læreplan, tilpasser nivå, vurderer og leverer ferdige analyser. I en demo skannet eleven en QR-kode og fikk karakteren tilbake etter et par minutter. Det var vanskelig å ikke legge merke til hvor ryddig det så ut – og samtidig hvor mye som må være bestemt på forhånd for at det i det hele tatt skal fungere.
Men det var ikke denne ryddigheten jeg lette etter. Jeg lette etter vurdering av elevarbeid – og litt mer diskusjon om den delen.
Noe av det som gjorde mest inntrykk, var en samtale jeg hadde med en foredragsholder fra Dubai. Hun beskrev et opplegg der skolen kunne “stenge ned” klasserommet digitalt: ingen KI-tilgang under arbeidet, faste svaralternativer for faktasjekk, full oversikt over apper som ble brukt. Jeg forsøkte å se det for meg i min egen hverdag. Ikke bare fordi det ville vært et stort inngrep i et norsk klasserom, men fordi det også virker praktisk fjernt. Jeg har sett elever bruke overraskende kort tid på å finne veier rundt “sikre” arbeidsflater, og mye av hverdagen handler allerede om å få teknologien til å fungere. Og uansett: Verktøyene finnes hjemme, i fritiden, i lommen.
Den samtalen gjorde noe tydelig for meg: Mange steder er “løsningen” på vurderingsuroen å stramme inn rammene. Ikke nødvendigvis fordi det er pedagogisk klokt, men fordi det er gjennomførbart. Hos oss ligger mye av vurderingsansvaret fortsatt tett på lærerrollen, innenfor brede kompetansemål. Vi har ikke hatt en skolehverdag der logging og overvåking er den normale måten å skape trygghet på. Samtidig fungerer ikke den gamle tryggheten lenger. Hvis vi verken vil overvåke, eller sitte igjen med en slags myntkast-intuisjon om hva som er elevens, er det ikke nok med nye formuleringer. Da må det avklares hva som faktisk skal telle som kompetanse i en KI-hverdag – og hva som skal regnes som bevis.
Utdanningsdirektoratet har gitt råd om KI i skolen, og mye av det er fornuftig. Men når det kommer til vurdering, stopper rådene akkurat der mange av oss står fast: Vi skal “utforske tilnærminger” som gir “trygghet” for at det er “elevens egen kompetanse” som vurderes, basert på “lokale vurderinger”. Problemet er at disse ordene blir stående åpne. Det gir rom for at lærere gjør ganske forskjellige ting – og alle kan mene at de følger rådene. I beste mening. Men i klasserommet betyr det at elever møter ulike regler for samme type arbeid. Konsekvensen er et lappeteppe: ulike “regimer” fra time til time, og karakterer som begynner å bety litt ulike ting uten at noen egentlig har vedtatt at det er dit vi skal.
Og i bakgrunnen ligger den delen vi sjelden snakker høyt om: Noen elever bruker verktøyene som støtte og blir faktisk bedre. Andre bruker dem som snarvei og merker ikke hvor mye de lener seg på det før det plutselig er borte. Det ser likt ut i innleveringen. Det føles ikke likt to år senere.
Hvis vi mener alvor med fellesskolen, kan vi ikke la dette bli et spørsmål om hvilken lærer du får. Vi trenger en felles retning for hva vi vurderer – og hvordan vi gjør det uten å kjøpe oss til kontroll.