Nasjonale prøver – forskningsmetodikk og demokrati

Debatt: Vi kan ikke lukke øynene når forskning og evaluering viser at mange lærere ikke syns prøvene er gode nok verktøy for å følge opp elevene.

Publisert

De siste ukene har diskusjonene om nasjonale prøver blusset opp igjen. Utdanningsforbundet ønsker debatten velkommen og mener den bør omfatte hele kvalitetsvurderingssystemet. Diskusjonen bør ta utgangspunkt i to overordnede spørsmål: Hva slags informasjon trenger myndighetene på nasjonalt og på lokalt nivå for å utvikle skolen videre? Og hva slags verktøy trenger lærere for å gi elevene best mulig undervisning og oppfølging?

I et innlegg på Utdanningsnytt.no 4. mars fastholder fire fagpersoner fra UiO (Roe, Ryen, Weyergang og Skar) at nasjonale prøver bør videreføres i dagens form. De kaller Utdanningsforbundets forslag om å innrette prøvene som utvalgsprøver, for lite gjennomtenkt. 5. mars på samme nettsted bruker professor Rolf V. Olsen sin kunnskap om psykometrisk metode til å konkludere med at det er best at alle elever deltar i nasjonale prøver. Han sier imidlertid lite om nytteverdien av prøvene, og han berører verken offentliggjøring av resultatene eller misbruk av prøvene til rangering av skoler.

Rangering som styringsinformasjon

Vi i Utdanningsforbundet er usikre på om de nasjonale prøvene fungerer godt nok, og vi mener de har noen negative bivirkninger.

Vi i Utdanningsforbundet er usikre på om de nasjonale prøvene fungerer godt nok, og vi mener de har noen negative bivirkninger. Det betyr ikke at vi mener dagens prøver er helt unyttige, eller at de absolutt ikke bidrar i utviklingen av skolen (selv om flere forsøker å tillegge oss denne posisjonen). Derimot mener vi at en annen innretting kan gi oss bedre verktøy for å følge opp hver enkelt elev og for å videreutvikle skolen. Det er på høy tid å ta diskusjonen om hvordan vi kan forbedre de nasjonale prøvene og kvalitetsvurderingssystemet i sin helhet.

Dagens nasjonale prøver skal oppfylle to formål på en gang. De skal gi styringsinformasjon til nasjonalt og kommunalt nivå som gjør det mulig å sammenlikne resultater mellom kommuner og mellom skoler, og de skal gi lærerne et redskap for å hjelpe hver enkelt elev videre. Roe, Ryen, Weyergang og Skar avviser at det todelte formålet er en svakhet ved prøvene. De viser til at det overordnede formålet uansett er det samme: å fremme de grunnleggende ferdighetene hos den enkelte elev. Dette er en forenkling. Det er en vesensforskjell mellom å gi faglig tilbakemelding til den enkelte elev og det å gi overordnet informasjon om gjennomsnittlig resultatnivå som kan brukes til å sammenlikne skoler og kommuner. Premisset om at det skal være mulig å sammenligne resultatene på tvers av skoler og kommuner, er hovedårsaken til at prøvene har begrenset verdi for lærerne. Den standardiseringen som sammenligningen krever, fører til at lærerne får mindre og mer usikker informasjon om de elevene de trenger aller mest informasjon om, nemlig de som skårer vesensforskjellig fra gjennomsnittet.

Åpenhetskrav i lovverket gjør det vanskelig å unnta testresultatene fra offentligheten. Når vi kombinerer åpenhetskravet med prøver som er skreddersydd for sammenlikning skoler, blir veien kort til offentlige rangeringer. Andre nordiske land har lagt et «need-to-know»- prinsipp for sine prøver, altså gjort informasjonen tilgjengelig bare for dem som skal bruke den. Men i Norge er det fritt fram for å bruke prøvene til å rangere skoler og kommuner. Gjennom slike rangeringer og sammenlikninger får de nasjonale prøvene en status som det definitive målet på utdanningskvaliteten ved hver enkelt skole og i hver enkelt kommune. Dette skjer til tross for at de fleste som jobber med skole er enige om at utdanningskvalitet er langt mer kompleks. Mange fagpersoner, inkludert Roe, Ryen, Weyergang og Skar, advarer mot rangeringer og konkurranse mellom skoler basert på nasjonale prøver. En slik bruk av prøvene hemmer ikke bare utviklingen av norsk skole, men svekker også prøvenes verdi som kvalitetsutviklingsverktøy og som relevant styringsinformasjon til politikerne. Dersom prøvene hadde blitt omgjort til utvalgsprøver, ville vi langt på vei demmet opp for disse svært uheldige bieffektene.

Informasjon til læreren

Flere evalueringer av nasjonale prøver viser at de ikke fungerer godt nok for lærerne. Det vil ikke si det samme som at lærere ikke har noen nytte av dagens prøver. Vi skal absolutt lytte til lærere som mener prøvene fungerer for dem. Samtidig kan vi ikke lukke øynene når forskning og evaluering viser at mange lærere ikke syns prøvene er gode nok verktøy for å følge opp elevene. Bør vi ikke i det minste vurdere muligheten for å erstatte dagens prøver med andre typer diagnostiske prøver som er skreddersydd for at lærerne skal bruke dem til å følge opp elevenes læring?

Vi er helt enige med forskerne fra UiO om at vi trenger mer kunnskap om hva skolesektoren egentlig bruker prøvene til. Dette bør være forskning som trenger dypere ned i saksfeltet og undersøker hva lærerne trenger av verktøy og hvordan prøvene faktisk blir brukt i dag. Undersøkelser som kartlegger lærernes subjektive opplevelse av prøvene som gode/dårlige osv. er interessante nok, men de gir ikke nok informasjon til å forbedre og videreutvikle prøvene.

Informasjon til myndighetene

De fire forskerne ved ILS og professor Olsen ved CEMO mener at politikere på lokalt og sentralt nivå vil gå glipp av viktig styringsinformasjon dersom nasjonale prøver ikke gjennomføres akkurat som i dag. Derfor advarer de mot utvalgsprøver, som de hevder vil fjerne politikernes mulighet til å sette inn målrettede tiltak og til å fordele ressurser til de kommunene og skolene som trenger det mest. Dette argumentet synes å hvile på et premiss om at nasjonale prøver er uerstattelige som styringsinformasjon, og at politikerne ikke kan vite noe om kvaliteten i skolen uten nasjonale prøver.

Et slikt standpunkt er problematisk fordi nasjonale prøver gir et svært begrenset mål på skolekvalitet. Prøvene undersøker bare en liten (men viktig) del av skolens oppdrag, og de gjennomføres bare på tre klassetrinn i grunnskolen. En 1-7-skole vil bare ha ett trinn (5. trinn) som gjennomfører nasjonale prøver hvert år. Det kan utmerket godt være alvorlige bekymringer på en skole som gjør det nødvendig med ekstra oppfølging og tilførsel av ressurser, selv om resultatene fra nasjonale prøver på 5. trinn ikke er urovekkende i seg selv. Med andre ord er nasjonale prøver bare en av mange typer styringsinformasjon som politikerne trenger.

Den aller viktigste styringsinformasjonen bør være en kontinuerlig og tett dialog mellom kommuner og skoler.

Den aller viktigste styringsinformasjonen bør være en kontinuerlig og tett dialog mellom kommuner og skoler. Denne dialogen skal gi kommunene et godt bilde av tilstanden ute på skolene og gi grunnlag for god forvaltning av ansvaret som lokal skolemyndighet. Hvis derimot nasjonale prøver tillegges for mye vekt som et endelig kvalitetsmål, risikerer vi at kommunene får smalere og mindre nyansert styringsinformasjon enn de burde hatt. Noe som igjen vil gjøre det vanskeligere å følge opp skolene på en god måte. Argumentet om at kommuner ikke kan følge opp skolene sine dersom de ikke kjenner gjennomsnittsresultatet av en 1,5 timers test på 5. trinn, faller på egen urimelighet.

Det finnes alternativer

Utdanningsforbundet ønsker ikke å fjerne styringsinformasjon uten å erstatte den med noe bedre. Vi går inn for å utvikle diagnostiske tester som skoler og lærere kan bruke., Disse kan bidra til rektors dialog med lærere og kommuners dialog med skoler. For å sikre kvaliteten på slike prøver, kan ansvaret for utvikling og kvalitetssikring legges til Utdanningsdirektoratet. En slik modell vil gi kommuner og skoler større frihet til å velge verktøy som er tilpasset lokale behov, og det vil gi et bedre utgangspunkt for god utdanningsledelse. Styringsdialogen vil bli mindre preget av sammenlikning og konkurranse. Dermed legges grunnlaget for en tillitsbasert dialog der utvikling er i sentrum.

Vi mener også at utvalgsprøver er gjennomførbart i praksis. Rolv V. Olsen hevder at gode, representative utvalgsprøver vil kreve testing av så mange elever at vi like godt kunne testet alle. Her kan vi for eksempel vise til PISA-undersøkelsen, som tester ca. 5500 elever av et samlet årskull på over 60 000. Dette foregår ved at det først trekkes ut et representativt utvalg skoler, og at det deretter trekkes ut et utvalg elever ved disse skolene. Det er med andre ord fullt mulig å få et bilde av situasjonen på landsbasis selv om man tester under 10 prosent av elevmassen.

Til syvende og sist må belastningen ved å teste elevene veies opp mot nytteverdien av testresultatene.

Spørsmålet om hvorvidt utvalgsprøver også kan gi informasjon på regionalt nivå, mener vi må utredes nærmere. Hvor mange elever må vi teste for å få et godt bilde av situasjonen i hvert fylke? Trenger vi egentlig fylkesoversikter over elevenes grunnleggende ferdigheter? Fylkeskommunen har uansett ikke ansvaret for grunnskolene, der de nasjonale prøvene foregår, men det kan være andre årsaker til at denne informasjonen er nyttig. Til syvende og sist må belastningen ved å teste elevene veies opp mot nytteverdien av testresultatene.

Vi ønsker en konstruktiv og demokratisk debatt om hvordan vi kan gjøre skolen bedre. Erfaringer fra våre naboland og fra andre sammenliknbare land viser at det er mange måter å organisere prøver på. Finland har for eksempel ikke tester som danner grunnlag for rangering av skoler. Sverige har et utstrakt testsystem, mens Danmark gjør store endringer i sine nasjonale prøver etter omfattende kritikk og debatt. Utdanningsforbundet tror ikke vi i Norge har funnet den optimale løsningen. Derfor er det nødvendig å videreutvikle systemet.

Hvis vi skal klare det, trenger vi en grundig gjennomgang av dagens system og en opplyst debatt om alternativene. Denne debatten kan ikke først og fremst dreie seg om de metodiske utfordringene ved prøvene, men om hva slags informasjon vi trenger for å utvikle skolen.