Forskere: – Ikke alle elever lærer noe av å bruke KI
Å få god læring av å bruke ChatGPT krever langt mer av både elev og lærer enn det forskerne trodde.
Han har forsket på læring, digital teknologi og kunstig intelligens i nesten tretti år. Men da språkmodellen ChatGPT plutselig dukket opp høsten 2022, ble professor Sten Ludvigsen på Institutt for pedagogikk ved Universitetet i Oslo likevel ‘faglig destabilisert’, som han uttrykker det.
– Systemene vi har vært vant til, er basert på sikker kunnskap, såkalte regelbaserte systemer. De kan støtte og veilede elever i fag som matematikk og språk. Men ChatGPT representerer noe annet, understreker han.
De store språkmodellene er nemlig basert på beregninger, der sannsynlighet for neste ord er selve kjernen i systemet. De er trent på enorme mengder tekstdata, kan skrive lange tekster og svare på spørsmål.
– En språkmodell har ingen ‘sannhet’ bygd inn i seg, grunnleggende sett. Hva kan vi da bruke den til i skolen? spør mannen bak flere offentlige utredninger, blant dem Fremtidens skole.
Det mangler ikke på meninger om hvordan teknologien bør eller ikke bør brukes i læring og undervisning. Kunnskap, derimot, skorter det på. Ingen vet noe sikkert ennå om de store språkmodellene faktisk egner seg i klasserommene, hvordan de kan brukes – og til hva. Spørsmålet blir om de representerer en ny og god mulighet for læring.
– Det er viktig å finne ut. Vi må huske at kunstig intelligens kan gi enormt kraftige verktøy, poengterer Ludvigsen.
Hva skjer med læringen?
De store språkmodellene er trent på informasjon fra hele verdens internett. Etter at ChatGPT ble tilgjengelig for alle, har flere norske kommuner lagd sine egne tilpasninger og løsninger for skolen – koblet til norskspråklig kontekst og kultur.
– Blant dem er Asker kommune utenfor Oslo. Der har et team av lærere med god bakgrunn i arbeid med digitale læremidler utviklet en rekke fagspesifikke chatbots, samtaleroboter, som elevene kan bruke innenfor fag som geografi, historie, norsk, naturfag og matematikk.
Oppå den generative språkmodellen er det nå «lagt et designlag» faglig kunnskap – der både læreplaner og fagtekster er lagt inn.
– Dermed kombineres to ting: Den store kapasiteten til språkmodellen og korrekt og relevant fagkunnskap. Det gjør samtalerobotene både enklere, og ikke minst sikrere å håndtere: Da risikerer ikke elevene å få til svar at Gro Harlem Brundtland ble statsminister i Norge i 1910. Da blir heldigvis svaret 1981, konstaterer Ludvigsen.
Tanken er at de nye digitale samtalepartnerne skal støtte og veilede elevene i å utvikle lese- og skriveferdighetene sine. Men hva skjer egentlig med Asker-elevenes læring når de henvender seg til en robot og ikke til en lærer av kjøtt og blod?
Pionerarbeid
For å komme nærmere et svar har skolene i Asker alliert seg med forskere på Det utdanningsvitenskapelige fakultet. Sammen har de lagd innovasjonsprosjektet Læring i algoritmenes tidsalder.
– Målet vårt er nettopp å finne ut hva som skjer når elevene tar kunstig intelligens i bruk i klasserommet, forteller stipendiat Henrik Tjønn på Institutt for pedagogikk.
Vi snakker om pionervirksomhet.
– Flere spørreundersøkelser har vært gjennomført om hvordan elever opplever å bruke språkmodeller. De har gitt viktig kunnskap om hva elever tenker om bruk av generativ, kunstig intelligens. Men undersøkelsene gir begrenset kunnskap om interaksjonen mellom elever og store språkmodeller. Det innovative, det nye vi gjør, er å sette oss ned i klasserommene, observere og dokumentere det som faktisk skjer. Det har knapt vært gjort tidligere, påpeker han.
Forskere fra prosjektet var med da de fagtilpassete versjonene av ChatGPT ble prøvd ut på fem grunnskoler i Asker vinteren 2024. Utprøvingen involverte seks lærere og nesten to hundre elever i sju ulike klasser på barne- og ungdomstrinnet, altså 6. til 9. klasse.
– Vi observerte hvordan elevene brukte samtalerobotene intuitivt, og også hvordan de brukte dem basert på erfaring med andre digitale læremidler.
Høsten 2024 og vinteren 2025 gjennomførte forskerne andre runde med datainnsamling i klasserom på flere ungdomsskoler. I denne fasen arbeidet de tett sammen med lærerne for å utvikle undervisningsopplegg, der samtaleboter etter hvert ble godt integrert i fagene.
– Nå gjorde vi også skjermopptak av interaksjon mellom elever, lærer og samtalerobot for å kunne gå grundig til verks når vi analyserer samhandlingen.
Store konsekvenser
Forskerne fra UiO og lærerne i Asker la stor vekt på hvordan språkmodellen kunne designes slik at den blir et best mulig hjelpemiddel for elevene. Det var ikke bare lett.
– Det er avgjørende at språkmodellen er skrudd sammen slik at den kan bidra til å stimulere kognitive funksjoner hos eleven – som språkutvikling, hukommelse, forståelse og problemløsning, poengterer Ludvigsen. Han medgir at det er en stor utfordring, men gir også en stor bonus om de greier det:
– Blir elevene stimulert på rett måte over en lengre periode, la oss si over ti år, kan de lære virkelig mye. Men designer vi litt feil, betyr det en nedadgående spiral, der elever kan løse oppgaver uten kognitiv anstrengelse. Små justeringer av samtalerobotene nå kan med andre ord få store konsekvenser for eleven når vi ser hele skoleløpet under ett. De må designes slik at de skaper muligheter for kognitivt krevende arbeid i skolens fag og kompetanseområder, understreker Ludvigsen.
Må skille tydelig
Forskerkollegene viser til noe som både de og lærerne erfarte fra utprøvingen, nemlig hvor viktig det er å gjøre dette skillet klart for elevene: når det er de trener på å forstå teknologien, hva den gjør – og når det er de bruker den for å lære, for eksempel om demokrati eller programmering.
– I de første forsøkene vi gjorde, var dette skillet ganske utydelig. Det tok litt tid både for oss og lærerne å se hvordan vi skulle lage et godt undervisningsdesign for å klargjøre skillet, forteller Tjønn.
Store sprik
Men det var likevel noe som framstod enda mer slående for kollegene under feltarbeidet i klasserommene – nemlig de store skillene elevene imellom. Noen av elevene viste seg allerede å ha en god del erfaring med å bruke kunstig intelligens. Disse elevene hadde gjerne fått tips fra TikTok eller fra foreldre som selv var flittige brukere. Men, understreker forskerkollegene, det betyr ikke nødvendigvis at de kunne bruke kunstig intelligens i faglig avanserte oppgaver.
– Selv om vi ser ulike mønstre i bruken, registrerer vi også at en god del elever har god støtte av robotene i idémyldringsfaser, i språklig bearbeiding og korrekturlesing, framholder Ludvigsen.
Forskerkollegenes observasjoner viser: Deler av en klasse arbeidde konsentrert med oppgaver og mestret overgangene mellom ulike digitale verktøy, tok stilling til teksten roboten kom med, og justerte spørsmålene sine for å få mer konkrete og bedre svar i retur. De utnyttet flere av mulighetene som roboten ga som sparringspartner.
Hos andre elever så forskerne derimot et ganske annet mønster. De gjorde få kognitive anstrengelser.
– Disse elevene verken festet seg ved eller bearbeidet informasjonen de fikk fra samtaleroboten til sin egen tekst. De leste ikke igjennom svaret de fikk, og gikk heller ikke i dialog med robotene ved å stille nye spørsmål, der de kunne ha bedt om kortere eller enklere svar, påpeker Ludvigsen.
– Når eleven ikke greier å vurdere innholdet samtaleroboten produserer, blir det heller ingen god kvalitet på interaksjonen, legger Tjønn til.
Kan akselerere skiller
Forskerne på Det utdanningsvitenskapelige fakultet har lenge vært opptatt av hvordan digitale verktøy kan skape sosiale forskjeller. Når det gjelder de nye generative språkmodellene, mener de det er for tidlig å gi sikre svar.
Men, påpeker de, det tyder på at ulikheter mellom elevene kan komme til å øke når KI og store språkmodeller tas i bruk i skolen.
– Skal læreren greie å ivareta alle elevene forutsetter det at han eller hun kan variere bruken av KI – tilpasset klassen og den enkelte eleven. Undervisningopplegget må bygge på didaktiske modeller som klargjør hva KI kan brukes til i læringen – og hvordan.
De peker på at KI basert på store språkmodeller er kraftfulle når en først tar dem i bruk.
– Flinke elever kan løse oppgaver og skrive tekst på langt høyere nivå enn med andre skriveverktøy, kanskje på et nivå som overskrider det de kan per i dag med tre-fire år, forteller Ludvigsen.
– Men, legger han til, hva eleven forstår av teksten, kan og må vi undersøke nærmere.
Anstrengelser må til
Ludvigsen peker på konsulentbransjen. Studier viser at verktøy med kunstig intelligens bidrar til at de aller flinkeste gjør det betydelig bedre, mens resten gjør det litt bedre. Dermed blir alle på sett og vis vinnere. Professoren tror ikke det samme gjelder i skolen.
– En elev som strever med språk og formuleringer, kan komme til å tape på å bruke verktøy som en språkmodell er, mener han.
– De vil rett og slett ikke gjøre de kognitive anstrengelsene som læringsarbeid er helt avhengig av. Selv om vi ikke ennå kan si noe sikkert om hvorvidt forskjellene i skolen vil øke, er det uansett noe vi må være svært oppmerksomme på.
Professoren peker på ‘det store i det lille’.
– Det lille er alle de små tingene i hverdagen, det som gjør at vi lærer, utvikler god kognitiv kapasitet. I skolen er det et uendelig antall av oppgaver som elever arbeider med. Hver enkelt oppgave gir en viss grad av læring og mestring. Vi kan se konturene av elever som i ulike fag og på tvers av fagene utvikler evnene sine til selvregulering, og som lærer gjennom samarbeid. Men vi ser også elever der dette skjer i begrenset grad. Over tid er den kumulative effekten for den enkelte svært stor, fra å mestre skolen til det motsatte.
Greier ikke å skille
Tjønn understreker at samtaleroboten er en ressurs som elevene må trene på å bruke.
– De må øve seg på å vurdere om svarene den gir er gyldig kunnskap, og de må kunne sortere informasjonen. På sitt beste gir den muligheter for å oppøve kritisk tenkning i fagene som vi ikke har hatt på samme måte før, fordi responsen den digitale sparringspartneren gir, kan være både tilpasset og umiddelbar.
Ludvigsen peker imidlertid på at det å kunne skille mellom korrekt og falsk informasjon er vanskelig.
– For en elev på 12, 13, 14 eller 15 år, vil jeg nok si det er umulig på et dypere nivå. Det eleven derimot kan greie med god lærerstøtte, er å utvikle god intuisjon for hva ulike programmer med kunstig intelligens kan brukes til.
Forskernes observasjoner viser at det er krevende for elevene å engasjere seg i dialogen med samtaleroboten, ikke minst for barn i femte-sjette klasse.
– Vi kan ikke forutsette at de får det til, de trenger god lærerstøtte, sier Ludvigsen.
Overrasket
Forskerne innrømmer at mye av det de så i klasserommene i Asker, overrasket dem.
– Jeg har flere års erfaring som lærer i grunnskolen. Likevel, det å bruke disse store språkmodellene i undervisning og læring, er mye mer sammensatt og utfordrende enn jeg hadde trodd på forhånd, erkjenner Henrik Tjønn, og peker både på utfordringen med å utvikle et godt design på språkmodellen, å integrere kunstig intelligens i undervisningen og det å få til god dialog og læring for elevene.
Han får støtte av sin kollega:
– Det er en kjempeutfordring å få de store språkmodellene inn i skolen på en god måte, sier Sten Ludvigsen. Hvordan en skal balansere og optimalisere forholdet mellom det generative i KI-verktøy og det fagspesifikke, er noe forskningen bør rette oppmerksomheten mot.
Til hele landet
Innovasjonsprosjektet fortsetter. Forskerne har hatt flere runder med lærerne i Asker i etterkant av feltarbeidet i klasserommene.
– Sammen utforsker vi hvordan samtalerobotene kan bli brukt i skolens undervisning. Målet er å finne ut hvordan elevene på best mulig måte kan ta programmer basert på kunstig intelligens i bruk, gi kompetanse til lærerne og opparbeide en kritisk tilnærming til bruken av programmer som bygger på kunstig intelligens, sier Tjønn.
Erfaringene og kunnskapen fra skolene i Asker skal spres til hele landet gjennom en nasjonal satsing.
– Løsningene vi kommer til å presentere, de didaktiske modellene er selvsagt ikke de eneste som kan tas i bruk i skolen, understreker Ludvigsen.
– Men når vi er ferdige med prosjektet om et par års tid, har vi tatt flere viktige steg på veien mot en kunnskapsbasert bruk av samtaleroboter i skolen. Og basert på de didaktiske modellene, vil vi nok anbefale at mange tar KI-verktøy i bruk.
*) Denne artikkelen ble første gang publisert i forskningsmagasinet Apollon, der forfatter Trine Nickelsen er ansvarlig redaktør.