Muntlig eksamen: 
Sensor som dommer og advokat

Fagartikkel: Sensorer ved muntlig eksamen tar ulike roller i samtalene hvor de skal komme til enighet om elevens karakter. Mens elevens egen faglærer gjerne tar rollen som advokat, tar ekstern sensor rollen som dommer.

Publisert Sist oppdatert

Kortversjon:

  • En ny studie utforsker sensorers roller i muntlig eksamen, der interne og eksterne sensorer tar ulike roller som henholdsvis advokat og dommer. Studien viser at interne sensorer ofte modifiserer eksterne sensorers vurderinger ved å forsterke positive vurderinger og minimere negative, mens eksterne sensorer oftest foreslår karakter først.
  • Resultatene indikerer at muntlig eksamen fungerer som et grenseobjekt, som tillater sensorer å forhandle og legitimere karakterer til tross for ulike forståelser. Dette bidrar til å balansere subjektivitet og objektivitet, noe som er viktig for eksamens validitet og reliabilitet.

Oppsummeringen er generert av Labrador AI, men gjennomlest av en journalist.

Med KIs inntog i skolen er ulike eksamensformer igjen oppe til vurdering. Mens det de siste årene er forsket mye på formativ vurdering, har det vært forsket mindre på summative vurderingsformer (Black, 2013). 

Særlig finnes det lite systematisk forskning på muntlig eksamen (Utdanningsdirektoratet, 2019), til tross for at karakterer fra disse eksamenene kan ha stor betydning for elever (Blömeke & Olsen, 2018), blant annet som en del av opptaksgrunnlaget til videregående skole eller høyere utdanning (Forskrift om opptak til høgare utdanning, 2017, § 7-5; Opplæringsforskrifta, 2024, § 9-43). 

Debatten om hvorvidt eksamen er rettferdig, blusser også stadig opp, men meningsmotstandere i denne debatten viser sjelden til empirisk forskning for å underbygge sine argumenter.

I artikkelen «Co-assessment at the boundary: judges and advocates grading students’ performances in oral exams» (Syverud & Prøitz, 2025) forsøker jeg sammen med professor Tine S. Prøitz å frembringe forskningsbasert kunnskap om en sentral, men lite studert vurderingsform. Dette har vi gjort gjennom analyse av videoopptak av sensorers vurderingssamtaler i forbindelse med muntlig eksamen. 

Videoopptakene er gjort ved én ungdomsskole og ved to videregående skoler våren 2019. [Se note 1] Målet med vår tilnærming var å supplere det eksisterende kunnskapsgrunnlaget som i hovedsak består av læreres selvrapportering av vurderingspraksiser (for eksempel Fjørtoft & Morud, 2021) og forskning knyttet til utprøving eller implementering av vurderingsformer (for eksempel Jönsson mfl., 2021).

Muntlig eksamen i ungdomsskole og videregående skole gjennomføres med to sensorer, hvorav én skal være ekstern (Opplæringsforskrifta, 2024, § 9-33). Dette er ment som et tiltak som skal styrke eksamensformens validitet og reliabilitet. 

De to sensorene er tildelt ulik myndighet i eksamenssituasjonen, dette ved at ekstern sensor har siste ordet i situasjoner hvor sensorene ikke kan komme til enighet om elevens karakter (ibid.). De to sensorene besitter også svært ulike forkunnskaper om elevene. Mens intern sensor i de aller fleste tilfeller er elevens egen faglærer, har den eksterne sensoren få eller ingen forkunnskaper om elevene.

Målet med vår studie var å frembringe kunnskaper om sensorenes roller som kunne ha implikasjoner for validiteten. Særlig var vi opptatt av at vurderingsprosessen inkluderte to sensorer i ulike roller og med ulikt ansvar. Spørsmålene vi ønsket å besvare, var: «Hvordan vurderer sensorer med ulike roller elever til muntlig eksamen?» og «Hvordan diskuterer, forhandler og legitimerer de beslutninger om karakterer?»

Med utgangspunkt i videodata fra 29 muntlige eksamener i norsk i ungdomsskole og videregående, analyserte vi samtalene som foregår etter muntlige eksamener hvor sensorene skal komme frem til enighet om elevens karakter. Ettersom det man har som mål å vurdere, er løst definert i norsk sammenheng, anvendte vi begrepet grenseobjekt som analytisk redskap i forståelsen av muntlig eksamen. 

Grenseobjekter er fysiske eller abstrakte ting eller handlinger som har ulik betydning for personer med ulik bakgrunn og erfaring, og som fungerer som brobygger mellom ulike forståelser eller tolkninger (Nolen mfl., 2011). Nettopp denne fleksibiliteten som ligger i grenseobjekter, gjorde begrepet relevant i vår studie. På denne måten fungerte muntlig eksamen som en ressurs for utvikling av ulike identiteter og praksiser (Akkerman & Bakker, 2011). I dialogene som foregikk mellom sensorer i samtalene hvor de skulle komme til enighet om elevenes karakterer, ble det muntlige eksamensformatet et grenseobjekt som tillot sensorene å forhandle, argumentere og legitimere karakterer, til tross for ulike forståelser og tolkninger.

Les også:  Professor: Viktig å videreutvikle muntlig eksamen i KI-tiden

Samtaler med sensorene

Med en kvalitativ tilnærming analyserte vi 29 samtaler mellom sensorer med ulike roller. Disse samtalene, som foregikk etter at elevene hadde gjennomført sine eksamener og hadde forlatt rommet, varierte i lengde; den korteste varte i 40 sekunder, mens den lengste samtalen varte i 9 minutter. 

Studien involverte totalt 9 lærere i rollene som sensorer.

To viktige funn

Analyser av transkriberte samtaler resulterte i hovedsak i to funn. For det første hadde interne sensorer en tendens til å modifisere eksterne sensorers vurderinger ved å forsterke positive vurderinger og ved å minimere negative vurderinger. 

I tillegg argumenterte intern sensor for den høyeste karakteren i de fleste tilfeller hvor ekstern sensor ga uttrykk for at elevenes prestasjoner lå mellom to karakterer. For det andre var det som oftest ekstern sensor som var først til å foreslå karakter. I 26 av de 29 samtalene vi analyserte, var det ekstern sensor som først fremsatte et konkret karakterforslag.

Gjennom analysearbeidet fant vi at interne sensorer modifiserte eksterne sensorers vurderinger på ulike måter, enten ved å forsterke positive vurderinger eller ved å minimere negative vurderinger. Positive vurderinger ble gjerne gjentatt og/eller forsterket. For eksempel:

Ekstern sensor: Vet du hva? Jeg synes han var flink, jeg. ((hvisker))

Intern sensor: Han var kjempe­flink.

Ekstern sensor: Han synes jeg var flink.

Intern sensor: Han var kjempe­flink.

Vi fant også eksempler på at intern sensor forsøkte å balansere sin prosedering ved å peke på noe som kunne fremstå som negativt, og på denne måten tilfredsstille retningslinjene for eksamen.

Når ekstern sensor fremsatte mer negative vurderinger av elevenes prestasjoner, ble disse i mange tilfeller minimert av den interne sensoren. Dette vises i følgende utdrag:

Ekstern sensor: Når det gjelder litteraturen, så syns jeg at han snakka om det norrøne, ikke sant, og hva som var idealet i «Luren». Men han sa ikke noe om egentlig hvorfor. Hva er det i den som, eller hva var det som var idealet, eller hvorfor var bonden … hvorfor var det dette som var – så der syns jeg også det mangla litt.

Intern sensor: Det sa han vel egentlig når han snakka om språkhistorie.

Ekstern sensor: Han sa mer om det der. Ja, det er sant.

Intern sensor: Kanskje han følte at han hadde sagt det.

I tilfeller hvor ekstern sensor ga uttrykk for at elevens prestasjon lå mellom to karakterer, fant vi at intern sensor nesten alltid argumenterte for den beste av de to foreslåtte karakterene. Dette vises blant annet i følgende utdrag:

Ekstern sensor: Men, jo da, jeg syns det er litt sånn imellom her òg jeg. Jeg syns det. Men hun har god oversikt, altså.

Så begge [karakterer] kan forsvares her, syns jeg.

Så du må jo kjempe litt for elevene dine, ikke sant. Fordi jeg, jeg syns den ligger imellom. Og det er noe med at litt når du begynner å grave litt, så syns jeg det blir litt kort. Men tvilen skal komme eleven til gode, det har vi blitt enig om i dag.

Intern sensor: Nei, jeg syns hun, og så syns jeg … presentasjonen er veldig god.

Ekstern sensor: Nei, den syns jeg var veldig god. Det var en veldig, veldig bra. Litt tynt mot slutten. Men hvis vi sier sånn seks heller mot fem istedenfor … jo, men det er viktig å se forskjell på det. Og igjen sånn …

Intern sensor: Ja, jeg syns det.

Ekstern sensor: … hun ligger nærmere seks enn fem. Men jeg har også lyst til å påpeke lite grann de –

Intern sensor: Ja, det syns jeg du skal.

Analysene viste også at dynamikken i rollefordelingen, intern sensor som advokat og ekstern sensor som dommer, er kjent for sensorene. Dette vises i hvordan ekstern sensor i utdraget over ber intern sensor om å «kjempe litt for elevene».

Vi fant kun ett tilfelle hvor det motsatte skjedde: at ekstern sensor ga uttrykk for at elevens prestasjon lå mellom to karakterer (uten å konkretisere hvilke to, men ved å henvise til forrige kandidat), hvorpå intern sensor argumenterte for den laveste av disse. Dette vises i følgende eksempel:

Ekstern sensor: Ja. Så liksom for meg så har liksom de to siste ligget litt sånn imellom. Og det syns jeg han gjør òg. Men så har han liksom noen steder veldig god oversikt. Sånn som språkdebatten, så var det veldig interessant å høre hvordan han holder …

Intern sensor: Ja det syns jeg var bra.

Ekstern sensor: … holder, og så er han litt ute. Og jeg vet ikke hva du tenker om når vi begynner å grave litt i realismen og tekstene der, da.

Intern sensor: Ja. Det var jo en, sånn sett en, det er jo en stygg glipp den der Et dukkehjem. Men klart …

Ekstern sensor: Nei altså, det går an å blande. For jeg tenker at hvis du blander sånn, så kan du rydde opp i det. Men jeg syns ikke det virka som om han egentlig kunne noe om det i det hele tatt.

Intern sensor: Det var vel ikke helt …

Ekstern sensor: Og så litt det der, selv om jeg, kanskje du syns det er litt sånn pirkete å spørre om litt sånn nærmere i forhold til Gjengangere. Men så tenker jeg at det er en viktig del av det. Jeg tenker Gjengangere er jo også …

Intern sensor: Den har vi jobba mye med.

Ekstern sensor: Ja. Så jeg syns det var litt tynt der.

Intern sensor: Men jeg syns det er …

Ekstern sensor: … Men det er jo så morsomt å høre på han, og han har en formidlingsevne som, ikke sant, og det må jeg bare si, altså. Utrolig, og det skal jo være litt rom for den kreative eleven som tar litt sånn sjanser òg. Det er jo litt sånn sjanse å være seg selv

Intern sensor: Jeg syns måten han, jeg syns han landa på beina der, altså. At han, presentasjonen er artig å høre på. Det er jo …

Ekstern sensor: Veldig. Og han gjør det på sin egen måte. Så det er jo også en sånn kreativ og selvstendighet i det. I formidlingen. Og så er det litt upresist her og der. Men samtidig, god oversikt. Jeg tenker ikke det er store hull, men jeg syns det er hull i forhold til realismen, det er liksom det ene, men spørsmålet er hvor mye det blir, litt som vi diskuterte i stad da. Han kjente nok litt på det selv også.

Intern sensor: Det er nok et, kanskje et større hull det enn … 

Ekstern sensor: Ja, hva tenker du? Ja, for nå må … 

Intern sensor: Tenker han samler opp litt her jeg, skal vi se. Det er nok kanskje akkurat den … så kan du si at perioden realismen er en såpass viktig periode at her bør du ha noen …

Ekstern sensor: … For denne bonden og sånn òg. Jeg syns liksom at når vi begynner å pirke litt i, han har veldig god oversikt. Jeg syns det, og jeg tenker, men du må liksom bruke litt den der i forhold til å spørre om det med å ha to målformer er demokratisk òg, så tenker jeg der er det var jo nesten et sånt ledende spørsmål. Er det bra, og ville gjerne at han skulle gå inn og forklare at det er jo faktisk kanskje det viktigste argumentet for at det ble to.

Intern sensor: Jeg tror kanskje 5 er riktig, jeg.

Utdraget over viser også hvordan intern og ekstern sensor forhandler roller, og veksler mellom rollene som dommer og advokat og mer objektive roller.

Blant de 29 vurderingssamtalene var det bare 3 samtaler hvor intern sensor var først til å foreslå elevens karakter. I tillegg var det 1 vurderingssamtale hvor ekstern sensor ga uttrykk for at resultatet lå mellom to karakterer (uten å si hvilke to). Dette ble etterfulgt av enighet om karakteren intern sensor foreslo.

Sensors ulike roller

Analysene viste at interne og eksterne sensorer tar ulike roller i vurdering av elevers prestasjoner til muntlig eksamen. Disse rollene kan dels være definert av retningslinjer for gjennomføring av eksamen, dels virket sensorene kjent med disse rollene som en etablert praksis. 

Data fra studien viste et mønster i det at ekstern sensor foreslo en dom, som intern sensor prosederte for eller mot. 

Det nesten ritualistiske skiftet mellom rollene som dommer og advokat virket kjent og etablert, noe som vises i utdragene. Samtidig virket det som de interne sensorene var bevisste på sin problematiske rolle som subjektiv advokat. Dette vistes ved at de i de fleste tilfeller lot ekstern sensor foreslå karakter, og holdt tilbake informasjon om elevens standpunktkarakter til etter at enighet om eksamenskarakter var fremforhandlet.

Samlet viser funnene at intern sensor ikke tar rollen som advokat fullt og helt, men heller forsøker å balansere rollen som advokat ved å balansere subjektivitet og objektivitet, kanskje i et forsøk på å sørge for validitet. Samtidig har intern sensor vært ansvarlig for elevens opplæring, noe som innebærer at det ikke bare er elevens karakter som skal forsvares, men også egen undervisningspraksis.

Les også:  Jon Erik trommet seg til en sekser i matematikk

Muntlig eksamen som grenseobjekt

Samtidig som muntlig eksamen fungerer som en arena for sluttvurdering, virker muntlig eksamen også som et møtested for sensorer som kan ha ulik utdanningsbakgrunn og ulike syn på læreplaner eller på hva som skal vurderes til muntlig eksamen.

 I denne situasjonen er muntlig eksamen et grenseobjekt, som tillater at sensorer vektlegger ulike faktorer når de vurderer og muliggjør at lærere med ulike syn og holdninger, og med asymmetriske roller, kan samarbeide og komme til enighet om elevers karakterer. Som grenseobjekt tillater også muntlig eksamen interne sensorer å utøve den nær sagt umulige oppgaven det er å forbli objektiv og «kun vektlegge elevens kompetanse slik den fremkommer på eksamen» (Opplæringsforskrifta, 2024, § 9-25).

Konklusjon og implikasjoner

Samlet viser studien at muntlig eksamen fungerer som et grenseobjekt som tillater at sensorer tar ulike roller når de sammen vurderer elever i forbindelse med muntlig eksamen. Bruken av to sensorer, én intern og én ekstern, ser ut til å virke balanserende med tanke på subjektivitet og objektivitet, noe som igjen har betydning for muntlig eksamens validitet.

 Samtidig som sensorene tok ulike roller, tydet flere utsagn på at de var bevisste på disse rollene. Det kan også virke som om rollene i noen grad var regulert av etablerte praksiser (som at ekstern sensor først foreslår en karakter) og lovverk (som fastslår at det er elevens kompetanse på eksamen som skal vurderes).

Samtidig som sensorene inntar ulike roller, er de også ansvarlige for resultatene på ulike måter. For intern sensor er det ikke bare elevenes individuelle karakter som står på spill, ettersom intern sensor indirekte vurderes ut fra elevenes resultater og ved sammenligning av standpunkt- og eksamenskarakterer. På denne måten prosederer interne sensorer ikke bare for egne elevers karakterer, men også for egen undervisnings- og vurderingspraksis.

Ettersom en lærer må være intern sensor for egne lever, men også forventes å ta oppdrag som ekstern sensor, er det avgjørende at lærere har forståelse for disse rollene. Kunnskap om disse rollene er også viktig for beslutningstakere, som skal utarbeide og presisere retningslinjer og regelverk for gjennomføring av muntlig eksamen. En presisering av gjeldende retningslinjer kan medføre en begrensning i fleksibiliteten som er knyttet til lokal gitt muntlig eksamen, samtidig kan presiseringer bidra til økt validitet, reliabilitet og rettferdighet.

Note

1 Datamaterialet til studien ble samlet inn av medlemmer av det NFR-finansierte forsk­ningsprosjektet Conversation Analytic innovation for Teacher Education (CAiTE), prosjektnummer 273417. Prosjektet er godkjent av NSD, godkjennelsesnummer 448873.

 

Litteratur

Akkerman, S.F. & Bakker, A. (2011). Bound-ary crossing and boundary objects. Review of Educational Research, 81(2), 132–169. https://doi.org/10.3102/0034654311404435

Om forfatteren:

Marte Søve Syverud er førsteamanuensis i pedagogikk og utdanningsledelse på Stabsskolen ved Forsvarets høgskole.

Hennes forskningsinteresser er knyttet til vurdering, muntlig eksamen og pedagogikk.

Syveruds doktorgradsavhandling fra Universitetet i Sørøst-Norge handler om læreres vurderingspraksiser ved muntlig eksamen. 

Syverud har lang erfaring fra utdanningsfeltet, som ungdomsskolelærer, lektor i videregående og lærerutdanner.

Black, P. (2013). Formative and summative aspects of assessment: Theoretical and research foundations in the context of pedagogy. I: J.H. McMillan (red.), SAGE handbook of research on classroom assessment (s. 167–178). SAGE Publications Ltd.

Blömeke, S. & Olsen, R.V. (2018). På vei mot et sammenhengende nasjonalt kvalitetsvurderingssystem. Acta didactica Norge, 12(4). https://doi.org/10.5617/adno.6278

Fjørtoft, H. & Morud, E.B. (2021). Assessment decision-making in vocational education and training. Studia paedagogica (Brno), 26(4), 119–137. https://doi.org/10.5817/SP2021-4-6

Forskrift om opptak til høgare utdanning. (2017). (FOR-2025-02-18-251). Lovdata. https://lovdata.no/dokument/SF/forskrift/2017-01-06-13/KAPITTEL_7#KAPITTEL_7

Jönsson, A., Balan, A. & Hartell, E. (2021). Analytic or holistic? A study about how to increase the agreement in teachers’ grading. Assessment in Education: Principles, Policy & Practice, 28(3), 212–227. https://doi.org/10.1080/0969594X.2021.1884041

Nolen, S.B., Horn, I.S., Ward, C.J. & Childers, S.A. (2011). Novice teacher learning and motivation across contexts: Assessment tools as boundary objects. Cognition and Instruction, 29(1), 88–122. https://doi.org/10.1080/07370008.2010.533221

Forskrift om grunnskoleopplæringa og den vidaregåande opplæringa. (2024). https://lovdata.no/forskrift/2024-06-03-900

Syverud, M.S. & Prøitz, T.S. (2025). Co-assessment at the boundary – judges and advocates grading student’s performance in oral exams. Education Inquiry, 1–19. https://doi.org/https://doi.org/10.1080/20004508.2025.2472494

Utdanningsdirektoratet. (2019). Kunnskapsgrunnlag for evaluering av eksamensordningen. https://www.udir.no/tall-og-forskning/finn-forskning/rapporter/Kunnskapsgrunnlag-for-evaluering-av-eksamensordningen/#