Gi oss (tilbake) ein fagleg forsvarleg sensur og klagesensur

Publisert:21. november 2017Oppdatert:21. november 2017, 10:03
Professor Erling Johannes Husabø er ikkje nøgd med sensurordninga ved UiB. Arkivfoto: Ingvild Festervoll Melien

Eit innspel til UiB sitt arbeid med eit høyringssvar til Kunnskapsdepartementet sitt høyringsnotat av 26.09.17 om endringar i Universitets- og høyskoleloven.

Som tilsett ved Det juridiske fakultet i Bergen har eg hatt med sensuren å gjera på alle plan, som kursansvarleg og ved oppgåvegiving, skriving av sensorrettleiing, utval av sensorar, deltaking i ordinær sensur, såkalla «nivåkontroll» og klagesensur. Eg torer påstå at kvaliteten i sensurarbeidet samla sett har blitt vesentleg redusert dei seinare åra, samtidig som noverande ordning inneber ei sløsing med offentlege ressursar. Dette heng saman både med spørsmål som Kunnskapsdepartementet drøftar i høyringsnotatet og spørsmål som departementet let vera å ta opp.

Når ein skal drøfta kva som er gode sensurordningar, er det viktig å ta utgangspunkt i eit realistisk bilete av kva det vil seia å sensurera eksamensoppgåver. Ei vanleg oppfatning både mellom studentar og andre er at det dreier seg om å finna den einaste «rette» karakteren på kvar oppgåve. Ei meir realistisk forståing er at sensur dreier seg om skjønn. Dette vil eg tru gjeld innafor alle fagområde (om ein då ikkje nyttar digitale avkryssingsskjema), sjølv om graden av skjønn vil variera.

Innafor rettsvitskap er innslaget av skjønn svært tydeleg. Oppgåvene gjeld som oftast rettsspørsmål der det kan vera fleire syn som har om lag like mykje for seg. Ofte seier ein då at det ikkje er konklusjonen som avgjer, men korleis ein evnar å bruka «juridisk metode». Men det er heller ingen eksakt storleik. Det er mange måtar å resonnera omkring det same spørsmålet på, og det skal eit innøvd blikk til for å avgjera om den eine måten er betre enn den andre. Vidare har kvar person si personlege språkføring, og ofte er det slik at ein sensor «forstår» språket og metoden til ein student betre enn ein annan sensor. Til dette kjem at det kan vera noko ulike haldningar til kva som er eit godt juridisk eksamensarbeid, til dømes med omsyn til kor teoretiserande eller praktisk retta ein argumentasjon bør vera.

1) Talet på sensorar ved ordinær sensur

Sidan sensur dreier seg om å utøva skjønn, er det heilt naturleg at éin sensor kan koma til eit anna resultat enn ein annan. I slike tilfelle vil det at fleire er saman om sensuren, redusera sjansen for at enkelte oppgåvesvar får ein karakter som er lite representativ (og dermed «urettferdig») i høve til korleis «bunken» som heilskap vert sensurert. Det er ikkje utan grunn at ein i rettslege skjønn alltid har med fleire «skjønnsmenn», og at også andre kompliserte saker gjerne vert avgjort av eit dommarkollegium. Eg vil difor meina at det aukar kvaliteten på sensuren vesentleg om fleire enn éin sensor vurderer kvart oppgåvesvar. Eit viktig omsyn er her også at når sensorar regelmessig sensurer fleire i lag (og det vekslar kven ein har som medsensor), vil det utvikla seg ein «sensorkultur» for kva som er gode og mindre gode måtar å løysa oppgåvene på. Dette medverkar til ei meir føreseieleg og rettferdig vurdering av eksamensprestasjonar.

For å illustrera utviklinga kan nemnast at det fram til 2004 alltid vart nytta minst to sensorar ved sensur av juridiske eksamensoppgåver. (Fram til 1990-talet vart det på det som no tilsvarar masternivå, heile 4 sensorar som såg på kvart oppgåvesvar!) Etter at lova opna for bruk av berre éin sensor, vedtok fakultetsstyret i 2004, som ledd i økonomiske innsparingar og utan rådføring med den vitskaplege staben, å berre nytta éin sensor på vanlege eksamensoppgåver i Bergen.

For å kompensera for kvalitetstapet, vart det innført ei ny ordning med «nivåkontroll». Kvar sensor sender inn 5 oppgåver fordelt på ulike karakterskikt. Så går ein «nivåkontrollør» gjennom desse oppgåvene og prøver å «nivellera» dei slik at sensorane får ein peikepinn om kva som skal telja som til dømes ein A eller C. Sjølv om «nivåkontrollen» gir eit visst bidrag til kvalitetssikring, er det langt frå nokon fullgod kompensasjon for ordninga med to sensorar. Skilnaden i vurderinga av eit oppgåvesvar mellom sensor og «nivåkontrollør» treng nemleg ikkje knyta seg til at dei har ulikt generelt syn på til dømes kor grensa mellom B og C skal gå. Vel så ofte ligg skilnaden i at dei to vurderer det konkrete oppgåvesvaret ulikt. Ein fangar heller ikkje så lett opp meir gjennomgåande skilnader mellom sensorane i synet på kva som er gode og mindre gode måtar å svara på ei juridisk oppgåve.

No når ordninga med éin sensor har eksistert nokre år, merkar vi også (som forventa) at det i mindre grad eksisterer ein «sensorkultur». Fakultetet må kvart år rekruttera nye sensorar som har lite eller inga erfaring med sensur innafor det aktuelle fagområdet. Når kvar sensor sensurerer åleine, lærer dei nye i liten grad av meir erfarne sensorar korleis dei skal vurdera kva som er eit godt oppgåvesvar. Det blir heller ikkje det same rommet for at dei interne sensorane kan formidla til dei eksterne kva som vert vektlagt i undervisinga og «oppdatera» den faglege kunnskapen hjå dei andre. Ordninga med sensorrettleiingar, som i seg sjølv er viktig, kan i liten grad kompensera for dette. Det er mange aspekt ved sensorskjønnet som berre kan lærast ved øving og ved å læra av andre. Dermed er det stor fare for at kvar sensor utviklar sin eigen «sensurkultur». Dette problemet akkumulerer seg sidan det stadig vert færre som (med unntak for klagesensur) har erfaring med å sensurera saman med andre.

2) Blindsensur eller klagesensur

Dei tre juridiske fakulteta har i eit brev til Kunnskapsdepartementet datert 29.06.2016 fremja alvorleg kritikk mot ordninga med blindsensur i klageomgangen, som vart innført av lovgivar i 2014. Denne kritikken støttar eg fullt ut. Det som i namnet framleis heiter «klagesensur» har ikkje noko med klagebehandling å gjera, men er ein ny førstesensur. Det er ei ny «trekning»! Dessutan er bunken av oppgåver i «klageomgangen» mindre representativ, noko som aukar risikoen for ein «urettferdig» sensur når ein ser studentmassen under eitt.

Sidan det må vera to sensorar i klageomgangen, inneber ordninga at våre studentane gjennom klage kan velja å få to sensorar til å vurdera oppgåvesvaret. Den som er misnøgd med karakteren vil difor lett tenkja at han eller ho har mykje å vinna og lite å tapa på å klaga. Når så klagesensorane får ein forholdsvis dårlegare bunke med oppgåvesvar enn dei som hadde ordinær sensur, er «sjansen» stor for at dei nyanserer meir mellom oppgåvesvara i klagebunken, slik at fleire får ein betre karakter enn ved ordinær sensur. Dette er urettferdig for dei studentane som ikkje har klaga.

For å kompensera for desse problema har fakultetet innført eit system med «nivåkontroll» også av klagesensuren. Eit av problema her er at vi har så mange oppgåvesvar å handtera at ein ikkje kan venta at den som gjer denne jobben også har vore med på sensur/nivåkontroll i første omgang. Denne «nivelleringa» av klageoppgåver er dessutan vanskeleg når ein har avgrensa innsikt i førstesensuren og inga innsikt i dei første sensorane sine vurderingar av oppgåvesvara. Det har også vore tilfelle der kursansvarleg har blitt bedt om å sjå særskilt på oppgåver som har fått ein vesentleg endra karakter i klageomgangen. Slike tiltak medverkar til å auka kostnadene med klagesensuren, utan at dei kan anna enn plastra på grunnproblemet. Det gjeld også departementet sitt forslag om ei plikt til å vurdera «omgjering» ved større karakteravvik.

Ved sensur av masteroppgåver er problema endå tydelegare. Her er det krav om to sensorar både i første omgang og ved «klagesensuren». Utvalet av sensorar er generelt sett det same. Det er ikkje slik at «klagesensorane» er meir erfarne eller har større innsikt i fagområdet enn dei første sensorane, -det kan like gjerne vera motsett. Det er difor akkurat like mykje truleg at det er dei ordinære sensorane som har treft det rettaste karakternivået, som at det er «klagesensorane» som treff nivået best. Her krev vurderinga dessutan meir spesifikk fagkunnskap, som ikkje alle sensorar har i same grad. Om dei første sensorane til dømes har funne ut at oppgåva er lite sjølvstendig fordi ho i stor grad gjengir argumentasjonen frå ein utanlandsk artikkel eller eit departementsnotat, er det direkte uheldig at klagesensorane ikkje får vita at dette var ein del av grunngivinga for den opphavlege karakteren.

3) Behov for ein viss terskel for karakterendring ved klage

Det store innslaget av skjønn gjer at det er ein illusjon å tru at ein i klageomgangen skal kunna retta opp mindre avvik frå det som i ei tenkt, ideell verd ville vera den «korrekte» vurderinga av det enkelte oppgåvesvaret. Difor hadde det svært gode grunnar for seg at lovverket tidlegare berre gav rett til å få karakteren endra dersom klagesensorane kom til at det var eit «påtakelig misforhold mellom prestasjon og karakter». (Her vart rimeleg nok stryk/ikkje stryk alltid rekna som vesentleg.) Ei gjeninnføring av eit slik  vesentleg-krav ved ordinære eksamenar vil gi alle partar eit meir realistisk perspektiv på kva som er føremålet med (og oppnåeleg ved) klage på eksamenssensur. I det miste bør den enkelte institusjonen kunna velja å innføra ein slik terskel. Etter alt å døma vil det også bidra til å redusera klagevolumet til eit meir fornuftig nivå (hjå oss er det no minst 25% som klagar).

4) Forsvarleg ressursbruk

Når ein drøftar sensurordningar spelar økonomiske omsyn naturlegvis også inn. Det gjeld å finna fram til ordningar som på ein mest mogeleg kostnadseffektiv måte gir ein «faglig betryggende» sensur, jf Uhl. § 3-9.

Ordninga med blindsensur ved klage gjer at det ikkje lenger dreier seg om ei overprøving, men ei ny vurdering på same nivå. Sidan den første vurderinga kan vera like «rett» eller «feil» må universitetet betala to gonger for den same tenesta. Når ein ser universitets- og høgskulesektoren under eitt er det totale omfanget av dobbeltbetaling for same sensurtenesta svært stort. Ei slik ressurssløsing toler ikkje dagens (Riksrevisjonens) lys.

Etter mitt syn er det også ein unødvendig ressursbruk å setja klagesensorar til å vurdera om eksamensresultatet er nøyaktig det rette. Innslaget av skjønn gjer at ei slik «millimeter-rettferd» er ein illusjon. At ein student ved eitt høve er litt «heldig» og ein annan gong litt «uheldig» med sensuren, er ikkje til å unngå. Heldigvis jamnar dette seg ut når ein tek mange eksamenar i løpet av studietida. Ved å gi klagekommisjonen det meir avgrensa oppdraget å avgjera om det er eit vesentleg misforhold mellom prestasjon og karakter, vil klagesensorane bli nytta til det som verkeleg bidreg til å sikra ein «faglig betryggende» sensur. Alt anna er sløsing med offentlege midlar.

5) Oppsummering

For å vinna tilbake det som er tapt når det gjeld kvaliteten av sensurarbeidet, og for å bruka ressursane på ein forsvarleg måte, må ein kombinera fleire verkemiddel:

  1. Eit krav om to sensorar ved ordinær sensur
  2. Ein open (ikkje blind) klagesensur
  3. Ein viss terskel for karakterendring ved klage