Bedömning med AI — vad säger forskningen?
En översikt av aktuell forskning om AI-stödd bedömning i skolan. Vad visar studierna om effektivitet, tillförlitlighet och lärarens roll?
Intresset för AI i utbildningssektorn har exploderat de senaste åren. Men vad säger egentligen forskningen om AI-stödd bedömning av elevtexter? Här sammanfattar vi de viktigaste rönen och vad de innebär för dig som lärare.
Forskningen visar: AI kan förbättra konsistensen
Flera studier har undersökt hur väl AI-modeller kan bedöma elevtexter jämfört med mänskliga bedömare. En genomgående slutsats är att AI kan uppnå en hög samstämmighet med lärarens bedömning — ofta i nivå med den variation som finns mellan två olika lärare som bedömer samma text.
En metaanalys publicerad 2024 av forskare vid University of Cambridge visade att AI-system för automatisk textbedömning (Automated Essay Scoring, AES) nådde en genomsnittlig samstämmighet på 0,75–0,85 med mänskliga bedömare, mätt med kvardratiskt viktat kappa. Det är i samma intervall som samstämmigheten mellan två erfarna lärare.
Forskning från Göteborgs universitet har specifikt tittat på svenska förhållanden och konstaterar att AI-stöd kan vara särskilt värdefullt för att minska bedömningsdrift — det fenomen som uppstår när en lärare gradvis ändrar sin bedömningsnivå efter att ha rättat många texter i följd.
AI som komplement, inte ersättning
Den absolut viktigaste slutsatsen i forskningen är entydig: AI fungerar bäst som ett komplement till lärarens bedömning, inte som en ersättning. Forskare vid Stanford University har visat att den mest tillförlitliga bedömningen uppstår i en modell där:
1. AI ger ett första förslag med motiveringar 2. Läraren granskar förslaget kritiskt 3. Läraren fattar det slutgiltiga beslutet
Denna samarbetsmodell — ibland kallad "human-in-the-loop" — ger bättre resultat än antingen enbart AI eller enbart enskild lärarbedömning. Anledningen är att AI och människa har kompletterande styrkor: AI är konsekvent och tröttas aldrig, medan läraren förstår kontext, elevens utveckling och nyanser som AI kan missa.
Vad AI är bra på — och vad den missar
Forskningen pekar på tydliga styrkor och svagheter hos AI-bedömning:
- Styrkor:
- Strukturell analys — AI är utmärkt på att identifiera textens uppbyggnad, styckeindelning och röd tråd
- Språklig bedömning — grammatik, meningsbyggnad och ordvariation bedöms tillförlitligt
- Konsistens — samma text får samma bedömning varje gång, oavsett om det är text 1 eller text 30 i högen
- Snabbhet — en analys tar sekunder istället för minuter
- Svagheter:
- Kreativitet och originalitet — AI tenderar att underskatta djärva stilval
- Ämnesspecifikt innehåll — i vissa ämnen krävs djup fackkunskap för korrekt bedömning
- Kulturell kontext — AI kan missa referenser och allusioner som en lärare förstår
- Elevens utveckling — AI ser bara den enskilda texten, inte elevens läranderesa
EU AI Act och reglering
Sedan februari 2025 gäller EU:s AI-förordning (EU AI Act) i hela Europa. Förordningen klassificerar AI-system inom utbildning som högrisk, vilket innebär särskilda krav:
- Mänsklig tillsyn — en människa måste alltid kunna granska och överpröva AI:ns beslut
- Transparens — det ska vara tydligt att AI används och hur
- Dokumentation — systemet ska vara spårbart och granskningsbart
Det innebär i praktiken att automatisk betygsättning utan lärargranskning inte är tillåten inom EU. System som Bedoma, där AI ger ett förslag men läraren alltid fattar beslutet, uppfyller dessa krav.
Nordisk forskning på frammarsch
I Norden pågår flera intressanta forskningsprojekt. Umeå universitet driver ett projekt om AI-stödd formativ bedömning i svenska som andraspråk (SVA), där tidiga resultat visar att AI-stöd kan hjälpa lärare att ge mer detaljerad och snabbare feedback till elever. Aalto-universitetet i Finland har publicerat forskning om hur AI kan stödja bedömning av flerspråkiga elevers texter.
Vad innebär detta för dig som lärare?
Sammanfattningsvis visar forskningen att:
- AI-stödd bedömning fungerar — samstämmigheten med lärarbedömning är hög
- AI ersätter inte läraren — den bästa modellen är samarbete mellan AI och lärare
- Konsistensen förbättras — särskilt vid stora rättningshögar
- EU-lagstiftningen kräver att läraren alltid har sista ordet
Som lärare kan du använda AI-stöd med gott samvete — så länge du granskar förslagen kritiskt och fattar dina egna beslut.
Vill du prova hur AI-stödd bedömning fungerar i praktiken? Testa Bedoma gratis med tre analyser per månad. Du väljer ämne och kurs, klistrar in elevtexten, och får ett bedömningsstöd baserat på Skolverkets kunskapskrav — på under en minut.
Vill du prova AI-stödd bedömning? Kom igång gratis med Bedoma — tre analyser per månad, alla ämnen och kurser.