Name: Bedoma
Author: Bedoma

Intresset för AI i utbildningssektorn har exploderat de senaste åren. Men vad säger egentligen forskningen om AI-stödd bedömning av elevtexter? Här sammanfattar vi de viktigaste rönen och vad de innebär för dig som lärare.

Forskningen visar: AI kan förbättra konsistensen

Flera studier har undersökt hur väl AI-modeller kan bedöma elevtexter jämfört med mänskliga bedömare. En genomgående slutsats är att AI kan uppnå en hög samstämmighet med lärarens bedömning, ofta i nivå med den variation som finns mellan två olika lärare som bedömer samma text.

En metaanalys publicerad 2024 av forskare vid University of Cambridge visade att AI-system för automatisk textbedömning (Automated Essay Scoring, AES) nådde en genomsnittlig samstämmighet på 0,75-0,85 med mänskliga bedömare, mätt med kvardratiskt viktat kappa. Det är i samma intervall som samstämmigheten mellan två erfarna lärare.

Forskning från Göteborgs universitet har specifikt tittat på svenska förhållanden och konstaterar att AI-stöd kan vara särskilt värdefullt för att minska bedömningsdrift, det fenomen som uppstår när en lärare gradvis ändrar sin bedömningsnivå efter att ha rättat många texter i följd.

AI som komplement, inte ersättning

Den absolut viktigaste slutsatsen i forskningen är entydig: AI fungerar bäst som ett komplement till lärarens bedömning, inte som en ersättning. Forskare vid Stanford University har visat att den mest tillförlitliga bedömningen uppstår i en modell där:

1. AI ger ett första förslag med motiveringar 2. Läraren granskar förslaget kritiskt 3. Läraren fattar det slutgiltiga beslutet

Denna samarbetsmodell, ibland kallad "human-in-the-loop", ger bättre resultat än antingen enbart AI eller enbart enskild lärarbedömning. Anledningen är att AI och människa har kompletterande styrkor: AI är konsekvent och tröttas aldrig, medan läraren förstår kontext, elevens utveckling och nyanser som AI kan missa.

Vad AI är bra på, och vad den missar

Forskningen pekar på tydliga styrkor och svagheter hos AI-bedömning:

Styrkor:
Strukturell analys: AI är utmärkt på att identifiera textens uppbyggnad, styckeindelning och röd tråd
Språklig bedömning: grammatik, meningsbyggnad och ordvariation bedöms tillförlitligt
Konsistens: samma text får samma bedömning varje gång, oavsett om det är text 1 eller text 30 i högen
Snabbhet: en analys tar sekunder istället för minuter

Svagheter:
Kreativitet och originalitet: AI tenderar att underskatta djärva stilval
Ämnesspecifikt innehåll: i vissa ämnen krävs djup fackkunskap för korrekt bedömning
Kulturell kontext: AI kan missa referenser och allusioner som en lärare förstår
Elevens utveckling: AI ser bara den enskilda texten, inte elevens läranderesa

EU AI Act och reglering

Sedan februari 2025 gäller EU:s AI-förordning (EU AI Act) i hela Europa. Förordningen klassificerar AI-system inom utbildning som högrisk, vilket innebär särskilda krav:

Mänsklig tillsyn: en människa måste alltid kunna granska och överpröva AI:ns beslut
Transparens: det ska vara tydligt att AI används och hur
Dokumentation: systemet ska vara spårbart och granskningsbart

Det innebär i praktiken att automatisk betygsättning utan lärargranskning inte är tillåten inom EU. System som Bedoma, där AI ger ett förslag men läraren alltid fattar beslutet, är byggda enligt kravet på mänsklig tillsyn.

Nordisk forskning på frammarsch

I Norden pågår flera intressanta forskningsprojekt. Umeå universitet driver ett projekt om AI-stödd formativ bedömning i svenska som andraspråk (SVA), där tidiga resultat visar att AI-stöd kan hjälpa lärare att ge mer detaljerad och snabbare feedback till elever. Aalto-universitetet i Finland har publicerat forskning om hur AI kan stödja bedömning av flerspråkiga elevers texter.

Vad innebär detta för dig som lärare?

Sammanfattningsvis visar forskningen att:

AI-stödd bedömning fungerar: samstämmigheten med lärarbedömning är hög
AI ersätter inte läraren: den bästa modellen är samarbete mellan AI och lärare
Konsistensen förbättras: särskilt vid stora rättningshögar
EU-lagstiftningen kräver att läraren alltid har sista ordet

Som lärare kan du använda AI-stöd med gott samvete, så länge du granskar förslagen kritiskt och fattar dina egna beslut.

Vill du prova hur AI-stödd bedömning fungerar i praktiken? Testa Bedoma gratis på vår prissida. Du väljer ämne och kurs, klistrar in elevtexten, och får ett bedömningsstöd baserat på Skolverkets betygskriterier, på under en minut.