Kalibrera AI bedömning
AI bedömning är bara så tillförlitlig som kalibreringen bakom den. Bedoma är kalibrerat mot 207 riktiga elevtexter med riktiga lärarbedömningar från nationella prov och skolverkets ankarexempel. Ingen AI genererad text används någonsin.
Processen bakom 87 procent träffsäkerhet
Steg 1: insamling av texter från NP och Skolverkets betygsporträtt. Steg 2: träffanalys per ämne, per kurs, per nivå. Steg 3: kalibrering av prompten när systematiska fel upptäcks. Steg 4: konsistenstest där samma text körs många gånger med temperatur noll.
Ämnen där träffsäkerheten är högst
Engelska 5: 100 procent. SO ämnen: 100 procent. NO ämnen: 100 procent. Svenska åk 9: 83 till 100 procent. Engelska åk 9: 91 procent.
Ämnen där AI:n är osäker
Gränsfallen D och B är systematiskt svåra. På D är träffsäkerheten kring 8 procent i diagnostisk test med aktuell modell. Vi är öppna med detta. Lärare som arbetar mycket med gränsfall bör se Bedoma som stöd, inte avgörare. Moderna språk och praktisk estetiska ämnen är fortfarande under kalibrering.
Bidra själv
Via bidra sidan kan du ladda upp en anonymiserad elevtext med ditt betyg och få bonusanalyser. Dina bidrag går in i nästa kalibreringsomgång. Bara riktiga elevtexter används, aldrig AI genererade.
Relaterat: Bidra med text, Om Bedoma, Insights, Forskning om AI bedömning.