GDPval — Bo Overby

AI nærmer sig ekspertniveau i erhvervslivet

gennemsnitlig vinderrate mod menneskelig ekspert — på to kvartaler

Da OpenAI lancerede GDPval i oktober 2025, matchede eller overgik AI eksperten i 71 % af opgaverne. I dag er det 85 % — på tværs af brancher fra sundhed og finans til handel og den offentlige sektor.

Hvad måler GDPval? OpenAIs målestok for, hvor godt AI-modeller klarer fagligt arbejde i den virkelige verden. 1.320 opgaver udformet af fagfolk med i gennemsnit 14 års erfaring — fordelt på 44 stillinger i 9 brancher.

Scoren er wins+ties: andelen af opgaver, hvor AI-modellens svar vurderes bedre end eller på niveau med en menneskelig eksperts. GPT-5.2 ved lancering: 49,7 % wins alene / 70,9 % wins+ties.

Tal markeret med * er estimater. Kilde: evals.openai.com/gdpval/leaderboard.

Ledende AI-model pr. branche

Wins+Ties vs. menneskelig ekspert (%) — okt 2025 til apr 2026

50 % — menneskeniveau