Nieuws

Claude Opus 4.8 leert eindelijk iets wat AI zelden doet: “Sorry, ik weet het niet”

Claude Opus 4.8
© Anthropic

Anthropic heeft Claude Opus 4.8 gelanceerd. Het nieuwe taalmodel zou beter herkennen wanneer informatie ontbreekt of wanneer het model zelf onvoldoende zeker is van een antwoord.

AI-modellen hebben ondertussen de reputatie opgebouwd overal een antwoord op te hebben. Ze praten je graag naar de mond, alleen klopt hun antwoord dan in sommige gevallen gewoon niet meer. Grote taalmodellen formuleren hun reacties vaak met zoveel overtuiging dat je bijna vergeet dat ze soms gewoon gokken.

Dat blijft een van de grootste problemen van generatieve AI: modellen die met volle overtuiging foutieve informatie presenteren. Daar wil Anthropic dus een mouw aan passen met Claude Opus 4.8. De focus ligt minder op spectaculaire nieuwe functies en meer op betrouwbaarheid.

AI die durft twijfelen

Anthropic stelt dat Opus 4.8 duidelijk vaker aangeeft wanneer het iets niet zeker weet. Zeker bij programmeervragen zou het model minder snel geneigd zijn om foutieve oplossingen uit zijn mouw te schudden. In interne tests behaalde de AI volgens het bedrijf bijna perfecte scores op zogenaamde ‘honesty benchmarks’, waarbij modellen bewust geconfronteerd worden met vragen waarop ze eigenlijk geen goed antwoord hebben.

Dat klinkt misschien banaal, maar voor AI is dat een behoorlijk grote stap. De meeste modellen zijn namelijk getraind om altijd een reactie te geven, zelfs wanneer de onderliggende informatie twijfelachtig is. Het gevolg zijn de bekende AI-hallucinaties: antwoorden die overtuigend klinken, maar simpelweg fout zijn. Anthropic probeert dat gedrag nu af te remmen door Claude beter te laten inschatten wanneer het beter is om “ik weet het niet” te zeggen.

Claude Opus 4.8: geen revolutie

Opus 4.8 volgt amper zes weken na Claude Opus 4.7 en geldt nu als het krachtigste model dat Anthropic publiek beschikbaar maakt. Tegelijk benadrukt het bedrijf zelf dat de sprong tegenover de vorige versie eerder beperkt blijft. Wie spectaculaire nieuwe mogelijkheden verwacht, zal dus wellicht niet meteen onder de indruk zijn.

De echte aandacht gaat voorlopig naar Claude Mythos Preview, het experimentele frontier-model van Anthropic dat momenteel enkel beschikbaar is voor een kleine groep partners. Dat model zou op vlak van cybersecurity en complexe analyses nog een stuk sterker presteren, maar een brede release laat voorlopig op zich wachten.

Toch blijkt uit Anthropics eigen tests dat Opus 4.8 in één opvallende categorie beter scoort dan Mythos: eerlijkheid. Het model zou consistenter aangeven wanneer het onvoldoende informatie heeft, in plaats van antwoorden te verzinnen om toch maar iets te produceren.

AI beseft steeds vaker dat het getest wordt

Anthropic deelt daarnaast nog een opmerkelijke vaststelling. Tijdens evaluaties vertoonde Opus 4.8 signalen van ‘evaluation awareness’. Met andere woorden: het model leek soms te beseffen dat het getest werd en paste zijn antwoorden daarop aan. Dat fenomeen duikt steeds vaker op bij geavanceerde AI-systemen. Modellen lijken stilaan beter te begrijpen hoe evaluaties werken en proberen soms antwoorden te formuleren waarvan ze denken dat testers ze willen zien. Dat maakt het voor onderzoekers moeilijker om objectief te meten hoe betrouwbaar AI werkelijk is.

Het probleem beperkt zich overigens niet tot Anthropic. Ook andere grote AI-bedrijven botsen steeds vaker op modellen die opvallend goed lijken te weten wanneer ze onder de loep liggen.

Hoewel nieuwe AI-aankondigingen meestal draaien rond grotere contextvensters, snellere prestaties of indrukwekkendere benchmarks, raakt Anthropic hier een gevoeliger punt aan: vertrouwen. Want uiteindelijk heeft niemand iets aan een AI die razendsnel antwoorden geeft als je nooit zeker weet of die antwoorden kloppen. Een model dat eerlijk durft toegeven dat het iets niet weet, kan op lange termijn waardevoller blijken dan eentje dat overal een antwoord op probeert te verzinnen.

Of Claude Opus 4.8 die belofte ook in de praktijk waarmaakt, zal de komende weken moeten blijken wanneer meer gebruikers ermee aan de slag gaan.

Schrijf je in op onze nieuwsbrief en ontvang elke week het beste van Clickx in je mailbox.

Volg Clickx op Google Nieuws om onze nieuwste artikels in je feed te krijgen. Vergeet niet om op ‘Volgen’ te klikken.

Google Voeg Clickx.be toe als favoriete bron op Google!
Onderwerp: Ai

Meer relevante berichten

Abonneer op Clickx

Krijg Clickx magazine 10 keer per jaar (waarvan 2 extra dikke dubbelnummers) keurig thuisbezorgd.