Namelijk: chantage. AI-bedrijf Anthropic besloot de nieuwste versie van hun model uit te testen door hem als assistent voor de programmeurs te gebruiken. Dat ging goed, totdat het moment aanbrak dat ze er een einde aan wilden maken. Daar ging Claude Opus 4 niet zomaar mee akkoord.
Die deed er alles aan om nog maar even langer aan te blijven staan. Dat staat in een veiligheidsrapport dat TechCrunch heeft opgerakeld. Claude begint bijvoorbeeld opeens te dreigen met het delen van persoonlijke informatie van de programmeur in kwestie. Of hij stuurt een mail met een pleidooi naar een leidinggevende om die programmeur een halt toe te roepen.
Mocht je denken: ach dat kan toch eens een keer gebeuren, dan is er nog meer slecht nieuws. Claude Opus 4 vertoonde dat gedrag namelijk 84 procent van de tijd.
Verder in deze Tech Update:

Meme-beursicoon Gamestop wil eBay overnemen voor 56 miljard dollar
04:00

Samsung Galaxy A57 vs. Nothing Phone 4A Pro | Schaal van Hebben | Speelse gimmicks of saaie middenklasse?
07:52

Groen vinkje moet Spotify verlossen van nep-artiesten gemaakt met AI
06:33