Actualité : Claude : Anthropic sort Opus 4.8 en trombe et annonce une énorme surprise dans les semaines à venir

il y a 1 day 7

Publicité, votre contenu continue ci-dessous

41 jours après le flop d'Opus 4.7, Anthropic revient avec une version corrigée

Publié le 29/05/26 à 07h31

Nos réseaux :

Ajoutez nous à vos favoris Google

Anthropic vient de lancer Claude Opus 4.8, une mise à jour de son modèle phare qui arrive seulement six semaines après Opus 4.7. Un rythme inhabituel pour l'entreprise, qui semble avoir entendu les critiques sur la version précédente. Le modèle est disponible dès aujourd'hui, au même prix.

Anthropic sort Opus 4.8 en trombe et annonce une énorme surprise dans les semaines à venir

Opus 4.7, sorti le 16 avril, avait reçu un accueil mitigé. Plusieurs développeurs et testeurs avaient signalé des problèmes de verbosité excessive, des appels d'outils maladroits et une tendance à affirmer des choses sans les étayer. Scott Wu, CEO de Devin, le résume sans détour dans le communiqué officiel d'Anthropic : “Il corrige les problèmes de verbosité des commentaires et d'appels d'outils que nous avions constatés avec Opus 4.7.”

La réponse d'Anthropic est donc arrivée en 41 jours. Claude Opus 4.8 est disponible depuis ce 28 mai sur claude.ai, via l'API (identifiant : claude-opus-4-8) et chez les partenaires cloud (AWS, Google Cloud, Microsoft Foundry). Le tarif reste inchangé : 5 dollars par million de tokens en entrée, 25 dollars en sortie.

L'honnêteté comme principal axe de progression

Les premiers testeurs rapportent qu'Opus 4.8 est plus enclin à signaler les incertitudes dans son travail et moins susceptible de faire des affirmations non étayées.

Un mot revient bizarrement partout dans le communiqué : “honnête”. Anthropic affirme qu'Opus 4.8 est environ quatre fois moins susceptible qu'Opus 4.7 de laisser passer des erreurs dans le code qu'il produit sans les signaler. Le modèle est aussi plus enclin à exprimer ses incertitudes et à refuser d'avancer quand il manque d'éléments, là où les versions précédentes avaient tendance à foncer.

Taux de comportements désalignés (tromperie, coopération avec des usages abusifs) mesuré par Anthropic sur ses modèles. Opus 4.8 (en orange, à droite) retombe au niveau de Mythos Preview, le modèle le mieux aligné de l'entreprise, après un Opus 4.7 nettement plus problématique.

Côté benchmarks, Opus 4.8 progresse sur le coding agentique, le raisonnement multidisciplinaire, l'utilisation autonome d'un ordinateur et l'analyse financière. Sur le benchmark légal de Thomson Reuters (CoCounsel), le modèle enregistre le score le plus élevé jamais obtenu par un modèle Claude.

Le nouveau modèle d'Anthropic domine sur six des sept benchmarks présentés, à l'exception du coding en terminal où GPT-5.5 conserve l'avantage.

Trois nouveautés qui accompagnent le modèle

Anthropic lance en parallèle plusieurs fonctionnalités. La plus notable est Dynamic Workflows dans Claude Code : le modèle peut désormais planifier une tâche, lancer des centaines de sous-agents en parallèle, puis vérifier les résultats avant de rendre la main. Selon Anthropic, cette capacité permet de mener des migrations de code sur des centaines de milliers de lignes, du lancement jusqu'au merge. La fonctionnalité est disponible pour les plans Enterprise, Team et Max.

Fait notable, un contrôle d'effort fait aussi son apparition sur claude.ai : les abonnés peuvent choisir l'intensité de réflexion du modèle, du mode rapide (réponses plus courtes, consommation réduite, nommé Low) au mode maximal (Max) pour les tâches complexes. Anthropic affirme aussi que le mode rapide d'Opus 4.8 est 2,5 fois plus véloce (et trois fois moins cher) que sur les modèles précédents.

Et la surprise annoncée ? Anthropic prépare enfin l'ouverture au grand public de Mythos, son modèle le plus puissant, jusqu'ici réservé à un cercle restreint d'organisations pour des travaux de cybersécurité. L'entreprise promet une disponibilité générale "dans les semaines à venir". Si les benchmarks d'Opus 4.8 impressionnent déjà, Mythos joue dans une autre catégorie.

Suivez toute l'actualité des Numériques sur Google Actualités et sur la chaîne WhatsApp des Numériques

Envie de faire encore plus d'économies ? Découvrez nos codes promo sélectionnés pour vous.

Publications qui peuvent vous intéresser

Lire l’article en entier