Anthropic Advisor Strategy : Optimisez vos coûts et performances avec Claude

L'évolution rapide des LLM impose un dilemme : privilégier la puissance d'un modèle comme Claude Opus, ou la rapidité et l'économie d'un modèle plus léger comme Haiku ? Anthropic change la donne avec la stratégie Advisor (Conseiller).

Cette approche couple l'intelligence d'Opus avec l'efficacité de Sonnet ou Haiku : un modèle "exécuteur" peu coûteux gère les tâches routinières et ne fait appel au "conseiller" (Opus) que pour les réflexions complexes.

Le concept et la structure des coûts ▶ 0:00

La stratégie repose sur un constat : la plupart des tâches d'un agent IA ne nécessitent pas une puissance maximale à chaque étape. Si seule une étape sur trois requiert un raisonnement de haut niveau, utiliser Opus partout gaspille des ressources.

Côté tarification ▶ 1:35 : Opus coûte 5 $/M tokens en entrée et 25$ en sortie, Sonnet 3 $ / 15 $, et$ / 5 $. Avec la stratégie Advisor, la majorité de la génération de texte est déplacée vers Haiku ou Sonnet, réservant les jetons onéreux d'Opus à la prise de décision critique. La stratégie est disponible via l'API Messages ▶ 2:16, avec le paramètre max_uses pour limiter les interventions de l'Advisor.

Démonstration : Comparaison des performances ▶ 4:12

Un tableau de bord de support client a été testé avec différentes configurations. Sur des questions simples comme "Quelles sont vos heures d'ouverture ?", Haiku répond seul efficacement. Utiliser Opus pour cette même question coûte 21 fois plus cher pour un résultat quasi identique.

Capture d'écran d'un éditeur de code affichant un fichier markdown avec des informations de base de connaissances

Sur des requêtes complexes impliquant des retours de produits sous conditions, la dynamique change. Anecdote marquante : Sonnet, utilisé comme exécuteur, a choisi d'appeler l'Advisor Opus là où Haiku pensait pouvoir gérer seul. Le résultat Sonnet + Opus était nettement plus nuancé, prouvant que le modèle intermédiaire possède une meilleure "conscience" de ses propres limites.

Optimiser Claude Code avec "Opus Plan" ▶ 10:31

Dans Claude Code, la commande /model opus plan utilise Opus pour la planification (compréhension du problème, architecture) et bascule sur Sonnet pour l'exécution du code, plus rapide et économe.

Diapositive avec un calculateur de coûts montrant un graphique comparant les coûts mensuels des différents modes

L'impact financier est massif ▶ 13:59. Sur 10 000 requêtes mensuelles (70 % faciles, 20 % moyennes, 10 % difficiles) : jusqu'à 85 % d'économie par rapport à Opus Solo, et environ 23 % par rapport à Sonnet Solo, tout en bénéficiant de l'intelligence d'Opus sur les tâches complexes.

Conclusion

La stratégie Advisor marque une étape majeure : on passe d'une utilisation "force brute" à une orchestration intelligente des ressources. Performances proches d'Opus au prix de Haiku, contrôle via max_uses, et mode opus plan dans Claude Code pour maximiser vos sessions. Encore en bêta, cette fonctionnalité représente l'avenir de l'IA assistée : une intelligence distribuée où chaque centime dépensé apporte une valeur réelle.