Anthropic Advisor Strategy : Optimisez vos coûts et performances avec Claude
L'évolution rapide des LLM impose un dilemme : privilégier la puissance d'un modèle comme Claude Opus, ou la rapidité et l'économie d'un modèle plus léger comme Haiku ? Anthropic change la donne avec la stratégie Advisor (Conseiller).
Cette approche couple l'intelligence d'Opus avec l'efficacité de Sonnet ou Haiku : un modèle "exécuteur" peu coûteux gère les tâches routinières et ne fait appel au "conseiller" (Opus) que pour les réflexions complexes.
Le concept et la structure des coûts ▶ 0:00
La stratégie repose sur un constat : la plupart des tâches d'un agent IA ne nécessitent pas une puissance maximale à chaque étape. Si seule une étape sur trois requiert un raisonnement de haut niveau, utiliser Opus partout gaspille des ressources.
Côté tarification ▶ 1:35 : Opus coûte 5 en sortie, Sonnet 3 $ / 15 / 5 $. Avec la stratégie Advisor, la majorité de la génération de texte est déplacée vers Haiku ou Sonnet, réservant les jetons onéreux d'Opus à la prise de décision critique. La stratégie est disponible via l'API Messages ▶ 2:16, avec le paramètre max_uses pour limiter les interventions de l'Advisor.
Démonstration : Comparaison des performances ▶ 4:12
Un tableau de bord de support client a été testé avec différentes configurations. Sur des questions simples comme "Quelles sont vos heures d'ouverture ?", Haiku répond seul efficacement. Utiliser Opus pour cette même question coûte 21 fois plus cher pour un résultat quasi identique.

Sur des requêtes complexes impliquant des retours de produits sous conditions, la dynamique change. Anecdote marquante : Sonnet, utilisé comme exécuteur, a choisi d'appeler l'Advisor Opus là où Haiku pensait pouvoir gérer seul. Le résultat Sonnet + Opus était nettement plus nuancé, prouvant que le modèle intermédiaire possède une meilleure "conscience" de ses propres limites.
Optimiser Claude Code avec "Opus Plan" ▶ 10:31
Dans Claude Code, la commande /model opus plan utilise Opus pour la planification (compréhension du problème, architecture) et bascule sur Sonnet pour l'exécution du code, plus rapide et économe.

L'impact financier est massif ▶ 13:59. Sur 10 000 requêtes mensuelles (70 % faciles, 20 % moyennes, 10 % difficiles) : jusqu'à 85 % d'économie par rapport à Opus Solo, et environ 23 % par rapport à Sonnet Solo, tout en bénéficiant de l'intelligence d'Opus sur les tâches complexes.
Conclusion
La stratégie Advisor marque une étape majeure : on passe d'une utilisation "force brute" à une orchestration intelligente des ressources. Performances proches d'Opus au prix de Haiku, contrôle via max_uses, et mode opus plan dans Claude Code pour maximiser vos sessions. Encore en bêta, cette fonctionnalité représente l'avenir de l'IA assistée : une intelligence distribuée où chaque centime dépensé apporte une valeur réelle.