Anthropic Advisor Strategy : Optimisez vos coûts et performances avec Claude Opus, Sonnet et Haiku
L'évolution rapide des LLM impose un dilemme constant : privilégier la puissance d'un modèle comme Claude Opus, ou la rapidité et l'économie d'un modèle plus léger comme Haiku ? Anthropic change la donne avec la stratégie Advisor (Conseiller).
Cette approche couple l'intelligence supérieure d'Opus avec l'efficacité de Sonnet ou Haiku : un modèle "exécuteur" peu coûteux gère les tâches routinières et ne fait appel au "conseiller" (Opus) que lorsqu'une réflexion complexe est nécessaire.
Le concept et la structure des coûts ▶ 0:00
La stratégie repose sur un constat pragmatique : la plupart des tâches d'un agent IA ne nécessitent pas une puissance maximale à chaque étape. Si seule une étape sur trois requiert un raisonnement de haut niveau, utiliser Opus partout revient à gaspiller des ressources.
Pour saisir l'intérêt financier, regardons la tarification ▶ 1:35 :
- Claude Opus : 5 en sortie.
- Claude Sonnet : 3 en sortie.
- Claude Haiku : 1 en sortie.

Avec la stratégie Advisor, la majorité de la génération de texte (la partie la plus coûteuse) est déplacée vers Haiku ou Sonnet, réservant les jetons onéreux d'Opus à la prise de décision critique. C'est une optimisation chirurgicale du budget IA.
Démonstration : Comparaison des performances ▶ 4:12
Un tableau de bord de support client ("TechFlow Support") a été testé avec différentes configurations. Sur des questions simples comme "Quelles sont vos heures d'ouverture ?", Haiku répond seul efficacement. Utiliser Opus seul pour cette même question coûte 21 fois plus cher pour un résultat quasi identique.

Sur des requêtes complexes impliquant des retours de produits sous conditions, la dynamique change. Une anecdote marquante : Sonnet, utilisé comme exécuteur, a choisi d'appeler l'Advisor Opus là où Haiku pensait pouvoir gérer seul. Le résultat Sonnet + Opus était nettement plus nuancé, prouvant que le modèle intermédiaire possède une meilleure "conscience" de ses propres limites. Le choix de l'exécuteur influence directement la pertinence du recours au conseiller.
La stratégie est disponible via l'API Messages ▶ 2:16, avec un contrôle total grâce au paramètre max_uses qui limite les interventions de l'Advisor pour maîtriser les coûts.
Optimiser Claude Code avec "Opus Plan" ▶ 10:31
Dans Claude Code, chaque modèle consomme une partie de votre limite de session. L'astuce : la commande /model opus plan. Ce mode utilise Opus 4.6 pour la planification (compréhension du problème, architecture) et bascule sur Sonnet pour l'exécution du code, plus rapide et économe.

L'impact financier est massif ▶ 13:59. Sur 10 000 requêtes mensuelles (70 % faciles, 20 % moyennes, 10 % difficiles) : jusqu'à 85 % d'économie par rapport à Opus Solo, et environ 23 % par rapport à Sonnet Solo, tout en bénéficiant de l'intelligence d'Opus sur les tâches complexes.
Conclusion
La stratégie Advisor marque une étape majeure : on passe d'une utilisation "force brute" à une orchestration intelligente des ressources.
- Efficacité : Performances proches d'Opus au prix de Haiku.
- Contrôle :
max_usesbride la consommation de tokens premium. - Hybridation : Le mode
opus plandans Claude Code maximise vos sessions sans sacrifier la qualité.
Encore en bêta, cette fonctionnalité représente l'avenir de l'IA assistée : une intelligence distribuée de manière optimale, où chaque centime dépensé apporte une valeur réelle.