Anthropic Advisor Strategy : Optimisez vos coûts et performances avec Claude Opus, Sonnet et Haiku

L'évolution rapide des LLM impose un dilemme constant : privilégier la puissance d'un modèle comme Claude Opus, ou la rapidité et l'économie d'un modèle plus léger comme Haiku ? Anthropic change la donne avec la stratégie Advisor (Conseiller).

Cette approche couple l'intelligence supérieure d'Opus avec l'efficacité de Sonnet ou Haiku : un modèle "exécuteur" peu coûteux gère les tâches routinières et ne fait appel au "conseiller" (Opus) que lorsqu'une réflexion complexe est nécessaire.

Le concept et la structure des coûts ▶ 0:00

La stratégie repose sur un constat pragmatique : la plupart des tâches d'un agent IA ne nécessitent pas une puissance maximale à chaque étape. Si seule une étape sur trois requiert un raisonnement de haut niveau, utiliser Opus partout revient à gaspiller des ressources.

Pour saisir l'intérêt financier, regardons la tarification ▶ 1:35 :

Claude Opus : 5 $/M tokens en entrée / 25$ en sortie.
Claude Sonnet : 3 $/M en entrée / 15$ en sortie.
Claude Haiku : 1 $/M en entrée / 5$ en sortie.

Capture d'écran d'un éditeur de code Visual Studio Code montrant la structure d'un projet avec des fichiers comme app.py et CLAUDE.md

Avec la stratégie Advisor, la majorité de la génération de texte (la partie la plus coûteuse) est déplacée vers Haiku ou Sonnet, réservant les jetons onéreux d'Opus à la prise de décision critique. C'est une optimisation chirurgicale du budget IA.

Démonstration : Comparaison des performances ▶ 4:12

Un tableau de bord de support client ("TechFlow Support") a été testé avec différentes configurations. Sur des questions simples comme "Quelles sont vos heures d'ouverture ?", Haiku répond seul efficacement. Utiliser Opus seul pour cette même question coûte 21 fois plus cher pour un résultat quasi identique.

Capture d'écran d'un éditeur de code affichant le fichier claude.md avec du markdown sur les heures d'ouverture et un objet JSON de base de connaissances

Sur des requêtes complexes impliquant des retours de produits sous conditions, la dynamique change. Une anecdote marquante : Sonnet, utilisé comme exécuteur, a choisi d'appeler l'Advisor Opus là où Haiku pensait pouvoir gérer seul. Le résultat Sonnet + Opus était nettement plus nuancé, prouvant que le modèle intermédiaire possède une meilleure "conscience" de ses propres limites. Le choix de l'exécuteur influence directement la pertinence du recours au conseiller.

La stratégie est disponible via l'API Messages ▶ 2:16, avec un contrôle total grâce au paramètre max_uses qui limite les interventions de l'Advisor pour maîtriser les coûts.

Optimiser Claude Code avec "Opus Plan" ▶ 10:31

Dans Claude Code, chaque modèle consomme une partie de votre limite de session. L'astuce : la commande /model opus plan. Ce mode utilise Opus 4.6 pour la planification (compréhension du problème, architecture) et bascule sur Sonnet pour l'exécution du code, plus rapide et économe.

Diapositive avec un calculateur de coûts interactif montrant un slider de répartition des tâches et un graphique comparant les coûts mensuels des différents modes

L'impact financier est massif ▶ 13:59. Sur 10 000 requêtes mensuelles (70 % faciles, 20 % moyennes, 10 % difficiles) : jusqu'à 85 % d'économie par rapport à Opus Solo, et environ 23 % par rapport à Sonnet Solo, tout en bénéficiant de l'intelligence d'Opus sur les tâches complexes.

Conclusion

La stratégie Advisor marque une étape majeure : on passe d'une utilisation "force brute" à une orchestration intelligente des ressources.

Efficacité : Performances proches d'Opus au prix de Haiku.
Contrôle : max_uses bride la consommation de tokens premium.
Hybridation : Le mode opus plan dans Claude Code maximise vos sessions sans sacrifier la qualité.

Encore en bêta, cette fonctionnalité représente l'avenir de l'IA assistée : une intelligence distribuée de manière optimale, où chaque centime dépensé apporte une valeur réelle.