Godi.AI
Blog
18 juin 20267 min de lecture

Dans l'app, l'IA augmente ; en production, elle automatise — les données, pas le débat

Le débat augmenter-vs-remplacer a une réponse dans les données d'usage d'Anthropic : ce que vous obtenez dépend de la surface, pas du modèle. AEI v5, global, fenêtre de 7 jours.


Le constat

Il y a un débat permanent : l'IA augmente-t-elle les gens ou les remplace-t-elle ? Anthropic publie un jeu de données qui le tranche sans bruit — l'Anthropic Economic Index, une ventilation respectueuse de la vie privée de l'usage réel de Claude. J'ai pris la dernière version et l'ai séparée en deux : l'app de chat grand public (claude.ai) face au trafic de l'API de première partie. Ce que font les individus dans le navigateur, face à ce que les entreprises mettent en production.

Même modèle. Comportement opposé. Dans l'app, 54% de l'usage classifié est de l'augmentation — des gens qui itèrent, apprennent et valident avec le modèle. Via l'API, 80% est de l'automatisation — directif, on délègue, souvent en un seul appel. La question "augmenter vs remplacer" n'est pas une propriété du modèle. C'est une propriété de l'endroit où vous le déployez.

Ce que disent les données

La répartition, app de chat puis API de production (part de l'usage classifié) :

  • Automatisation : 45,5% → 79,7%
  • Augmentation : 54,5% → 20,3%
  • Interactions directives : 33% → 58%
  • Autonomie moyenne de l'IA (0–5) : 3,41 → 2,69
  • Appels en un seul coup ("none") : 3% → 15%
  • Concentration du top-3 des cas d'usage : 33% → 51%

Deux choses de plus ressortent. La production est concentrée là où le grand public est en longue traîne : trois cas d'usage représentent la moitié de tout le trafic API — développement logiciel (15,5%), construction et déploiement de systèmes ML/IA (14,7%), extraction et structuration de données (9,6%). Le grand public se répartit entre devoirs, rédaction, tâches du quotidien, santé et finances. Et l'autonomie en production est plus basse (2,69 vs 3,41) — contre-intuitif, jusqu'à comprendre qu'on ne délègue entièrement que ce qu'on peut cadrer.

Pourquoi le mode bascule

L'augmentation a besoin d'un humain dans la boucle qui réagit à chaque sortie. L'app de chat est faite exactement pour ça — vous lisez, vous contestez, vous itérez. L'API est faite pour sortir l'humain de la boucle — la sortie part vers un autre système ou une action. Donc le même modèle, avec le même type de demandes, atterrit comme copilote dans le navigateur et comme processus en production. C'est la surface qui décide, pas le modèle.

Pourquoi c'est important si vous budgétez de l'IA

  • Les habitudes dans l'app ne prédisent pas le comportement en production. Voir votre équipe tirer de la valeur de Claude dans le navigateur (augmentation) dit peu de ce que fera un déploiement par API (automatisation) — autre risque, autre coût, autre question de ROI.
  • L'automatisation a un autre modèle de défaillance. Un copilote tolère "assez bon, je corrigerai". Un processus qui tourne sans humain exige "correct, ou rattrapé" — évals, garde-fous, un plan de repli. Les données le montrent : les équipes s'auto-sélectionnent, elles n'automatisent que ce qu'elles peuvent cadrer.
  • La valeur se concentre. La moitié de l'IA en production, ce sont trois métiers : code, systèmes ML, extraction de données. Si votre cas n'est pas assez structuré pour être délégué, vous construisez peut-être un copilote en l'appelant agent.
  • Ça rejoint le coût. L'automatisation, c'est la moitié headless, celle qui tourne sans surveillance — exactement l'usage pour lequel la facturation API au compteur est conçue. C'est la ligne qui compte pour les fournisseurs quand ils tarifient l'usage "non interactif".

Quoi faire — selon votre cas

  • Vous évaluez l'IA depuis l'app de chat : n'extrapolez pas. Pilotez la vraie surface de production avant de budgéter.
  • Vous déployez un copilote (un humain lit chaque sortie) : optimisez la vitesse d'itération et la confiance. Économie d'augmentation.
  • Vous déployez de l'automatisation (pas d'humain dans la boucle) : investissez d'abord dans les évals, les garde-fous et un plan de repli — et mesurez. C'est là que vivent le coût surprise et l'erreur surprise.
  • Vous ne savez pas lequel vous construisez : comptez les contacts humains par sortie. Zéro contact = automatisation : planifiez, testez et budgétez en conséquence.

Ce que cette analyse ne mesure PAS

  • La répartition d'usage (part des conversations/enregistrements) — pas le volume, le revenu ou la valeur.
  • Une seule fenêtre de 7 jours (2026-02-05 au 02-12), pas une moyenne annuelle.
  • L'API de première partie d'Anthropic uniquement — exclut Bedrock, Vertex et Foundry.
  • Le "not classified" de production représente 21,5% des enregistrements (vs 5,9% grand public) ; les métriques de concentration se renormalisent sans lui. Les 15% de "none" sont rapportés à part, pas fondus dans l'automatisation.
  • Elle ne dit rien du ROI, du taux de réussite ou de la qualité du code.

Méthodologie

Source : Anthropic Economic Index v5 (release 2026-03-24), CSV bruts de huggingface.co/datasets/Anthropic/EconomicIndex, lignes globales uniquement. Taxonomie d'Anthropic : automatisation = directif + boucle de feedback ; augmentation = itération + apprentissage + validation. La "part du classifié" exclut "none" et "not classified". Le script Python qui transforme les fichiers bruts en cette ventilation est dans le dossier du run — relancez-le sur le jeu de données vous-même.

Prochaine étape

Si vous êtes sur le point de budgéter un déploiement d'IA sans savoir si vous financez un copilote ou un processus, cette distinction est tout l'enjeu — elle fixe votre risque, votre coût et votre métrique de succès. Un diagnostic de 15 minutes sur godi.ai/audit-ia-quick associe votre cas au bon côté avant que vous ne dépensiez. Questions : [email protected].

Prêt à automatiser ?

Diagnostic gratuit de 15 minutes. On analyse vos processus et on vous dit si un agent IA a du sens.

In the chat app AI augments; in production it automates — the data, not the debate | Godi.AI