Godi.AI
Blog
18 de junio de 20267 min de lectura

En la app la IA aumenta; en producción automatiza — los datos, no el debate

El debate aumentar-vs-reemplazar tiene respuesta en los propios datos de uso de Anthropic: cuál te toca depende de la superficie, no del modelo. AEI v5, global, ventana de 7 días.


El hallazgo

Existe una discusión permanente sobre si la IA aumenta a las personas o las reemplaza. Anthropic publica un dataset que la zanja sin ruido — el Anthropic Economic Index, un desglose con privacidad de cómo se usa Claude de verdad. Tomé la última versión y la separé en dos: la app de chat de consumo (claude.ai) frente al tráfico de la API de primera parte. Lo que hacen las personas en el navegador, frente a lo que las empresas llevan a producción.

Mismo modelo. Comportamiento opuesto. En la app, el 54% del uso clasificado es aumento — personas iterando, aprendiendo y validando con el modelo. Por la API, el 80% es automatización — directivo, delegar y olvidar, a menudo de un solo disparo. La pregunta "aumentar vs reemplazar" no es una propiedad del modelo. Es una propiedad de dónde lo despliegas.

Lo que dicen los datos

El reparto, app de chat y luego API de producción (cuota del uso clasificado):

  • Automatización: 45,5% → 79,7%
  • Aumento: 54,5% → 20,3%
  • Interacciones directivas: 33% → 58%
  • Autonomía media de la IA (0–5): 3,41 → 2,69
  • Llamadas de un solo disparo ("none"): 3% → 15%
  • Concentración del top-3 de casos de uso: 33% → 51%

Dos cosas más destacan. Producción está concentrada donde consumo es cola larga: tres casos de uso son la mitad de todo el tráfico de API — desarrollo de software (15,5%), construir y desplegar sistemas de ML/IA (14,7%) y extraer y estructurar datos (9,6%). El consumo se reparte entre tareas escolares, redacción, vida diaria, salud y finanzas. Y la autonomía en producción es menor (2,69 vs 3,41) — contraintuitivo hasta que entiendes que la gente solo delega del todo lo que puede acotar.

Por qué cambia el modo

El aumento necesita un humano en el bucle reaccionando a cada salida. La app de chat está hecha justo para eso — lees, rebates, iteras. La API está hecha para sacar al humano del bucle — la salida fluye a otro sistema o acción. Así que el mismo modelo, con el mismo tipo de peticiones, aterriza como copiloto en el navegador y como proceso en producción. Decide la superficie, no el modelo.

Por qué importa si presupuestas IA

  • Los hábitos en la app no predicen el comportamiento en producción. Ver a tu equipo sacar valor de Claude en el navegador (aumento) dice poco de lo que hará un despliegue por API (automatización) — otro riesgo, otro coste, otra pregunta de ROI.
  • La automatización tiene otro modelo de fallo. Un copiloto tolera "suficiente, ya lo arreglo". Un proceso que corre sin humano necesita "correcto, o atrapado" — evals, guardarraíles, un plan B. Los datos muestran que los equipos ya se autoseleccionan: solo automatizan lo que pueden acotar.
  • El valor se concentra. La mitad de la IA en producción son tres trabajos: código, sistemas de ML, extracción de datos. Si tu caso no está lo bastante estructurado para delegarlo, quizá estés construyendo un copiloto y llamándolo agente.
  • Conecta con el coste. La automatización es la mitad headless, la que corre sin que nadie mire — justo el uso para el que está hecha la facturación API medida. Es la línea que les importa a los proveedores cuando ponen precio al uso "no interactivo".

Qué hacer — según tu caso

  • Evalúas IA desde la app de chat: no extrapoles. Pilota la superficie real de producción antes de presupuestar.
  • Despliegas un copiloto (un humano lee cada salida): optimiza velocidad de iteración y confianza. Economía de aumento.
  • Despliegas automatización (sin humano en el bucle): invierte primero en evals, guardarraíles y un plan B — y mídelo. Ahí viven el coste sorpresa y el error sorpresa.
  • No sabes cuál construyes: cuenta los toques humanos por salida. Cero toques = automatización: planifica, prueba y presupuesta en consecuencia.

Lo que este análisis NO mide

  • Mezcla de uso (cuota de conversaciones/registros) — no volumen, ingresos ni valor.
  • Una sola ventana de 7 días (2026-02-05 a 02-12), no un promedio anual.
  • Solo la API de primera parte de Anthropic — excluye Bedrock, Vertex y Foundry.
  • El "not classified" de producción es el 21,5% de los registros (vs 5,9% en consumo); las métricas de concentración se renormalizan sin él. El 15% de "none" se reporta aparte, no se mete en automatización.
  • No dice nada de ROI, tasa de éxito ni calidad del código.

Metodología

Fuente: Anthropic Economic Index v5 (release 2026-03-24), CSVs crudos de huggingface.co/datasets/Anthropic/EconomicIndex, solo filas globales. Taxonomía de Anthropic: automatización = directivo + bucle de feedback; aumento = iteración + aprendizaje + validación. "Cuota de clasificado" excluye "none" y "not classified". El Python que convierte los archivos crudos en este desglose está en la carpeta del run — reejecútalo contra el dataset tú mismo.

Siguiente paso

Si estás a punto de presupuestar un despliegue de IA y no tienes claro si financias un copiloto o un proceso, esa distinción es todo el juego — fija tu riesgo, tu coste y tu métrica de éxito. Un diagnóstico de 15 minutos en godi.ai/audit-ia-quick mapea tu caso al lado correcto antes de gastar. Preguntas: [email protected].

¿Listo para automatizar?

Diagnóstico gratuito de 15 minutos. Analizamos tus procesos y te decimos si un agente IA tiene sentido.

In the chat app AI augments; in production it automates — the data, not the debate | Godi.AI