La respuesta corta: ninguna de las grandes consultoras está usando los modelos open-source que revisamos antes (AI-MM SET, AIDMM, Whitesmith). Todas han desarrollado frameworks propios, aunque con enfoques muy distintos. Solo BCG tiene un modelo explícitamente diseñado para coding; las demás operan a nivel organizacional y luego lo aterrizan. Veamos cada una en detalle.
BCG es la firma que más directamente ha abordado el tema de madurez en AI-assisted coding, con dos frameworks complementarios:
Inspirado explícitamente en los niveles de conducción autónoma de la industria automotriz, BCG X define 5 niveles de autonomía en coding:[1]
| Nivel | Nombre | % Código AI | Rol del Humano |
|---|---|---|---|
| L0 | Luddite | 0% | Rechaza AI activamente |
| L1 | Chat-Overflow | ~0% | Usa AI como buscador inteligente (reemplaza Google/Stack Overflow) |
| L2 | Copy and Complete | <20% | Acepta autocompletado y snippets, edita |
| L3 | Feature Editor | >50% | Genera features completas, humano revisa y orquesta |
| L4 | Full Agentic ("Vibe Coder") | ~100% | Humano es prompt engineer / creative director y reviewer de PRs |
BCG hace una observación clave para tu equipo: saltar directo a L4 no es realista ni aconsejable. Recomiendan coaching gradual en L1-L2, experimentación controlada en L3 (sandboxed), y pilotos selectos en L4. Mencionan explícitamente a Claude Code como herramienta agentic y enfatizan que "los prompts deben ser escritos como instrucciones a un senior developer".[1]
En un estudio separado basado en encuestas a desarrolladores de software, BCG identificó 5 etapas de adopción individual:[2]
El dato más revelador: más del 85% de los desarrolladores encuestados permanecen en las etapas 2 y 3, y menos del 10% ha llegado a la etapa 4. BCG además identifica 5 personas (Champion, Independent Explorer, Organizational Adopter, Passive Observer, Cautious Skeptic) que necesitan estrategias de adopción diferenciadas — un concepto directamente aplicable a tu radar como complemento diagnóstico.[2]
McKinsey eligió un camino diferente. En vez de definir niveles de madurez, su estudio reciente de ~300 empresas identificó qué hacen diferente los top performers (quintil superior), articulado como "2 Shifts + 3 Enablers":[3]