Problema
La conversacion sobre IA suele tratar la capacidad como si fuera una linea continua: este modelo es mejor que el anterior, este benchmark sube, esta tarea ya se puede automatizar, esta otra aun no.
En la practica no funciona asi. Dos tareas que parecen igual de dificiles para una persona pueden caer en lados opuestos de la capacidad del modelo. Una se resuelve con calidad sorprendente. La otra produce una respuesta convincente, pero equivocada.
Ese patron se conoce como frontera dentada. Y en 2026 es una idea mas importante que nunca porque los agentes no solo responden: actuan.
Tesis
Antes de automatizar, cada equipo deberia dibujar su mapa de frontera dentada.
No basta con preguntar “puede la IA hacer esto”. Hay que preguntar: en que variantes lo hace bien, en cuales parece hacerlo bien pero falla, que señales anticipan el fallo, y donde debe parar antes de ejecutar.
La frontera dentada convierte la gobernanza en trabajo concreto. No es un comite diciendo “cuidado con la IA”; es una matriz de tareas, errores, pruebas y limites operativos.
Framework
Mapea cada workflow en cuatro zonas:
- Zona verde: tareas repetibles, verificables y con bajo coste de error.
- Zona amarilla: tareas utiles con revision humana ligera.
- Zona roja: tareas donde una respuesta plausible puede causar daño operativo.
- Zona gris: tareas donde aun no hay evidencia suficiente para decidir.
Mini-caso: un agente puede resumir tickets y extraer entidades con buen rendimiento. Tambien puede proponer politicas de reembolso en casos excepcionales. Ambas parecen tareas de texto, pero no pertenecen a la misma zona. La primera se valida contra datos. La segunda mezcla criterio, excepciones, riesgo legal y experiencia de cliente.
Senal medible: porcentaje de fallos detectados antes de ejecucion frente a fallos descubiertos por cliente, usuario o equipo posterior.
Postura: automatizar sin mapa de frontera es delegar no solo trabajo, sino desconocimiento.
Por que importa ahora
El estudio de Harvard Business School y BCG sobre la frontera dentada mostro una paradoja: dentro de la frontera, los participantes con IA completaron mas tareas, mas rapido y con mayor calidad; fuera de ella, fueron menos propensos a producir soluciones correctas que quienes no usaban IA.
En marzo de 2026, Harvard volvio sobre la investigacion tras su publicacion formal en Organization Science. La leccion sigue siendo incomoda: la IA no solo ayuda o falla. A veces ayuda justo lo suficiente para que el fallo parezca profesional.
Stanford HAI, en su AI Index 2026, tambien subraya problemas de gobernanza, transparencia y alucinacion. El contexto no es “la IA no sirve”; es que los sistemas necesitan evaluacion situada, no fe general en el modelo.
Anti-ejemplo
“El benchmark dice que el modelo es bueno en razonamiento, asi que puede tomar esta decision.”
Un benchmark general no describe tu frontera local. Tu proceso tiene datos incompletos, excepciones, politicas internas, sistemas heredados, clientes reales y consecuencias. La frontera dentada no se compra en una ficha tecnica; se descubre en ejecucion controlada.
Protocolo (3 pasos)
- Lista variantes, no tareas. “Responder tickets” no es una tarea; reembolso simple, fraude potencial y cliente enterprise son variantes distintas.
- Fuerza casos frontera. Prueba ambiguedad, datos contradictorios, instrucciones incompletas y excepciones raras.
- Define parada automatica. Si aparece una senal roja, el agente debe escalar, no improvisar.
| Zona | Ejemplo | Control minimo |
|---|---|---|
| verde | clasificar ticket repetible | muestreo y metricas |
| amarilla | redactar respuesta sensible | revision ligera |
| roja | aprobar excepcion economica | humano responsable |
| gris | nuevo proceso sin historico | piloto cerrado |
Relacionado
- Agent Reliability Score: como saber si un agente merece autonomia
- AI Governance Backlog: convertir riesgo en trabajo ejecutable
- Rollback Design for AI Workflows: como apagar automatizaciones sin romper la operacion
Fuentes consultadas
- Harvard D3: Navigating the Jagged Technological Frontier
- Harvard D3: Back to the Beginnings of AI at Work
- Stanford HAI: 2026 AI Index Report, Responsible AI
Proximo paso
Elige un proceso que quieras automatizar y no hagas una prueba generica. Construye veinte variantes: diez faciles, cinco ambiguas, tres raras y dos peligrosas. Ahi empieza tu mapa real.