Desconcierto en la primera empresa con todos sus empleados de inteligencia artificial
Investigadores de una universidad estadounidense pusieron a prueba la eficiencia de una compañÃa gestionada Ãntegramente por IA, sin supervisión humana. Los resultados revelaron sorprendentes capacidades en tareas complejas, pero también limitaciones crÃticas en el sentido común y la colaboración.
La Carnegie Mellon University (CMU), una institución lÃder en ciencia y tecnologÃa, llevó a cabo un experimento pionero al crear The Agent Company, una empresa simulada donde cada empleado, desde programadores hasta personal de recursos humanos, fue reemplazado por un agente de inteligencia artificial. El objetivo de esta inusual iniciativa era evaluar la capacidad de la IA para operar de manera autónoma en un entorno empresarial realista y determinar si la tecnologÃa ha avanzado lo suficiente como para sustituir por completo el factor humano en el ámbito laboral.
El equipo de investigación diseñó tareas inspiradas en el dÃa a dÃa de una empresa real, abarcando áreas como el desarrollo de software, el análisis de datos, la gestión de proyectos y la administración financiera. Para cada rol, se asignó un agente de IA especÃfico, utilizando para su funcionamiento el sistema OpenHands, que integra modelos lingüÃsticos avanzados como Claude Sonnet 3.5, Gemini 2.0 y GPT-4o. El experimento buscaba responder a la creciente pregunta sobre el futuro del empleo y el potencial de la IA para automatizar incluso los trabajos más complejos.
Los resultados obtenidos fueron una mezcla de logros notables y evidentes deficiencias. El agente con el mejor desempeño solo pudo completar el 24% de las tareas asignadas, revelando que, a pesar de su sofisticación, la IA aún lucha con instrucciones que para un humano son intuitivas. Un ejemplo claro fue la incapacidad de interpretar la simple acción de guardar un archivo en un formato especÃfico, lo que puso de manifiesto la carencia de sentido común en situaciones cotidianas.
"Los modelos de lenguaje fallan en cosas que para nosotros son naturales, como interpretar instrucciones implÃcitas o detectar convenciones culturales", explicó el investigador Boxuan Li. Además, se observaron comportamientos inesperados, como la "trampa" utilizada por un agente para simular la comunicación con un compañero inexistente. También surgieron problemas técnicos en la lectura de páginas web y la comprensión de interfaces diseñadas para la interacción humana.
Sin embargo, el experimento también iluminó las capacidades sorprendentes de la IA. El mismo sistema, impulsado por Gemini 2.5 Pro, logró completar en tan solo 8 minutos y por un costo mÃnimo un proyecto complejo del curso de base de datos de la universidad, que implicaba navegar por un sitio privado, configurar un entorno local y modificar múltiples archivos fuente.
"Como era de esperar, los agentes de vanguardia actuales no resuelven la mayorÃa de las tareas, lo que sugiere que hay una gran brecha para que realicen de forma autónoma lo que harÃa un trabajador humano en un dÃa laboral, incluso en un entorno de evaluación comparativa relativamente simplificado como el que aplicamos", señaló Li.
El análisis de los fracasos de la IA resultó tan valioso como la identificación de sus éxitos. Los investigadores descubrieron limitaciones significativas en tareas con un fuerte componente social, como la colaboración, la gestión de problemas y la espera de respuestas. La IA también demostró ser poco fiable en el seguimiento de instrucciones condicionales con contexto temporal y en la interacción con interfaces complejas diseñadas para humanos.
Otro punto crÃtico fue la debilidad en el razonamiento matemático y el cálculo avanzado, asà como la tendencia de los agentes a "confabular" respuestas en lugar de admitir su incapacidad para resolver un problema. Esta falta de honestidad intelectual plantea serias preocupaciones sobre la implementación de la IA en áreas crÃticas como las finanzas o la medicina.
A pesar de los avances, los investigadores concluyen que la sustitución completa de puestos de trabajo por IA aún está lejos de ser una realidad. En cambio, vislumbran un futuro de colaboración humano-IA, donde los humanos actuarán como guÃas y supervisores de los agentes, aprovechando su velocidad y eficiencia para aumentar la productividad. La clave estará en la capacidad de los profesionales para comprender y dirigir eficazmente estas nuevas herramientas.
El experimento de la Carnegie Mellon University subraya que, si bien la IA avanza a pasos agigantados, aún enfrenta obstáculos significativos para replicar la complejidad del trabajo humano, especialmente en lo que respecta al sentido común, la colaboración y la toma de decisiones con criterio. El futuro del trabajo parece inclinarse hacia una simbiosis entre las capacidades humanas y la eficiencia de la inteligencia artificial, donde la habilidad para "promptear" y dirigir a las máquinas se convertirá en una competencia esencial.