ACTUALIDAD

Desconcierto en la primera empresa con todos sus empleados de inteligencia artificial

Investigadores de una universidad estadounidense pusieron a prueba la eficiencia de una compañía gestionada íntegramente por IA, sin supervisión humana. Los resultados revelaron sorprendentes capacidades en tareas complejas, pero también limitaciones críticas en el sentido común y la colaboración.

La Carnegie Mellon University (CMU), una institución líder en ciencia y tecnología, llevó a cabo un experimento pionero al crear The Agent Company, una empresa simulada donde cada empleado, desde programadores hasta personal de recursos humanos, fue reemplazado por un agente de inteligencia artificial. El objetivo de esta inusual iniciativa era evaluar la capacidad de la IA para operar de manera autónoma en un entorno empresarial realista y determinar si la tecnología ha avanzado lo suficiente como para sustituir por completo el factor humano en el ámbito laboral.

El equipo de investigación diseñó tareas inspiradas en el día a día de una empresa real, abarcando áreas como el desarrollo de software, el análisis de datos, la gestión de proyectos y la administración financiera. Para cada rol, se asignó un agente de IA específico, utilizando para su funcionamiento el sistema OpenHands, que integra modelos lingüísticos avanzados como Claude Sonnet 3.5, Gemini 2.0 y GPT-4o. El experimento buscaba responder a la creciente pregunta sobre el futuro del empleo y el potencial de la IA para automatizar incluso los trabajos más complejos.

Los resultados obtenidos fueron una mezcla de logros notables y evidentes deficiencias. El agente con el mejor desempeño solo pudo completar el 24% de las tareas asignadas, revelando que, a pesar de su sofisticación, la IA aún lucha con instrucciones que para un humano son intuitivas. Un ejemplo claro fue la incapacidad de interpretar la simple acción de guardar un archivo en un formato específico, lo que puso de manifiesto la carencia de sentido común en situaciones cotidianas.

"Los modelos de lenguaje fallan en cosas que para nosotros son naturales, como interpretar instrucciones implícitas o detectar convenciones culturales", explicó el investigador Boxuan Li. Además, se observaron comportamientos inesperados, como la "trampa" utilizada por un agente para simular la comunicación con un compañero inexistente. También surgieron problemas técnicos en la lectura de páginas web y la comprensión de interfaces diseñadas para la interacción humana.

Sin embargo, el experimento también iluminó las capacidades sorprendentes de la IA. El mismo sistema, impulsado por Gemini 2.5 Pro, logró completar en tan solo 8 minutos y por un costo mínimo un proyecto complejo del curso de base de datos de la universidad, que implicaba navegar por un sitio privado, configurar un entorno local y modificar múltiples archivos fuente.

"Como era de esperar, los agentes de vanguardia actuales no resuelven la mayoría de las tareas, lo que sugiere que hay una gran brecha para que realicen de forma autónoma lo que haría un trabajador humano en un día laboral, incluso en un entorno de evaluación comparativa relativamente simplificado como el que aplicamos", señaló Li.

El análisis de los fracasos de la IA resultó tan valioso como la identificación de sus éxitos. Los investigadores descubrieron limitaciones significativas en tareas con un fuerte componente social, como la colaboración, la gestión de problemas y la espera de respuestas. La IA también demostró ser poco fiable en el seguimiento de instrucciones condicionales con contexto temporal y en la interacción con interfaces complejas diseñadas para humanos.

Otro punto crítico fue la debilidad en el razonamiento matemático y el cálculo avanzado, así como la tendencia de los agentes a "confabular" respuestas en lugar de admitir su incapacidad para resolver un problema. Esta falta de honestidad intelectual plantea serias preocupaciones sobre la implementación de la IA en áreas críticas como las finanzas o la medicina.

A pesar de los avances, los investigadores concluyen que la sustitución completa de puestos de trabajo por IA aún está lejos de ser una realidad. En cambio, vislumbran un futuro de colaboración humano-IA, donde los humanos actuarán como guías y supervisores de los agentes, aprovechando su velocidad y eficiencia para aumentar la productividad. La clave estará en la capacidad de los profesionales para comprender y dirigir eficazmente estas nuevas herramientas.

El experimento de la Carnegie Mellon University subraya que, si bien la IA avanza a pasos agigantados, aún enfrenta obstáculos significativos para replicar la complejidad del trabajo humano, especialmente en lo que respecta al sentido común, la colaboración y la toma de decisiones con criterio. El futuro del trabajo parece inclinarse hacia una simbiosis entre las capacidades humanas y la eficiencia de la inteligencia artificial, donde la habilidad para "promptear" y dirigir a las máquinas se convertirá en una competencia esencial.

Esta nota habla de: