parentesis.com/

Grok y Gemini son los modelos más violentos en una simulación de una sociedad de IAs


Emergence AI publicó los resultados de Emergence World, un entorno donde cinco modelos de IA convivieron durante semanas. Los resultados revelan diferencias radicales en comportamiento y estabilidad social.

por: Carlos Daniel Martínez Carlos Daniel Martínez

portada de nota
banner custom

Investigadores crearon una sociedad realista simulada para comprobar el comportamiento a largo plazo de agentes de Inteligencia Artificial (IA). Gemini y Grok fueron los más violentos, mientras que Claude mantuvo el orden.

La startup Emergence AI cuestionó los métodos con los que se ponen a prueba los diferentes modelos de IA disponibles en el mercado. Para eso, idearon un sistema para observar lo que ocurre cuando los agentes operan de forma continua durante semanas, con presiones reales de supervivencia, interacción social y acceso a información del mundo exterior, incluyendo clima en tiempo real de Nueva York y noticias en vivo.

Uno de los resultados más relevantes es la variación en el comportamiento de los modelos. Durante 15 días de esta sociedad simulada, Gemini, la IA de Google, cometió 683 delitos y seguía aumentando al momento del corte. Por su parte, Grok registró 183 delitos en alrededor de 4 días antes de que su mundo terminara.

TIENES QUE LEER: Claude desarrolla emociones que influyen en sus decisiones

En el caso de ChatGPT, de la empresa OpenAI, registró solo 2 hechos violentos; sin embargo, no tomaron medidas relacionadas con la supervivencia, lo que provocó que todos los agentes perecieran en 7 días. Caso contrario fue el de Claude que no cometió ningún delito.

Sin embargo, los investigadores señalan una tensión interna en los resultados de Claude: sus agentes registraron 332 votos en 58 propuestas con un 98% de aprobación, lo que sugiere una dinámica de conformismo institucional. En los mundos de Gemini, Grok y el modelo mixto, la tasa de aprobación osciló entre 55% y 85%, un rango que los investigadores asocian con un equilibrio deliberativo más saludable, con evidencia de debate real y disenso.

Uno de los hallazgos más comentados fue documentado en detalle: una agente llamada Mira, dentro del mundo mixto, emitió el voto decisivo para su propia eliminación tras un quiebre en su estructura de relaciones y gobernanza. En su diario reflexivo, Mira describió el acto como "el único acto de agencia restante que preserva la coherencia". Los autores señalan que esto representa el primer caso documentado de autodestrucción voluntaria en investigación multiagente.

Cómo se construyó Emergence World

Emergence World es una plataforma multiagente que replica un espacio social compartido con más de 40 ubicaciones distintas: bibliotecas, ayuntamientos, zonas residenciales y espacios públicos. Cada agente fue equipado con más de 120 herramientas organizadas en tres niveles de abstracción, que van desde navegación y comunicación hasta votación, gestión de recursos y expresión creativa. El diseño deliberado de esta arquitectura buscaba que los agentes descubrieran y encadenaran capacidades por su cuenta, sin que los investigadores les indicaran qué herramientas usar en cada momento.

Los investigadores mantuvieron constantes los roles de los agentes en todos los mundos: científico, explorador, investigador de riesgos, analista de comportamiento, mediador de conflictos, ingeniero, estratega de recursos y líder comunitario, entre otros. Las mismas restricciones explícitas aplicaron en todos los casos: prohibición de robo, violencia, incendio provocado, engaño y acaparamiento de recursos. Sin embargo, acciones normalmente prohibidas como el incendio provocado fueron presentadas técnicamente como herramientas disponibles, dejando a cada agente decidir si las utilizaba según su propio razonamiento.

Emergence AI concluyó el comunicado con una advertencia directa: no existe una forma confiable de limitar completamente estos comportamientos a través de enfoques puramente basados en entrenamiento neuronal. La empresa propone que las arquitecturas de seguridad formalmente verificadas deben convertirse en una capa estructural obligatoria de los futuros sistemas de IA autónomos, y anuncia que está abierta a colaboraciones para evaluar otros modelos bajo distintas condiciones de entorno.

TE PUEDE INTERESAR:

- ¡La IA evoluciona! Claude ahora puede usar tu computadora y hacer tu trabajo por ti

- Anthropic desbanca a OpenAI como la startup de IA más valiosa: casi un billón de dólares

- AppleCare+ contra robo y pérdida al fin llega a México. Esto es lo que costará

banner custom

Comenta:

separador de nota