Cada pocos meses, un modelo de pesos abiertos procedente de China reinicia la conversación. DeepSeek lo hizo. Qwen lo hizo. A mediados de junio de 2026, Zhipu AI (la empresa detrás de la marca internacional z.ai) lo volvió a hacer con GLM-5.2: un modelo Mixture-of-Experts, publicado bajo la permisiva licencia MIT, con un contexto real de un millón de tokens, que la firma independiente de benchmarks Artificial Analysis coronó como el mejor modelo de pesos abiertos del mundo, cuarto en la clasificación global solo por detrás de la frontera cerrada, a aproximadamente una sexta parte del precio de GPT-5.5.
Para cualquiera que construya productos con IA, esa combinación (calidad rozando la frontera, pesos abiertos que puedes autoalojar y un precio que deja muy atrás a los laboratorios estadounidenses) es el avance más importante del trimestre. Pero el titular esconde matices reales: benchmarks autodeclarados, un modelo verboso que es barato por token pero caro por tarea, y un proveedor incluido en la US Entity List cuya API alojada hace circular tus datos por China. Hemos consultado las fuentes primarias (la model card de Hugging Face, Artificial Analysis, vLLM, la propia documentación de z.ai, el Federal Register estadounidense) para separar lo verificado de lo que es marketing, y para responder a la única pregunta que importa para una empresa: ¿cuándo deberías usar esto realmente?
Qué es GLM-5.2, en una tabla
GLM-5.2 es un modelo Mixture-of-Experts (MoE) disperso. La mayoría de sus parámetros permanece inactiva en cualquier token dado, que es la forma en que un modelo de este tamaño sigue siendo asequible de ejecutar. Estas son las especificaciones verificadas.
| Especificación | GLM-5.2 (verificado) |
|---|---|
| Arquitectura | Mixture-of-Experts disperso, atención dispersa al estilo DeepSeek |
| Parámetros | ~744 a 753B en total, ~40B activos por token |
| Ventana de contexto | 1.048.576 tokens (un 1M real, 5 veces los 200K de GLM-5.1) |
| Salida máxima | 128K tokens |
| Modalidad | Solo texto (sin visión) |
| Licencia | MIT (uso comercial, modificar, redistribuir, autoalojar) |
| Pesos | BF16 (~1,51 TB) y FP8 nativo (~744 GB) en Hugging Face (zai-org) |
| Funciones | Modos de razonamiento, llamada a herramientas, salida JSON, prompt caching, streaming, MCP |
| Publicación | Mediados de junio de 2026 (Artificial Analysis indica el 16 de junio) |
Las palabras clave que importan tanto para la búsqueda como para la estrategia están todas aquí: un LLM de pesos abiertos, un diseño Mixture-of-Experts, un contexto de 1M de tokens utilizable y un modelo diseñado para el código agéntico. Las tres secciones siguientes ponen cifras a cada uno.
Los benchmarks: número uno entre los modelos abiertos, número cuatro en general
La señal más creíble es independiente, no de z.ai. Artificial Analysis, que ejecuta su propia suite de evaluación, sitúa a GLM-5.2 en 51 en su Intelligence Index v4.1, la puntuación más alta de cualquier modelo de pesos abiertos (evalúa 92 de ellos, donde la media de la categoría ronda los 24). Queda cuarto en la clasificación general, por detrás de tres modelos cerrados. Esa es la historia del "la IA open source china está alcanzando la frontera", contada con las cifras de un tercero.
Artificial Analysis Intelligence Index v4.1 (más alto es mejor)
Fuente: Artificial Analysis Intelligence Index v4.1, junio de 2026 (independiente). GLM-5.2 es el primero entre los pesos abiertos, cuarto en general.
En las pruebas individuales, fíjate en la diferencia entre lo que reporta z.ai y lo que miden los terceros. La model card de la empresa cita cifras sólidas de código y razonamiento; Artificial Analysis confirma grandes saltos respecto a GLM-5.1, pero con valores absolutos ligeramente inferiores. Etiquetamos cada caso a continuación.
| Benchmark | Puntuación | Fuente |
|---|---|---|
| SWE-bench Pro (código agéntico) | 62,1 (frente al 58,4 de GLM-5.1) | z.ai (declarado por la empresa) |
| Terminal-Bench 2.1 | 81,0 anunciado frente a 78 medido (Opus 4.8: 85) | afirmación de z.ai frente a Artificial Analysis |
| GPQA Diamond (razonamiento científico) | 91,2 anunciado, ~89 medido | z.ai frente a Artificial Analysis |
| Humanity's Last Exam | 40,5 (54,7 con herramientas) | z.ai (declarado por la empresa) |
| FrontierSWE | "por detrás de Opus 4.8 por un 1%" | z.ai (afirmación de marketing) |
La lectura honesta: GLM-5.2 roza de verdad la frontera en código y razonamiento, la clasificación independiente lo demuestra, pero las cifras sueltas más llamativas ("por detrás de Opus por un 1%", Terminal-Bench 81) son de la propia z.ai y resultan algo optimistas frente a una medición neutral. Para una decisión de compra, confía en el agregado de Artificial Analysis (número uno entre los modelos abiertos) y trata el resto como orientativo.
La verdadera historia es el precio, con una salvedad
Aquí es donde GLM-5.2 reordena el mercado. La API oficial de z.ai cobra 1,40 $ por millón de tokens de entrada y 4,40 $ por millón de tokens de salida, con la entrada cacheada a tan solo 0,26 $ (un 81% de descuento por caché). VentureBeat midió el coste combinado en aproximadamente una sexta parte del de GPT-5.5. Los routers de terceros bajan aún más (OpenRouter lista 1,20 $ / 4,10 $). Para un modelo abierto y casi frontera, eso es un recorte de precio estructural, no una promoción.
La salvedad es el consumo de tokens. GLM-5.2 razona mucho: en la suite de Artificial Analysis quema alrededor de 43.000 tokens de salida por tarea (unos 37.000 de ellos de razonamiento), de modo que el coste por tarea completada acaba siendo más alto que el de varios rivales pese al bajo precio por token. Barato por token no significa automáticamente barato por trabajo.
Coste por tarea en la suite de Artificial Analysis (más bajo es mejor)
Fuente: Artificial Analysis, junio de 2026. GLM-5.2 es el modelo abierto más inteligente, pero también el más voraz en tokens, así que presupuesta la salida, no solo la tarifa por token.
| Precios oficiales de GLM-5.2 (z.ai) | Por 1M de tokens |
|---|---|
| Entrada | $1.40 |
| Entrada cacheada | $0.26 (81% de descuento, almacenamiento gratuito por ahora) |
| Salida | $4.40 |
| Combinado frente a GPT-5.5 | aproximadamente una sexta parte del coste (VentureBeat) |
Los pesos abiertos significan soberanía, no solo ahorro
El precio importa, pero la licencia importa más. GLM-5.2 se distribuye bajo una licencia MIT estándar y sin modificar, sin cláusula de uso aceptable y sin límites regionales sobre los pesos. Puedes descargar los checkpoints completos en BF16 o FP8 desde Hugging Face, ejecutarlos en tu propio hardware, hacerles fine-tuning y comercializarlos. Para una empresa, esa es la diferencia entre alquilar inteligencia y ser dueño de tu stack.
El autoalojamiento es real pero no trivial. El checkpoint FP8 cabe en un solo nodo de 8x H200 u 8x H20 GPUs; servir el contexto completo de 1M de tokens requiere 8x B200. Funciona sobre vLLM, SGLang y Transformers, y AMD ha publicado una build MXFP4 para sus aceleradores Instinct MI350/MI355. En la práctica, la mayoría de los equipos empezarán por la API y reservarán el autoalojamiento para los casos en que compensa: soberanía de datos estricta, costes predecibles de alto volumen o fine-tuning sobre datos propietarios. La cuestión es que la opción existe, algo que ningún presupuesto de GPT-5.5 o Claude puede comprarte.
La salvedad: gobernanza, confianza y la Entity List
Esto es lo que los posts de lanzamiento no destacarán. Zhipu AI fue añadida a la US Entity List el 16 de enero de 2025 (norma 2025-00704 del Federal Register), la primera empresa china de LLM en figurar en ella, con el motivo declarado de que ayuda a "impulsar la modernización militar de la República Popular China". Eso no te impide descargar pesos con licencia MIT, pero es una señal real para cualquier organización que sopese el riesgo del proveedor.
Más concretamente para el uso del día a día: la cómoda API alojada de z.ai pasa por una empresa con sede en China sujeta a las leyes de datos chinas. Para una empresa europea o francesa que maneja datos de clientes o personales, esa es una cuestión de gobernanza que debes resolver antes de canalizar prompts sensibles hacia ella. La solución limpia es exactamente la que habilita la licencia MIT: autoaloja los pesos dentro de tu propia infraestructura, y los datos nunca salen. Usa la API barata para cargas no sensibles, autoaloja para el resto. Añade el perfil verboso de coste por tarea y la brecha entre benchmarks autodeclarados y medidos de forma independiente, y tendrás la foto completa y honesta.
El linaje GLM, en fechas
GLM-5.2 no apareció de la nada. Es el último paso de una cadencia pública y rápida que ha ido cerrando de forma constante la brecha con los laboratorios estadounidenses.
- GLM-4.5 a GLM-4.6 Zhipu se establece como un contendiente serio en pesos abiertos.
- GLM-5 El primero en intercambiar golpes de verdad con la frontera en código.
- GLM-5.1 MoE de 744B/40B, contexto de 200K, el predecesor de batalla.
- GLM-5.2 (mediados de junio de 2026) Del mismo tamaño que GLM-5.1, pero quintuplica el contexto hasta 1M, registra el mayor salto de benchmark entre versiones de la línea y se hace con el primer puesto en pesos abiertos.
Nuestra opinión: cuándo usar realmente GLM-5.2
Lo que sigue es nuestro análisis.
El bombo está en su mayoría justificado, y la respuesta correcta para una empresa no es ni descartarlo ni migrarlo todo de la noche a la mañana. Es ajustar el modelo a la tarea. A partir de cómo construimos con IA para nuestros clientes, esta es la rejilla práctica.
- Úsalo para código agéntico y automatización de alto volumen. Como alternativa a Claude Code o como motor detrás de agentes internos, el precio y la apertura de GLM-5.2 son difíciles de batir. Conéctalo detrás de una abstracción para poder cambiar de modelo con un cambio de configuración, y presupuesta su apetito de tokens.
- Autoaloja cuando lo exijan la soberanía o la escala. Los datos sensibles, los sectores regulados o el volumen pesado predecible son los casos en los que ser dueño de los pesos MIT en tus propias GPUs supera a cualquier API alquilada.
- Manténlo lejos de tus datos más sensibles en la API alojada. Hasta que autoalojes, no encamines datos confidenciales o personales por el endpoint con sede en China. Esto es una línea de gobernanza, no de calidad.
- No dependas de un único proveedor para nada. La lección del último mes, desde herramientas que son adquiridas hasta modelos que son suspendidos, es que el modelo que hay bajo tu producto debería ser un componente intercambiable. GLM-5.2 es una incorporación magnífica a un stack multimodelo, no una razón para apostar la empresa a un solo proveedor.
Así es exactamente como diseñamos las funciones de IA para los clientes: el modelo como pieza intercambiable detrás de tus propias interfaces, elegido por tarea según precio, rendimiento y gobernanza, sobre una infraestructura que tú controlas (mira nuestros proyectos). Si quieres ayuda para decidir dónde encajan realmente GLM-5.2, Claude o GPT en tu producto, y cómo mantener abiertos tus datos y tus opciones, cuéntanos tu proyecto (o contáctanos) y te responderemos en menos de 48 horas. Para más sobre el vertiginoso stack de IA, lee nuestros artículos sobre la compra de Cursor por SpaceX y la suspensión gubernamental de Fable 5.
Cifras clave (a fecha de junio de 2026)
Este es un terreno que cambia rápido; cada cifra lleva fecha de mediados de junio de 2026 y se moverá a medida que respondan los rivales.
- 51 Artificial Analysis Intelligence Index, modelo de pesos abiertos número uno, número cuatro en general.
- 1.048.576 tokens de contexto, con 128K de salida máxima.
- ~744 a 753B parámetros totales, ~40B activos (Mixture-of-Experts).
- $1.40 / $4.40 por millón de tokens de entrada/salida, alrededor de una sexta parte de GPT-5.5.
- MIT de licencia, totalmente autoalojable en 8x H200 (FP8).
- 16 de enero de 2025 la fecha en que Zhipu fue añadida a la US Entity List.



