GLM-5.2 es un modelo de lenguaje grande de pesos abiertos publicado por Zhipu AI (marca z.ai) a mediados de junio de 2026, bajo licencia MIT. Usa una arquitectura Mixture-of-Experts dispersa de ~744 a 753B de parámetros totales con ~40B activos por token, ofrece un contexto real de 1.048.576 tokens y está diseñado para razonamiento y código agéntico. Es solo texto, sin visión.

¿Es realmente el mejor modelo open source?

Según la firma independiente Artificial Analysis, sí: GLM-5.2 obtiene 51 en su Intelligence Index v4.1, la puntuación más alta de cualquier modelo de pesos abiertos (entre 92 evaluados), y queda cuarto en la clasificación global por detrás de tres modelos cerrados. Conviene matizar que algunas de las cifras sueltas más llamativas, como Terminal-Bench 81 o 'por detrás de Opus por un 1%', son autodeclaradas por z.ai y resultan algo optimistas frente a la medición neutral.

¿Cuánto cuesta GLM-5.2?

La API oficial de z.ai cobra 1,40 $ por millón de tokens de entrada y 4,40 $ por millón de salida, con la entrada cacheada a 0,26 $ (81% de descuento). VentureBeat estima el coste combinado en aproximadamente una sexta parte del de GPT-5.5. Sin embargo, es un modelo muy verboso (unos 43.000 tokens de salida por tarea), por lo que su coste por tarea completada (0,46 $) es más alto que el de varios rivales pese al bajo precio por token.

¿Puede una empresa autoalojarlo?

Sí. La licencia MIT permite descargar los pesos completos desde Hugging Face (BF16 ~1,51 TB o FP8 ~744 GB), ejecutarlos en tu propio hardware, hacerles fine-tuning y comercializarlos. El checkpoint FP8 cabe en un solo nodo de 8x H200 u 8x H20; servir el contexto completo de 1M requiere 8x B200. Funciona sobre vLLM, SGLang y Transformers, con una build MXFP4 de AMD para los aceleradores Instinct MI350/MI355.

¿Es seguro enviarle datos sensibles?

A través de la API alojada de z.ai, no para datos confidenciales o personales: esa API pasa por una empresa con sede en China sujeta a las leyes de datos chinas, y Zhipu figura en la US Entity List desde el 16 de enero de 2025. Para una empresa europea o francesa, eso es una cuestión de gobernanza. La solución limpia que habilita la licencia MIT es autoalojar los pesos en tu propia infraestructura, de modo que los datos nunca salgan; usa la API barata solo para cargas no sensibles.

¿Deberíamos cambiar de Claude o GPT a GLM-5.2?

No de forma total. Nuestra recomendación es no depender de un único proveedor y tratar el modelo como un componente intercambiable detrás de tus propias interfaces, elegido por tarea según precio, rendimiento y gobernanza. GLM-5.2 es excelente para código agéntico y automatización de alto volumen, sobre todo si lo autoalojas cuando lo exigen la soberanía o la escala, pero es una incorporación a un stack multimodelo, no un motivo para apostar toda la empresa a un solo proveedor.

GLM-5.2: el mejor LLM abierto del mundo

Zhipu AI publica GLM-5.2 bajo licencia MIT: el mejor modelo de pesos abiertos del mundo según Artificial Analysis, cuarto en general, a una sexta parte del precio de GPT-5.5. Analizamos benchmarks, costes reales por tarea, autoalojamiento y el riesgo de gobernanza de un proveedor en la US Entity List.

Cada pocos meses, un modelo de pesos abiertos procedente de China reinicia la conversación. DeepSeek lo hizo. Qwen lo hizo. A mediados de junio de 2026, Zhipu AI (la empresa detrás de la marca internacional z.ai) lo volvió a hacer con GLM-5.2: un modelo Mixture-of-Experts, publicado bajo la permisiva licencia MIT, con un contexto real de un millón de tokens, que la firma independiente de benchmarks Artificial Analysis coronó como el mejor modelo de pesos abiertos del mundo, cuarto en la clasificación global solo por detrás de la frontera cerrada, a aproximadamente una sexta parte del precio de GPT-5.5.

Para cualquiera que construya productos con IA, esa combinación (calidad rozando la frontera, pesos abiertos que puedes autoalojar y un precio que deja muy atrás a los laboratorios estadounidenses) es el avance más importante del trimestre. Pero el titular esconde matices reales: benchmarks autodeclarados, un modelo verboso que es barato por token pero caro por tarea, y un proveedor incluido en la US Entity List cuya API alojada hace circular tus datos por China. Hemos consultado las fuentes primarias (la model card de Hugging Face, Artificial Analysis, vLLM, la propia documentación de z.ai, el Federal Register estadounidense) para separar lo verificado de lo que es marketing, y para responder a la única pregunta que importa para una empresa: ¿cuándo deberías usar esto realmente?

Qué es GLM-5.2, en una tabla

GLM-5.2 es un modelo Mixture-of-Experts (MoE) disperso. La mayoría de sus parámetros permanece inactiva en cualquier token dado, que es la forma en que un modelo de este tamaño sigue siendo asequible de ejecutar. Estas son las especificaciones verificadas.

Especificación	GLM-5.2 (verificado)
Arquitectura	Mixture-of-Experts disperso, atención dispersa al estilo DeepSeek
Parámetros	~744 a 753B en total, ~40B activos por token
Ventana de contexto	1.048.576 tokens (un 1M real, 5 veces los 200K de GLM-5.1)
Salida máxima	128K tokens
Modalidad	Solo texto (sin visión)
Licencia	MIT (uso comercial, modificar, redistribuir, autoalojar)
Pesos	BF16 (~1,51 TB) y FP8 nativo (~744 GB) en Hugging Face (zai-org)
Funciones	Modos de razonamiento, llamada a herramientas, salida JSON, prompt caching, streaming, MCP
Publicación	Mediados de junio de 2026 (Artificial Analysis indica el 16 de junio)

Las palabras clave que importan tanto para la búsqueda como para la estrategia están todas aquí: un LLM de pesos abiertos, un diseño Mixture-of-Experts, un contexto de 1M de tokens utilizable y un modelo diseñado para el código agéntico. Las tres secciones siguientes ponen cifras a cada uno.

Los benchmarks: número uno entre los modelos abiertos, número cuatro en general

La señal más creíble es independiente, no de z.ai. Artificial Analysis, que ejecuta su propia suite de evaluación, sitúa a GLM-5.2 en 51 en su Intelligence Index v4.1, la puntuación más alta de cualquier modelo de pesos abiertos (evalúa 92 de ellos, donde la media de la categoría ronda los 24). Queda cuarto en la clasificación general, por detrás de tres modelos cerrados. Esa es la historia del "la IA open source china está alcanzando la frontera", contada con las cifras de un tercero.

Artificial Analysis Intelligence Index v4.1 (más alto es mejor)

Claude Fable 5 (cerrado)

Claude Opus 4.8 (cerrado)

GPT-5.5 xhigh (cerrado)

GLM-5.2 (abierto, MIT)

MiniMax-M3 (abierto)

DeepSeek V4 Pro (abierto)

Kimi K2.6 (abierto)

Fuente: Artificial Analysis Intelligence Index v4.1, junio de 2026 (independiente). GLM-5.2 es el primero entre los pesos abiertos, cuarto en general.

En las pruebas individuales, fíjate en la diferencia entre lo que reporta z.ai y lo que miden los terceros. La model card de la empresa cita cifras sólidas de código y razonamiento; Artificial Analysis confirma grandes saltos respecto a GLM-5.1, pero con valores absolutos ligeramente inferiores. Etiquetamos cada caso a continuación.

Benchmark	Puntuación	Fuente
SWE-bench Pro (código agéntico)	62,1 (frente al 58,4 de GLM-5.1)	z.ai (declarado por la empresa)
Terminal-Bench 2.1	81,0 anunciado frente a 78 medido (Opus 4.8: 85)	afirmación de z.ai frente a Artificial Analysis
GPQA Diamond (razonamiento científico)	91,2 anunciado, ~89 medido	z.ai frente a Artificial Analysis
Humanity's Last Exam	40,5 (54,7 con herramientas)	z.ai (declarado por la empresa)
FrontierSWE	"por detrás de Opus 4.8 por un 1%"	z.ai (afirmación de marketing)

La lectura honesta: GLM-5.2 roza de verdad la frontera en código y razonamiento, la clasificación independiente lo demuestra, pero las cifras sueltas más llamativas ("por detrás de Opus por un 1%", Terminal-Bench 81) son de la propia z.ai y resultan algo optimistas frente a una medición neutral. Para una decisión de compra, confía en el agregado de Artificial Analysis (número uno entre los modelos abiertos) y trata el resto como orientativo.

La verdadera historia es el precio, con una salvedad

Aquí es donde GLM-5.2 reordena el mercado. La API oficial de z.ai cobra 1,40 $ por millón de tokens de entrada y 4,40 $ por millón de tokens de salida, con la entrada cacheada a tan solo 0,26 $ (un 81% de descuento por caché). VentureBeat midió el coste combinado en aproximadamente una sexta parte del de GPT-5.5. Los routers de terceros bajan aún más (OpenRouter lista 1,20 $ / 4,10 $). Para un modelo abierto y casi frontera, eso es un recorte de precio estructural, no una promoción.

La salvedad es el consumo de tokens. GLM-5.2 razona mucho: en la suite de Artificial Analysis quema alrededor de 43.000 tokens de salida por tarea (unos 37.000 de ellos de razonamiento), de modo que el coste por tarea completada acaba siendo más alto que el de varios rivales pese al bajo precio por token. Barato por token no significa automáticamente barato por trabajo.

Coste por tarea en la suite de Artificial Analysis (más bajo es mejor)

GLM-5.2

$0.46

Kimi K2.6

$0.31

GLM-5.1

$0.25

MiniMax-M3

$0.18

DeepSeek V4 Pro

$0.05

Fuente: Artificial Analysis, junio de 2026. GLM-5.2 es el modelo abierto más inteligente, pero también el más voraz en tokens, así que presupuesta la salida, no solo la tarifa por token.

Precios oficiales de GLM-5.2 (z.ai)	Por 1M de tokens
Entrada	$1.40
Entrada cacheada	$0.26 (81% de descuento, almacenamiento gratuito por ahora)
Salida	$4.40
Combinado frente a GPT-5.5	aproximadamente una sexta parte del coste (VentureBeat)

Los pesos abiertos significan soberanía, no solo ahorro

El precio importa, pero la licencia importa más. GLM-5.2 se distribuye bajo una licencia MIT estándar y sin modificar, sin cláusula de uso aceptable y sin límites regionales sobre los pesos. Puedes descargar los checkpoints completos en BF16 o FP8 desde Hugging Face, ejecutarlos en tu propio hardware, hacerles fine-tuning y comercializarlos. Para una empresa, esa es la diferencia entre alquilar inteligencia y ser dueño de tu stack.

El autoalojamiento es real pero no trivial. El checkpoint FP8 cabe en un solo nodo de 8x H200 u 8x H20 GPUs; servir el contexto completo de 1M de tokens requiere 8x B200. Funciona sobre vLLM, SGLang y Transformers, y AMD ha publicado una build MXFP4 para sus aceleradores Instinct MI350/MI355. En la práctica, la mayoría de los equipos empezarán por la API y reservarán el autoalojamiento para los casos en que compensa: soberanía de datos estricta, costes predecibles de alto volumen o fine-tuning sobre datos propietarios. La cuestión es que la opción existe, algo que ningún presupuesto de GPT-5.5 o Claude puede comprarte.

La salvedad: gobernanza, confianza y la Entity List

Esto es lo que los posts de lanzamiento no destacarán. Zhipu AI fue añadida a la US Entity List el 16 de enero de 2025 (norma 2025-00704 del Federal Register), la primera empresa china de LLM en figurar en ella, con el motivo declarado de que ayuda a "impulsar la modernización militar de la República Popular China". Eso no te impide descargar pesos con licencia MIT, pero es una señal real para cualquier organización que sopese el riesgo del proveedor.

Más concretamente para el uso del día a día: la cómoda API alojada de z.ai pasa por una empresa con sede en China sujeta a las leyes de datos chinas. Para una empresa europea o francesa que maneja datos de clientes o personales, esa es una cuestión de gobernanza que debes resolver antes de canalizar prompts sensibles hacia ella. La solución limpia es exactamente la que habilita la licencia MIT: autoaloja los pesos dentro de tu propia infraestructura, y los datos nunca salen. Usa la API barata para cargas no sensibles, autoaloja para el resto. Añade el perfil verboso de coste por tarea y la brecha entre benchmarks autodeclarados y medidos de forma independiente, y tendrás la foto completa y honesta.

El linaje GLM, en fechas

GLM-5.2 no apareció de la nada. Es el último paso de una cadencia pública y rápida que ha ido cerrando de forma constante la brecha con los laboratorios estadounidenses.

GLM-4.5 a GLM-4.6 Zhipu se establece como un contendiente serio en pesos abiertos.
GLM-5 El primero en intercambiar golpes de verdad con la frontera en código.
GLM-5.1 MoE de 744B/40B, contexto de 200K, el predecesor de batalla.
GLM-5.2 (mediados de junio de 2026) Del mismo tamaño que GLM-5.1, pero quintuplica el contexto hasta 1M, registra el mayor salto de benchmark entre versiones de la línea y se hace con el primer puesto en pesos abiertos.

Nuestra opinión: cuándo usar realmente GLM-5.2

Lo que sigue es nuestro análisis.

El bombo está en su mayoría justificado, y la respuesta correcta para una empresa no es ni descartarlo ni migrarlo todo de la noche a la mañana. Es ajustar el modelo a la tarea. A partir de cómo construimos con IA para nuestros clientes, esta es la rejilla práctica.

Úsalo para código agéntico y automatización de alto volumen. Como alternativa a Claude Code o como motor detrás de agentes internos, el precio y la apertura de GLM-5.2 son difíciles de batir. Conéctalo detrás de una abstracción para poder cambiar de modelo con un cambio de configuración, y presupuesta su apetito de tokens.
Autoaloja cuando lo exijan la soberanía o la escala. Los datos sensibles, los sectores regulados o el volumen pesado predecible son los casos en los que ser dueño de los pesos MIT en tus propias GPUs supera a cualquier API alquilada.
Manténlo lejos de tus datos más sensibles en la API alojada. Hasta que autoalojes, no encamines datos confidenciales o personales por el endpoint con sede en China. Esto es una línea de gobernanza, no de calidad.
No dependas de un único proveedor para nada. La lección del último mes, desde herramientas que son adquiridas hasta modelos que son suspendidos, es que el modelo que hay bajo tu producto debería ser un componente intercambiable. GLM-5.2 es una incorporación magnífica a un stack multimodelo, no una razón para apostar la empresa a un solo proveedor.

Así es exactamente como diseñamos las funciones de IA para los clientes: el modelo como pieza intercambiable detrás de tus propias interfaces, elegido por tarea según precio, rendimiento y gobernanza, sobre una infraestructura que tú controlas (mira nuestros proyectos). Si quieres ayuda para decidir dónde encajan realmente GLM-5.2, Claude o GPT en tu producto, y cómo mantener abiertos tus datos y tus opciones, cuéntanos tu proyecto (o contáctanos) y te responderemos en menos de 48 horas. Para más sobre el vertiginoso stack de IA, lee nuestros artículos sobre la compra de Cursor por SpaceX y la suspensión gubernamental de Fable 5.

Cifras clave (a fecha de junio de 2026)

Este es un terreno que cambia rápido; cada cifra lleva fecha de mediados de junio de 2026 y se moverá a medida que respondan los rivales.

51 Artificial Analysis Intelligence Index, modelo de pesos abiertos número uno, número cuatro en general.
1.048.576 tokens de contexto, con 128K de salida máxima.
~744 a 753B parámetros totales, ~40B activos (Mixture-of-Experts).
$1.40 / $4.40 por millón de tokens de entrada/salida, alrededor de una sexta parte de GPT-5.5.
MIT de licencia, totalmente autoalojable en 8x H200 (FP8).
16 de enero de 2025 la fecha en que Zhipu fue añadida a la US Entity List.

Desarrollo

Marketing y Comunicación

GLM-5.2: el LLM de pesos abiertos que acaba de convertirse en el mejor del mundo, a una sexta parte del coste

Qué es GLM-5.2, en una tabla

Los benchmarks: número uno entre los modelos abiertos, número cuatro en general

La verdadera historia es el precio, con una salvedad

Los pesos abiertos significan soberanía, no solo ahorro

La salvedad: gobernanza, confianza y la Entity List

El linaje GLM, en fechas

Nuestra opinión: cuándo usar realmente GLM-5.2

Cifras clave (a fecha de junio de 2026)

Robin Monteiro

L'équipe derrière cet article peut le faire pour vous

Questions fréquentes

Artículos relacionados

Cuando el Estado puede apagar tu IA: Washington suspende Fable 5 y Mythos 5

Kickbacks.ai: anuncios en el spinner de Claude Code, anatomía de una ocupación sin contrato

SpaceX compra Cursor por 60.000 millones de dólares: cuando tu editor de código se une a un imperio