Skip to content
Go To Agency
/AI & Tech
AI & Tech

GLM-5.2: model z otwartymi wagami, który właśnie został najlepszy na świecie, za jedną szóstą ceny

GLM-5.2 od Zhipu AI to model z otwartymi wagami na licencji MIT, okrzyknięty najlepszym otwartym LLM na świecie, za około jedną szóstą ceny GPT-5.5. Analizujemy benchmarki, cenę, self-hosting i ryzyka governance.

Autor Robin Monteiro20 czerwca 20268 min · 1 669 mots
GLM-5.2LLM open-sourceZhipu AIMixture-of-Expertsself-hosting AI
Udostępnij artykuł
GLM-5.2: model z otwartymi wagami, który właśnie został najlepszy na świecie, za jedną szóstą ceny

Co kilka miesięcy jakiś model z otwartymi wagami pochodzący z Chin na nowo definiuje całą dyskusję. Zrobił to DeepSeek. Zrobił to Qwen. W połowie czerwca 2026 Zhipu AI (firma stojąca za międzynarodową marką z.ai) zrobiła to ponownie za sprawą GLM-5.2: modelu typu Mixture-of-Experts, wydanego na permisywnej licencji MIT, z prawdziwym kontekstem rzędu miliona tokenów, który niezależny ośrodek benchmarkowy Artificial Analysis okrzyknął najlepszym modelem z otwartymi wagami na świecie, czwartym w klasyfikacji ogólnej, ustępując jedynie zamkniętej czołówce, a wszystko to za mniej więcej jedną szóstą ceny GPT-5.5.

Dla każdego, kto buduje produkty oparte na AI, ta kombinacja (jakość bliska czołówce, otwarte wagi, które można hostować u siebie, oraz cena znacznie podcinająca amerykańskie laboratoria) jest najważniejszym wydarzeniem tego kwartału. Ale nagłówek skrywa realne zastrzeżenia: benchmarki podawane przez samego producenta, model rozwlekły, tani w przeliczeniu na token, lecz drogi w przeliczeniu na zadanie, oraz dostawcę z amerykańskiej US Entity List, którego hostowane API przepuszcza Twoje dane przez Chiny. Sięgnęliśmy do źródeł pierwotnych (karty modelu na Hugging Face, danych Artificial Analysis, vLLM, własnej dokumentacji z.ai, amerykańskiego Federal Register), aby oddzielić to, co zweryfikowane, od marketingu, i odpowiedzieć na jedyne pytanie, które dla firmy ma znaczenie: kiedy naprawdę warto tego użyć?

Czym jest GLM-5.2, w jednej tabeli

GLM-5.2 to rzadki (sparse) model typu Mixture-of-Experts (MoE). Większość jego parametrów pozostaje bezczynna przy przetwarzaniu danego tokenu, i właśnie dzięki temu model tej wielkości pozostaje przystępny w eksploatacji. Oto zweryfikowane specyfikacje.

SpecyfikacjaGLM-5.2 (zweryfikowane)
ArchitekturaRzadki Mixture-of-Experts, rzadka uwaga w stylu DeepSeek
Parametry~744 do 753B łącznie, ~40B aktywnych na token
Okno kontekstu1 048 576 tokenów (prawdziwy 1M, 5x więcej niż 200K w GLM-5.1)
Maksymalny wynik128K tokenów
ModalnośćTylko tekst (brak wizji)
LicencjaMIT (użycie komercyjne, modyfikacja, redystrybucja, self-hosting)
WagiBF16 (~1,51 TB) oraz natywny FP8 (~744 GB) na Hugging Face (zai-org)
FunkcjeTryby rozumowania, wywoływanie narzędzi, wyjście JSON, cache promptów, streaming, MCP
PremieraPołowa czerwca 2026 (Artificial Analysis podaje 16 czerwca)

Słowa kluczowe, które liczą się dla wyszukiwarek i dla strategii, są tu wszystkie: LLM z otwartymi wagami, konstrukcja Mixture-of-Experts, użyteczny kontekst 1M tokenów oraz model zaprojektowany pod agentowe kodowanie. Trzy kolejne sekcje opatrują każdy z tych punktów liczbami.

Benchmarki: numer jeden wśród modeli otwartych, numer cztery ogółem

Najbardziej wiarygodny sygnał jest niezależny, a nie pochodzi od z.ai. Artificial Analysis, który prowadzi własny zestaw ewaluacyjny, plasuje GLM-5.2 na poziomie 51 w swoim Intelligence Index v4.1, najwyżej spośród wszystkich modeli z otwartymi wagami (testuje ich 92, gdzie średnia w tej klasie wynosi około 24). Zajmuje czwarte miejsce ogółem, za trzema modelami zamkniętymi. To właśnie historia o tym, że "chińskie otwarte AI dogania czołówkę", opowiedziana liczbami strony trzeciej.

Artificial Analysis Intelligence Index v4.1 (wyżej znaczy lepiej)

Claude Fable 5 (zamknięty)
60
Claude Opus 4.8 (zamknięty)
56
GPT-5.5 xhigh (zamknięty)
55
GLM-5.2 (otwarty, MIT)
51
MiniMax-M3 (otwarty)
44
DeepSeek V4 Pro (otwarty)
44
Kimi K2.6 (otwarty)
43

Źródło: Artificial Analysis Intelligence Index v4.1, czerwiec 2026 (niezależny). GLM-5.2 jest pierwszy wśród modeli z otwartymi wagami, czwarty ogółem.

W pojedynczych testach warto zwracać uwagę na różnicę między tym, co podaje z.ai, a tym, co mierzą strony trzecie. Karta modelu firmy przytacza mocne wyniki w kodowaniu i rozumowaniu; Artificial Analysis potwierdza duże skoki względem GLM-5.1, ale z nieco niższymi wartościami bezwzględnymi. Poniżej oznaczamy każdy z nich.

BenchmarkWynikŹródło
SWE-bench Pro (agentowe kodowanie)62,1 (wzrost z 58,4 w GLM-5.1)z.ai (deklaracja firmy)
Terminal-Bench 2.181,0 deklarowane vs 78 zmierzone (Opus 4.8: 85)deklaracja z.ai vs Artificial Analysis
GPQA Diamond (rozumowanie naukowe)91,2 deklarowane, ~89 zmierzonez.ai vs Artificial Analysis
Humanity's Last Exam40,5 (54,7 z narzędziami)z.ai (deklaracja firmy)
FrontierSWE"ustępuje Opusowi 4.8 o 1%"z.ai (deklaracja marketingowa)

Uczciwa interpretacja: GLM-5.2 jest naprawdę blisko czołówki w kodowaniu i rozumowaniu, niezależny ranking to potwierdza, ale najbardziej efektowne pojedyncze liczby ("ustępuje Opusowi o 1%", Terminal-Bench 81) pochodzą od samego z.ai i wypadają odrobinę zawyżone względem neutralnego pomiaru. Przy decyzji zakupowej ufaj zagregowanemu wynikowi Artificial Analysis (numer jeden wśród modeli otwartych), a resztę traktuj jako orientacyjną.

Prawdziwą historią jest cena, z jednym haczykiem

To tutaj GLM-5.2 przestawia układ sił na rynku. Oficjalne API z.ai pobiera 1,40 dolara za milion tokenów wejściowych i 4,40 dolara za milion tokenów wyjściowych, przy zbuforowanym wejściu kosztującym jedynie 0,26 dolara (81% rabatu na cache). VentureBeat zmierzył mieszany koszt na poziomie mniej więcej jednej szóstej GPT-5.5. Routery stron trzecich schodzą jeszcze niżej (OpenRouter podaje 1,20 dolara / 4,10 dolara). Jak na otwarty model będący blisko czołówki, to strukturalna obniżka ceny, a nie promocja.

Haczykiem jest zużycie tokenów. GLM-5.2 to ciężki "myśliciel": w zestawie Artificial Analysis spala około 43 000 tokenów wyjściowych na zadanie (z czego około 37 000 to rozumowanie), więc koszt na ukończone zadanie wypada wyższy niż u kilku rywali, mimo niskiej ceny za token. Tani na token nie oznacza automatycznie taniego na zadanie.

Koszt na zadanie w zestawie Artificial Analysis (niżej znaczy lepiej)

GLM-5.2
$0.46
Kimi K2.6
$0.31
GLM-5.1
$0.25
MiniMax-M3
$0.18
DeepSeek V4 Pro
$0.05

Źródło: Artificial Analysis, czerwiec 2026. GLM-5.2 to najinteligentniejszy model otwarty, ale też najbardziej żarłoczny na tokeny, więc planuj budżet pod wyjście, a nie tylko pod stawkę za token.

Oficjalny cennik GLM-5.2 (z.ai)Za 1M tokenów
Wejście$1.40
Zbuforowane wejście$0.26 (81% taniej, magazynowanie na razie darmowe)
Wyjście$4.40
Mieszany koszt vs GPT-5.5mniej więcej jedna szósta ceny (VentureBeat)

Otwarte wagi to suwerenność, nie tylko oszczędności

Cena ma znaczenie, ale licencja ma znaczenie większe. GLM-5.2 dostarczany jest na standardowej, niezmodyfikowanej licencji MIT, bez aneksu o dopuszczalnym użyciu i bez regionalnych ograniczeń wag. Możesz pobrać pełne checkpointy BF16 lub FP8 z Hugging Face, uruchomić je na własnym sprzęcie, dostroić je i dostarczać komercyjnie. Dla firmy to różnica między wynajmowaniem inteligencji a posiadaniem własnego stosu.

Self-hosting jest realny, ale nietrywialny. Checkpoint FP8 mieści się na pojedynczym węźle z 8x H200 lub 8x H20 GPU; obsługa pełnego kontekstu 1M tokenów wymaga 8x B200. Działa na vLLM, SGLang i Transformers, a AMD dostarczyło wersję MXFP4 dla swoich akceleratorów Instinct MI350/MI355. W praktyce większość zespołów zacznie od API, a self-hosting zarezerwuje na przypadki, w których się to opłaca: ścisła suwerenność danych, przewidywalne koszty przy dużym wolumenie albo dostrajanie na danych własnościowych. Sednem jest to, że opcja istnieje, czego nie kupi Ci żaden budżet na GPT-5.5 ani Claude'a.

Haczyk: governance, zaufanie i Entity List

Oto czego nie wyeksponują posty premierowe. Zhipu AI zostało dodane do amerykańskiej US Entity List 16 stycznia 2025 (regulacja Federal Register 2025-00704), jako pierwsza chińska firma LLM na liście, z podaną przesłanką, że pomaga "przyspieszać modernizację wojskową Chińskiej Republiki Ludowej". Nie powstrzymuje to Cię przed pobraniem wag na licencji MIT, ale jest realnym sygnałem dla każdej organizacji ważącej ryzyko dostawcy.

Bardziej konkretnie, w codziennym użyciu: wygodne hostowane API z.ai działa przez firmę z siedzibą w Chinach, podlegającą chińskim przepisom o danych. Dla europejskiej czy francuskiej firmy obsługującej dane klientów lub dane osobowe to pytanie z obszaru governance, na które musisz odpowiedzieć, zanim zaczniesz przepuszczać przez nie wrażliwe prompty. Czyste rozwiązanie to dokładnie to, które umożliwia licencja MIT: hostuj wagi we własnej infrastrukturze, a dane nigdy jej nie opuszczą. Używaj taniego API do obciążeń niewrażliwych, hostuj u siebie resztę. Dodaj rozwlekły profil kosztu na zadanie oraz lukę między benchmarkami deklarowanymi a mierzonymi niezależnie, i masz pełny, uczciwy obraz.

Rodowód GLM, w datach

GLM-5.2 nie pojawił się znikąd. To najnowszy krok szybkiego, publicznego rytmu, który systematycznie domykał dystans do amerykańskich laboratoriów.

  • GLM-4.5 do GLM-4.6 Zhipu ustanawia się jako poważny pretendent w kategorii otwartych wag.
  • GLM-5 Pierwszy, który zaczął wymieniać realne ciosy z czołówką w kodowaniu.
  • GLM-5.1 MoE 744B/40B, kontekst 200K, poprzednik będący koniem roboczym.
  • GLM-5.2 (połowa czerwca 2026) Ten sam rozmiar co GLM-5.1, ale pięciokrotnie większy kontekst (do 1M), największy skok benchmarkowy między wersjami w całej linii oraz pierwsze miejsce w rankingu modeli z otwartymi wagami.

Nasze zdanie: kiedy naprawdę używać GLM-5.2

Poniżej przedstawiamy naszą analizę.

Szum jest w większości zasłużony, a właściwą reakcją dla firmy nie jest ani jego zignorowanie, ani migrowanie wszystkiego z dnia na dzień. Jest nią dopasowanie modelu do zadania. Z naszego doświadczenia w budowaniu z AI dla klientów, oto praktyczna siatka.

  • Używaj go do agentowego kodowania i automatyzacji o dużym wolumenie. Jako alternatywa dla Claude Code albo silnik napędzający wewnętrzne agenty, cenę i otwartość GLM-5.2 trudno pobić. Podłącz go za warstwą abstrakcji, aby móc zmienić model jedną zmianą w konfiguracji, i zaplanuj budżet pod jego apetyt na tokeny.
  • Hostuj go u siebie, gdy wymaga tego suwerenność lub skala. Dane wrażliwe, sektory regulowane lub przewidywalny duży wolumen to przypadki, w których posiadanie wag MIT na własnych GPU bije każde wynajęte API.
  • Trzymaj go z dala od najbardziej wrażliwych danych na hostowanym API. Dopóki nie hostujesz u siebie, nie przepuszczaj danych poufnych ani osobowych przez endpoint z siedzibą w Chinach. To granica governance, a nie jakości.
  • Nie uzależniaj niczego od jednego dostawcy. Lekcja minionego miesiąca, od przejmowanych narzędzi po zawieszane modele, jest taka, że model pod Twoim produktem powinien być wymiennym komponentem. GLM-5.2 to znakomite uzupełnienie wielomodelowego stosu, a nie powód, by postawić firmę na jednego dostawcę.

Dokładnie tak projektujemy funkcje AI dla klientów: model jako wymienna część za Twoimi własnymi interfejsami, dobierana do zadania pod kątem ceny, wydajności i governance, na infrastrukturze, którą kontrolujesz (zobacz nasze realizacje). Jeśli chcesz pomocy w rozstrzygnięciu, gdzie GLM-5.2, Claude czy GPT naprawdę pasują w Twoim produkcie i jak zachować otwartość zarówno danych, jak i opcji, opowiedz nam o swoim projekcie (lub skontaktuj się z nami), a odezwiemy się w ciągu 48 godzin. Więcej o szybko zmieniającym się stosie AI znajdziesz w naszych tekstach o przejęciu Cursora przez SpaceX oraz o rządowym zawieszeniu Fable 5.

Kluczowe liczby (stan na czerwiec 2026)

To szybko zmieniający się obszar; każda liczba jest oznaczona datą połowy czerwca 2026 i będzie się zmieniać, gdy zareagują rywale.

  • 51 Artificial Analysis Intelligence Index, model numer jeden wśród otwartych wag, numer cztery ogółem.
  • 1 048 576 tokenów kontekstu, przy maksymalnym wyjściu 128K.
  • ~744 do 753B parametrów łącznie, ~40B aktywnych (Mixture-of-Experts).
  • $1.40 / $4.40 za milion tokenów wejściowych/wyjściowych, około jednej szóstej GPT-5.5.
  • MIT licencja, w pełni hostowalna u siebie na 8x H200 (FP8).
  • 16 stycznia 2025 data dodania Zhipu do amerykańskiej US Entity List.
RM

O autorze

Robin Monteiro

Co-fondateur de Go To Agency

Développeur full-stack et co-fondateur de Go To Agency, Robin conçoit des solutions web performantes avec Next.js, React et les dernières technologies.

Poznaj zespół

Go To Agency — agence digitale à Dijon

L'équipe derrière cet article peut le faire pour vous

Sites et e-commerce Next.js sur mesure, SEO qui positionne, campagnes publicitaires mesurées au retour près. Tout se passe par écrit, sans rendez-vous : décrivez votre besoin, on revient vers vous avec une lecture concrète.

Votre demande arrive directement sur [email protected] — réponse sous 24 h ouvrées, aucun engagement.

Udostępnij artykuł

Questions fréquentes

Czym jest GLM-5.2?+

GLM-5.2 to model językowy z otwartymi wagami opracowany przez Zhipu AI (marka z.ai), wydany w połowie czerwca 2026 na licencji MIT. To rzadki Mixture-of-Experts o ~744 do 753B parametrów łącznie i ~40B aktywnych na token, z prawdziwym kontekstem 1 048 576 tokenów (1M) i maksymalnym wyjściem 128K. Obsługuje tryby rozumowania, wywoływanie narzędzi, wyjście JSON, cache promptów, streaming i MCP, ale działa wyłącznie na tekście (brak wizji).

Czy GLM-5.2 jest naprawdę najlepszym modelem open-source?+

Według niezależnego ośrodka Artificial Analysis tak: GLM-5.2 osiąga 51 w Intelligence Index v4.1, najwyżej spośród wszystkich 92 testowanych modeli z otwartymi wagami, i jest czwarty ogółem, za Claude Fable 5 (60), Claude Opus 4.8 (56) i GPT-5.5 xhigh (55). Warto jednak rozróżniać wyniki niezależne od deklaracji samego z.ai, które bywają nieco zawyżone (np. Terminal-Bench 81,0 deklarowane vs 78 zmierzone).

Ile kosztuje GLM-5.2?+

Oficjalne API z.ai pobiera 1,40 dolara za milion tokenów wejściowych i 4,40 dolara za milion tokenów wyjściowych, przy zbuforowanym wejściu za jedynie 0,26 dolara (81% rabatu). VentureBeat wyliczył mieszany koszt na mniej więcej jedną szóstą GPT-5.5; OpenRouter schodzi do 1,20 dolara / 4,10 dolara. Uwaga na haczyk: model jest żarłoczny na tokeny (około 43 000 wyjściowych na zadanie), więc koszt na ukończone zadanie (~0,46 dolara) bywa wyższy niż u rywali mimo niskiej stawki za token.

Czy firma może hostować GLM-5.2 u siebie?+

Tak. Licencja MIT pozwala pobrać pełne checkpointy BF16 (~1,51 TB) lub FP8 (~744 GB) z Hugging Face (zai-org), uruchomić je, dostroić i dostarczać komercyjnie. Checkpoint FP8 mieści się na pojedynczym węźle 8x H200 lub 8x H20, a pełny kontekst 1M tokenów wymaga 8x B200. Model działa na vLLM, SGLang i Transformers, a AMD dostarczyło wersję MXFP4 dla akceleratorów Instinct MI350/MI355.

Czy można bezpiecznie wysyłać wrażliwe dane do GLM-5.2?+

Nie przez hostowane API z.ai, jeśli dane są poufne lub osobowe. API działa przez firmę z siedzibą w Chinach, podlegającą chińskim przepisom o danych, a Zhipu AI figuruje na amerykańskiej US Entity List od 16 stycznia 2025. Czyste rozwiązanie umożliwia sama licencja MIT: hostuj wagi we własnej infrastrukturze, wtedy dane jej nie opuszczają. Taniego API używaj do obciążeń niewrażliwych, self-hostingu do reszty.

Czy powinniśmy przejść z Claude lub GPT na GLM-5.2?+

Nie warto migrować wszystkiego z dnia na dzień ani uzależniać się od jednego dostawcy. Najlepiej dopasować model do zadania: GLM-5.2 to znakomity wybór do agentowego kodowania i automatyzacji o dużym wolumenie oraz tam, gdzie liczy się suwerenność danych. Podłącz model za warstwą abstrakcji, aby zmieniać go jedną zmianą w konfiguracji, i traktuj GLM-5.2 jako mocne uzupełnienie wielomodelowego stosu obok Claude'a i GPT, a nie ich pełne zastąpienie.

Powiązane artykuły

Bezpłatna wycena
GLM-5.2: najlepszy otwarty LLM, 1/6 ceny GPT | Go To Agency