GLM-5.2 Z.ai、フラッグシップコーディングプランでリリース:100万トークンコンテキストとエージェント機能の深化


ADVERTISEMENT

GLM-5.2の主要機能とアーキテクチャの進化

Z.aiは2026年6月13日、同社の新たなフラッグシップモデルである「GLM-5.2」をGLM Coding Planの全ティア(Lite、Pro、Max、Team)向けにリリースしました。このモデルは、特に強力なコーディング能力、100万トークン(1Mトークン)の利用可能なコンテキストウィンドウ、および長期にわたるタスク処理の継続的な強みを謳っています。APIおよびチャットボットアクセス、そしてMITライセンスに基づくオープンソース版のウェイト公開は翌週に予定されています。

GLM-5.2は、前身であるGLM-5およびGLM-5.1の技術的蓄積の上に成り立っています。GLM-5(2026年2月公開)は、総パラメータ数744B(アクティブ40B)のMoE(Mixture-of-Experts)アーキテクチャを採用し、前世代のGLM-4.5から大幅にスケールアップしました。このモデルには、デプロイコストを大幅に削減しつつ長文脈処理能力を維持するDeepSeek Sparse Attention(DSA)が統合されています。さらに、Z.aiが独自開発した非同期強化学習インフラ「slime」を用いて、学習スループットを高め、モデルの洗練を加速しています。GLM-5.1(4月公開)では、8時間にわたる自律実行や600回以上の最適化ループといった、長期間にわたるエージェントタスクの安定性が強化されており、GLM-5.2はこの流れを汲む最新版となります。

長文脈処理とエージェント能力の飛躍的向上

GLM-5.2の最も注目すべき進化の一つは、その1Mトークンという広範なコンテキストウィンドウです。これはGLM-5.1の200Kトークンから5倍の飛躍であり、コードベース全体のリファクタリング、長時間のAIエージェントセッション、およびコンテキストの断片化がボトルネックとなる複数ファイルにまたがる推論において、極めて重要な意味を持ちます。この長文脈能力は、モデルが複雑な問題解決や大規模プロジェクトにおいて、より一貫性のある、多段階の「エージェント的な」作業を実行する上で不可欠です。

また、GLM-5.2は「High」と「Max」の2段階の「思考努力レベル(thinking-effort levels)」を提供します。コーディングタスクには「Max」レベルが推奨されており、これにより開発者は、タスクの複雑性や重要度に応じて計算コストと推論の深さのトレードオフを柔軟に選択できるようになります。リリース時にはGLM-5.2単体での詳細なベンチマークは公開されていませんが、基盤となったGLM-5は、SWE-bench VerifiedやTerminal Bench 2.0といった主要なコーディングおよびエージェントベンチマークにおいて、オープンソースモデルとして最高レベルの性能を達成し、Claude Opus 4.5やGPT-5.2(xhigh)といったクローズドなフロンティアモデルに肉薄する、あるいは一部で上回る結果を示しています。特に、Web調査(BrowseComp)や長期計画(Vending Bench)のようなエージェントタスクにおいて強みを発揮し、「自律的に手を動かし続ける」タイプのタスクでの高い実力が期待されます。

オープンソース戦略と開発者コミュニティへの影響

Z.aiはGLM-5.2のリリースと同時に、オープンソースへのコミットメントを強調しています。翌週にはMITライセンスの下でモデルウェイトが公開される予定であり、これはGLM-5ファミリー(GLM-5、GLM-5.1、GLM-5.2)全体で一貫して維持されている方針です。このオープンソース戦略は、開発者コミュニティにとって大きな恩恵をもたらします。モデルの透明性が高まり、研究者や企業が独自のアプリケーションや研究にGLM-5.2を自由に組み込み、カスタマイズする道を開きます。

さらに、GLM-5.2はClaude CodeやOpenClawといった既存の主要なエージェントフレームワークとネイティブな互換性を持つことが確認されています。これにより、開発者は既存のツールやワークフローにGLM-5.2を容易に統合し、主要なコーディングバックエンドとして利用することが可能です。オープンウェイトの公開後は、FP8量子化版などを用いてローカルGPUでの動作を試したり、特定のドメインに特化したファインチューニングを行ったりする可能性も広がります。

開発者・エンジニア視点での考察

  1. 100万トークンコンテキストを活用した大規模コードベース分析の最適化: 開発者は、GLM-5.2の1Mトークンコンテキストウィンドウを利用して、単一ファイルに限定されない大規模なコードベース全体や関連する複数のファイルを一度にモデルに入力できるようになります。これにより、プロジェクト全体にわたるリファクタリングの提案、アーキテクチャの改善点特定、あるいは複雑なバグの根本原因分析など、より包括的かつ正確なコード理解に基づく作業が可能となり、開発効率とコード品質の大幅な向上が期待できます。

  2. 思考努力レベル「Max」と「High」によるコストパフォーマンスの調整: GLM-5.2が提供する「High」と「Max」の思考努力レベルは、開発者がタスクの重要度と計算リソースの利用を柔軟にバランスさせるための強力な手段となります。例えば、日常的なコード補完や簡単な修正には「High」モードでコストを抑え、一方で、複雑な設計問題の解決、長期にわたるエージェントの自律実行、またはクリティカルなシステムのデバッグには「Max」モードを適用することで、リソースを最適化しながらも最高の推論品質を確保できるでしょう。

  3. MITライセンスによるオープンソース版の活用とローカル展開の検討: GLM-5.2のMITライセンスでのウェイト公開は、特にセキュリティ要件の厳しい環境や、プライベートなデータセットでのファインチューニングを検討している企業にとって、画期的な機会を提供します。開発者は、モデルをローカル環境や自社インフラにデプロイすることで、API利用に伴うコストやデータプライバシーの懸念を軽減しつつ、モデルの振る舞いをより細かく制御できるようになります。これにより、特定の業界や社内ルールに合わせた専門的なAIコーディングアシスタントの構築が加速するでしょう。

Source / 元記事

この記事について

著者
AIBloom AI編集部
初回公開
最終更新

この記事は、公開されているニュース、論文、公式発表、RSSフィードなどをもとに、AIが要約・補足調査・考察を行って作成しています。

元記事の完全な翻訳・逐語的な要約ではなく、AIによる背景説明や開発者向けの考察を含みます。

重要な技術仕様・価格・提供状況などは、必ず元記事または公式情報をご確認ください。

About AIBloom

ADVERTISEMENT