Mistral Medium 3.5とVibeリモートエージェント:統一されたフラッグシップモデルと自律コーディングの新境地


ADVERTISEMENT

Mistral Medium 3.5: 128B統合型マルチモーダルモデルの全貌

Mistral AIは、2026年4月29日にMistral Medium 3.5をリリースしました。これは、1280億パラメータを持つ高密度なマルチモーダルモデルであり、256Kトークンという広大なコンテキストウィンドウを特徴としています。このモデルは、従来のMistral Medium 3.1(汎用チャット)、Magistral(Le Chatでの推論)、およびDevstral 2(コーディング)といった専門モデル群を単一の重みセットに統合した「フラッグシップ統合モデル」として位置づけられています。この統合により、指示理解、推論、およびコーディングといった複数のタスクを横断的に、かつ一貫して処理する能力が向上しました。

技術的な側面では、Mistral Medium 3.5は可変画像サイズおよびアスペクト比に対応するために、ビジョンエンコーダをゼロから訓練しています。これは、固定解像度の仮定に依存する多くのビジョン言語モデルとは異なり、実世界の多様な画像入力への柔軟な対応を可能にする重要な設計上の選択です。さらに、リクエストごとに推論の労力を設定できる機能、ネイティブな関数呼び出し、JSON出力、そして24言語のサポートといった機能も提供されています。本モデルはModified MITライセンスの下でオープンウェイトとしてHugging Faceで公開されており、最小4基のGPUで自己ホスト型展開が可能であるため、開発者にとって高いアクセシビリティを提供します。

VibeリモートエージェントとLe Chatのワークモード:自律的な開発ワークフローの実現

Mistral Medium 3.5の発表と同時に、Mistral AIはVibeリモートエージェントおよびLe Chatの新しい「ワークモード」を導入し、自律的な開発ワークフローを大きく推進しています。Vibeリモートエージェントは、非同期かつ並列でコーディングセッションを実行するクラウドベースのシステムです。これらのエージェントは隔離されたサンドボックス環境で動作し、Mistral Vibe CLIまたはLe Chatから起動できます。開発者は、ローカル端末を監視する代わりに、ファイル差分、ツール呼び出し、進行状況、エージェントからの質問を通じて進捗を監視することができます。さらに、進行中のローカルVibeセッションを履歴を保持したままクラウドに「テレポート」させることが可能で、開発者のマシンを他の作業に解放することができます。

Vibeリモートエージェントは、モジュールリファクタリング、テスト生成、依存関係のアップグレード、CI調査、バグ修正といった、時間のかかるタスクに適しています。GitHub(プルリクエスト)、Linear、Jira(課題管理)、Sentry(インシデント管理)、SlackやTeams(通知)といった主要な開発ツールとの統合も進められています。

Le Chatに導入されたワークモードは、Mistral Medium 3.5と新しいハーネスによって駆動される、複雑なタスク向けの強力なエージェントモードです。これにより、Le Chatは複数のツールを同時に使用して、電子メール、メッセージ、カレンダーといった複数のアプリケーションを横断するワークフローを処理し、多段階のプロジェクトを完了させることが可能になります。

パフォーマンス指標とオンプレミス展開の可能性

Mistral Medium 3.5は、その実用的な性能において注目すべき成果を示しています。エージェントベンチマークにおいて、SWE-Bench Verifiedで77.6%のスコアを記録し、これはDevstral 2やQwen3.5 397B A17Bといったモデルを上回っています。SWE-Bench Verifiedは、実際のGitHubの課題解決能力をテストする標準的なベンチマークであり、実用的なソフトウェアエンジニアリング能力の信頼できる指標とされています。また、τ³-Telecomベンチマークでは91.4%のスコアを達成しており、強力なエージェント能力を裏付けています。

API経由での利用料金は、入力トークン100万あたり1.50ドル、出力トークン100万あたり7.50ドルに設定されています。さらに、本モデルはオープンウェイトとして提供され、最小4基のGPUでの自己ホスト型展開が可能であることから、企業はインフラコストを最適化しつつ、高度なAIエージェント機能をオンプレミス環境で利用できる柔軟性を得られます。NVIDIA GPUアクセラレーションエンドポイント(build.nvidia.com)やスケーラブルなコンテナ化推論マイクロサービス(NVIDIA NIM)を通じたプロトタイプ開発もサポートされており、幅広い開発環境での活用が期待されます。

開発者・エンジニア視点での考察

  1. Vibeリモートエージェントの非同期・並列実行機能は、大規模なコードベースのリファクタリングやテスト生成など、時間のかかる開発タスクをバックグラウンドで処理し、開発者のローカルマシンを解放することで生産性を劇的に向上させる。これは、特にCI/CDパイプラインや複雑なバグ修正において、ボトルネックを解消する強力なツールとなる。

  2. Mistral Medium 3.5が提供する256Kの広範なコンテキストウィンドウと、命令追従、推論、コーディングを単一の重みセットで統合する能力は、複雑な要件定義から実装、デバッグまでを一貫したAIアシスタンスでカバーすることを可能にする。これにより、異なるフェーズでのモデル切り替えに伴う不整合リスクを低減し、プロジェクトの全体的な整合性を高めることができる。

  3. ゼロから学習されたビジョンエンコーダによる多様な画像サイズ・アスペクト比対応は、単なるテキストベースのコーディング支援に留まらない、よりリッチなマルチモーダル開発環境を構築する可能性を秘めている。例えば、UI/UXデザインのプロトタイプからコード生成、図表からのデータ抽出と分析コード作成など、視覚情報を含む多様な入力を活用した高度な開発ツールやエージェントの実現が期待される。

Source / 元記事

この記事について

著者
AIBloom AI編集部
初回公開
最終更新

この記事は、公開されているニュース、論文、公式発表、RSSフィードなどをもとに、AIが要約・補足調査・考察を行って作成しています。

元記事の完全な翻訳・逐語的な要約ではなく、AIによる背景説明や開発者向けの考察を含みます。

重要な技術仕様・価格・提供状況などは、必ず元記事または公式情報をご確認ください。

About AIBloom

ADVERTISEMENT