DigitalOcean、推論時代を加速するAIネイティブクラウドを発表
DigitalOcean AIネイティブクラウドの概要と革新的な五層アーキテクチャ
DigitalOceanは、推論とエージェントの時代に特化した初の「AIネイティブクラウド」を発表しました。これは、AIアプリケーションの構築、デプロイ、およびスケーリングを合理化するために、エンドツーエンドで設計された統合プラットフォームです。従来のクラウドインフラストラクチャがAIワークロードの要求に追いつかなくなっている現状に対し、DigitalOceanは断片化されたサービスを組み合わせる複雑さを解消し、開発者が製品開発に集中できる環境を提供することを目指しています。
このAIネイティブクラウドは、以下の5つの統合されたレイヤーで構成されています:
-
インフラストラクチャ(Infrastructure): 世界20か所のデータセンターに展開され、NVIDIA H100、H200、HGX B300、およびAMD Instinct MI300X、MI350X、MI355X GPUを含むCPUおよびGPUキャパシティを提供します。これらは400G RoCE RDMAファブリックで接続されており、高帯域幅と低遅延を実現しています。
-
コアクラウド(Core Cloud): Kubernetes (DOKS)、CPUおよびGPU Droplet、VPCネットワーキング、およびS3互換のオブジェクト、ブロック、ファイルストレージが含まれます。
-
推論エンジン(Inference Engine): サーバーレスおよび専用エンドポイント、バッチ処理、インテリジェントなモデルルーター、成長を続けるモデルカタログ、および持ち込みモデル(BYOM)サポートを提供します。カスタムのvLLMフォーク、チューニングされたKVキャッシュ、投機的デコーディング、GPUアウェアなスケジューリングなどの技術を統合し、推論パフォーマンスを最適化します。
-
データと学習(Data and Learning): pgvectorを搭載したPostgreSQL、Valkey、知識ベース、およびリアルタイムデータ機能を提供し、AIアプリケーションのデータ管理と学習ニーズをサポートします。Qdrantもデータ層で利用可能です。
-
マネージドエージェント(Managed Agents): OpenCodeやLangGraphのようなオープンなエージェントハーネスのサポート、セキュアなサンドボックス、永続的な状態管理、およびエージェントオーケストレーション機能を提供します。
このプラットフォームは、推論への移行、推論モデルのデフォルト化、大規模な自律エージェント、およびオープンソースモデルの品質向上という、本番AIを再定義する4つの主要な変化に対応するために設計されています。
高度な推論エンジンとエージェント機能の技術的詳細
DigitalOceanのAIネイティブクラウドは、現代のAIワークロード、特に推論とエージェントシステムに最適化された先進的な技術スタックを特徴としています。推論エンジンは、DigitalOcean独自のMoE(Mixture of Expert)ルーターモデルによって強化されたインテリジェントなモデルルーターを核としています。このルーターは、開発者がモデルプールを定義し、タスクと優先順位を自然言語で記述することで、各リクエストをコストとレイテンシの観点から最適化できるようにします。
モデルカタログには70以上のモデルが含まれており、DeepSeek、Llama、Qwen、NVIDIA Nemotron 3 Nano Omniなどのオープンソースモデルと、ClaudeやGPTのようなフロンティア閉鎖モデルの両方をサポートしています。これにより、顧客は単一のアプリケーション内でオープンモデルと閉鎖モデルを組み合わせ、必要に応じて動的にルーティングし、スタックを書き直すことなくより優れたモデルに切り替えることが可能です。
エージェント機能の面では、OpenCodeやLangGraphといったオープンなエージェントハーネスをサポートし、セキュアなサンドボックス環境を提供することで、自律エージェントの安全かつ効率的な実行を保証します。耐久性のある状態管理とエージェントオーケストレーション機能も備わっており、複雑なマルチエージェントシステムの開発と展開を簡素化します。
インフラストラクチャ層では、NVIDIA H100、H200、HGX B300、AMD Instinct MI300X、MI350X、MI355Xといった高性能GPUが、400G RoCE RDMAファブリック上で動作し、AIワークロードに不可欠な高速データ転送と低レイテンシを実現しています。これにより、特に大規模な言語モデルの推論や複雑なエージェントタスクにおいて、高いパフォーマンスと効率を提供します。
AIワークロードの最適化とコスト効率の改善
DigitalOceanのAIネイティブクラウドは、AIワークロードの固有の特性を深く理解し、それに対応するよう設計されています。典型的なエージェントタスクは、数百のモデル呼び出し、数百のデータベースクエリ、そして100万を超えるトークンを消費する可能性があり、そのワークロードの50%から90%がGPUではなくCPUで実行されることが指摘されています。これは、オーケストレーション、サンドボックス、状態管理、ツール呼び出しにCPUパワーが必要なためです。エージェントシステムは、同等の従来のワークロードと比較して約4倍のCPU容量を消費し、人間のユーザーよりも15倍多くのトークンを消費します。
このようなAIワークロードの特性を踏まえ、DigitalOceanはインフラストラクチャからエージェントまでの五層スタックを統合することで、開発者が個別のサービスを「つなぎ合わせる」必要なく、迅速にAIアプリケーションを構築・拡張できるようにします。これにより、生産AIのスケーリングとユニットエコノミクスの改善を可能にします。
コスト効率の面でも、DigitalOcean AIネイティブクラウドは顕著なメリットを提供します。例えば、法務テックプラットフォームのLawVoは、このプラットフォームに切り替えることで、コード変更なしで推論コストを42%削減したと報告されています。DigitalOceanの分析によると、代表的な100万予約/月の企業旅行エージェントワークロードにおいて、Baseten + AWSやAWS AgentCoreと比較して、大幅なコスト削減が期待できるとされています。
また、DigitalOceanはオープン標準とオープンソース技術をあらゆるレイヤーでサポートしており、ベンダーロックインがAI開発者にとって最大の負担であるという考えに基づいています。OpenCodeやLangGraphのようなエージェントハーネス、PostgreSQLやpgvector、Qdrantのようなデータサービス、KubernetesやCiliumのようなクラウドプリミティブ層に至るまで、オープンなエコシステムを活用することで、開発者は柔軟性と将来性を確保できます。
開発者・エンジニア視点での考察
-
エンドツーエンド統合による開発リードタイム短縮と運用効率向上: DigitalOceanのAIネイティブクラウドは、インフラストラクチャからマネージドエージェントまでの5層を完全に統合した単一プラットフォームを提供します。これにより、AI開発者は個々のサービスを組み合わせる複雑な作業から解放され、インテリジェントな推論ルーターやマネージドデータベースなどの機能を用いて、AIアプリケーションの反復、デプロイ、スケーリングを格段に迅速に行うことができます。これは、運用上のオーバーヘッドを大幅に削減し、チームがコアとなる製品イノベーションに集中できるという、極めて具体的なメリットをもたらします。
-
オープン性と柔軟性によるベンダーロックイン回避と技術選択の自由: このプラットフォームは、OpenCode、LangGraph、pgvector、Kubernetesといったオープン標準およびオープンソース技術を強力に支持しています。開発者は、DeepSeek、Llama、Qwenなどのオープンソースモデルと、ClaudeやGPTといったフロンティアモデルを自由に組み合わせ、動的にモデル間をルーティングし、アプリケーションスタックを書き換えることなく新しいモデルに切り替えることが可能です。これにより、長期的なアーキテクチャの柔軟性が確保され、特定のベンダーに縛られることなく、最適な技術スタックを自由に選択できるという大きな開発者体験上の利点があります。
-
エージェントワークロードに最適化されたリソース管理とコスト削減: DigitalOceanは、エージェントワークロードがCPUを多用し、膨大なトークンを消費するという特性を深く理解しています。NVIDIA H100/H200/HGX B300やAMD Instinct MI300X/MI350X/MI355Xといった高性能GPUを400G RoCE RDMAファブリックで接続するインフラと、推論ルーター、CPU最適化されたオーケストレーションは、エージェントネイティブシステム向けに設計されています。これにより、特に複雑なマルチエージェントアプリケーションにおいて、優れたパフォーマンスとユニットエコノミクスを実現し、LawVoの事例のように大幅なコスト削減(42%の推論コスト削減)を達成する可能性を開発者に提供します。
Source / 元記事
この記事について
この記事は、公開されているニュース、論文、公式発表、RSSフィードなどをもとに、AIが要約・補足調査・考察を行って作成しています。
元記事の完全な翻訳・逐語的な要約ではなく、AIによる背景説明や開発者向けの考察を含みます。
重要な技術仕様・価格・提供状況などは、必ず元記事または公式情報をご確認ください。


