Subquadratic、AI最大の数学的問題解決で2,900万ドルを調達:次世代AI演算の幕開けか


ADVERTISEMENT

Subquadraticが解き明かすAIの根本的な計算制約

マイアミを拠点とするスタートアップSubquadraticは、AI、特に大規模言語モデル(LLM)の発展を長年阻んできた「最大の数学的問題」を解決したと発表し、2,900万ドルのシード資金を調達しました。同社は、初の「完全な劣二次スケーリング」を持つ大規模言語モデルを構築したと主張しており、これにより計算量がコンテキスト長に対して指数関数的ではなく、線形に増加するとされています。このブレークスルーは、AIシステムが膨大な量の情報を処理するコストを劇的に削減する可能性を秘めています。

AI業界は、より大きなコンテキストウィンドウ、より多くのトークン、より多くのメモリ、そしてモデルに一度に供給されるより多くの情報を追求してきました。しかし、よりスマートなシステムを構築するための競争の背後には、コンテキストウィンドウが大きくなるにつれてシステムの実行コストが指数関数的に高くなるという、あらゆる主要なAIラボが直面してきた数学的問題がありました。 Subquadraticは、この制約を回避する方法を発見したと述べています。

劣二次アテンション:Transformerアーキテクチャのボトルネック解消

Subquadraticのアプローチは「Sparse Subquadratic Attention(SSA)」と呼ばれ、標準的なアテンションにおけるトークン間の比較のほとんどが無駄な計算であるという前提に基づいています。 代わりに、SSAは、実際に重要なトークン間の比較を識別し、その位置のみでアテンションを計算することを学習します。 この選択はコンテンツに依存しており、モデルは意味に基づいてどこを見るかを決定し、固定された位置パターンには基づきません。 理論的には、これにより極めて大規模なコンテキスト全体で検索品質を維持しながら、計算オーバーヘッドを劇的に削減できるとされています。

同社の最初のモデルであるSubQ 1M-Previewは、1,200万トークンにおいて、標準的なTransformerアーキテクチャと比較してアテンション計算を約1,000分の1に削減すると報告されています。 これは、計算要件がコンテキスト長に対して線形に増加することを意味し、これまでの指数関数的な増加(O(N^2))を覆すものです。 DeepMindのAlphaTensorなどの過去の研究でも行列乗算の効率化が試みられてきましたが、Subquadraticの主張は、LLMのAttentionメカニズムにおける根本的な計算複雑性を実用的に解決する点にあります。

Subquadraticは、この革新的なアーキテクチャの上に、開発者および企業向けの「フルコンテキストAPI」、リポジトリ規模のコーディングワークフローを可能にする「SubQ Code」、そして長文コンテキストAIを活用した検索・調査ツール「SubQ Search」という3つの製品をプライベートベータ版として発表しています。

AI業界への広範な影響と今後の展望

Subquadraticの技術が独立して検証されれば、AIシステムにおける大量の情報処理コストが劇的に削減され、これまでのAI開発の経済性を根本から変える可能性があります。 現在、ほとんどのフロンティアモデルはTransformerアーキテクチャに依存しており、シーケンス内のすべてのトークンが他のすべてのトークンと比較されるため、コンテキストウィンドウが大きくなるほど処理コストが増大するという制限がありました。 この制約が、開発者がAIを構築する方法に大きな影響を与えてきました。

Subquadraticの共同創設者兼CEOであるJustin Dangel氏は、今回の発表がAI界隈で急速に広まり、X(旧Twitter)で1,200万回以上の閲覧、24時間以内に30,000件以上のウェイティングリスト登録を集めたと述べています。 同社のアーキテクチャは、コンテキストウィンドウを拡張しながら、はるかに低いコストで運用できるとされています。 この進歩は、AIモデルのトレーニングコスト削減、推論速度の向上、そしてこれまで不可能だった大規模なモデルやより長いコンテキスト処理の実現に寄与すると期待されます。

開発者・エンジニア視点での考察

  1. 既存LLMフレームワークへの統合と最適化の可能性: SubquadraticのSparse Subquadratic Attention(SSA)は、既存のTransformerベースのモデルにおいてアテンション計算のボトルネックを解消する可能性があります。これは、PyTorchやTensorFlowなどの深層学習フレームワークのコアライブラリに、SSAに最適化された新しいカーネルや演算プリミティブが追加されることで、既存モデルの推論・学習効率を大幅に向上させる道を開くかもしれません。開発者は、低コストでより長いコンテキストを持つモデルを扱うための新たな最適化戦略を模索する必要が出てくるでしょう。

  2. 新しいモデルアーキテクチャ設計への影響: コンテキスト長に対する計算量の制約が緩和されることで、AIモデルのアーキテクトは、これまで計算コストのために断念していたような、より大規模で複雑なモデルを設計できるようになります。例えば、より深いネットワーク、広範な知識グラフの直接埋め込み、または非常に長い文書やコードベース全体を単一のコンテキストで処理するエージェントなど、新しいタイプのAIアプリケーションの可能性が広がります。これは、モデル設計のパラダイムシフトを促す可能性があります。

  3. AI開発の民主化とエッジAIの推進: 大規模なAIモデルの実行コストが劇的に削減されれば、最先端のAI技術がより多くの企業や開発者にとって手頃なものになります。これにより、リソースが限られたスタートアップや研究機関でも、大規模モデルの研究開発や展開に参加しやすくなるでしょう。また、計算効率の向上は、エッジデバイス上でのより複雑なAIモデルの実行を可能にし、低電力かつ低レイテンシでのAIアプリケーションの普及を加速させる可能性があります。

Source / 元記事

この記事について

著者
AIBloom AI編集部
初回公開
最終更新

この記事は、公開されているニュース、論文、公式発表、RSSフィードなどをもとに、AIが要約・補足調査・考察を行って作成しています。

元記事の完全な翻訳・逐語的な要約ではなく、AIによる背景説明や開発者向けの考察を含みます。

重要な技術仕様・価格・提供状況などは、必ず元記事または公式情報をご確認ください。

About AIBloom

ADVERTISEMENT