Fundamentalの基盤表形式モデルNEXUS、Amazon SageMaker JumpStartで利用可能に:構造化データ予測の新たな標準


ADVERTISEMENT

FundamentalのNEXUSモデル:表形式データ予測のパラダイムシフト

Fundamental社が開発した大規模表形式モデル(LTM)であるNEXUSが、Amazon SageMaker JumpStartで利用可能になりました。これにより、企業は構造化データからの予測タスクを、従来の数ヶ月ではなく数日で実行できるようになります。NEXUSは、テキスト用に設計された大規模言語モデル(LLM)や、広範な特徴量エンジニアリングとモデルトレーニングを必要とする従来の機械学習(ML)アプローチとは一線を画しています。数十億の実際の予測タスクで事前学習されており、データ内のシグナルを自律的に発見する能力を備えています。

NEXUSの最大の革新は、そのアーキテクチャにあります。確率的LLMが同一クエリに対して異なる回答を返す可能性があるのに対し、NEXUSは各予測に対して一貫性があり、再現可能な結果を生成する「決定論的アーキテクチャ」を採用しています。 また、「ネイティブな表形式理解」により、数値、カテゴリ、日付、非構造化テキストといった多様なデータ型を、手動の特徴量エンジニアリングなしで直接処理します。さらに、ほとんどのAIモデルがシーケンシャルデータを予測するのに対し、NEXUSは企業テーブル内の多次元的な非シーケンシャル関係を分析できます。例えば、顧客離反予測において、NEXUSは取引頻度、サポートチケット、経済指標など複数の要因が離反可能性にどのように影響するかを理解します。 技術的な側面では、列の順序変更が意味を変えないことを認識する「順列不変性」、大規模なデータセットを切り捨てやサンプリングなしで処理する「数十億行対応能力」、異なるテーブル間の関連データを自動的に接続する「クロススキーマ推論」、不完全なエントリを解決する「自律的データクリーンアップ」といった特徴も持ち合わせています。

Amazon SageMaker JumpStartを通じたNEXUSの展開と活用

FundamentalのNEXUSモデルは、Amazon SageMaker JumpStartを通じて迅速に展開・利用できます。SageMaker JumpStartは、基盤モデル、組み込みアルゴリズム、および事前構築されたMLソリューションを提供するMLハブであり、数回のクリックでモデルを展開できます。 NEXUSは、AWS Marketplaceでモデルパッケージをサブスクライブし、その後SageMaker AIマネージド推論エンドポイントとしてデプロイすることで利用可能です。推奨されるデプロイインスタンスは、8基のNVIDIA H200 GPUを搭載したml.p5en.48xlargeインスタンス上で動作し、専用のシングルテナント、ネットワーク分離されたGPU環境でNEXUSが実行されます。

この統合により、開発者はFundamental Python SDKをインストールし、SageMakerエンドポイントに接続するだけで、企業データセットに対して予測を実行できます。 SageMaker JumpStartの機能は、基盤モデルの迅速な評価、比較、選択を可能にし、事前定義された品質および責任メトリクスに基づいてタスクを実行します。トレーニング済みのモデルは、ユーザーのデータに合わせて完全にカスタマイズ可能であり、ユーザーインターフェースまたはSDKを使用して容易に本番環境に展開できます。 NEXUSは、金融サービスにおける不正検出、ヘルスケアにおける予測メンテナンス、小売における需要予測など、幅広いエンタープライズユースケースでその価値を発揮し、従来のML手法を凌駕する高い予測精度を実現します。

開発者・エンジニア視点での考察

  1. 特徴量エンジニアリングの負荷軽減と開発サイクルの短縮: NEXUSは、数十億の表形式データで事前学習されており、手動の特徴量エンジニアリングなしに生の構造化データを直接処理できます。これにより、データサイエンティストはデータの準備とモデルのトレーニングに費やす時間を大幅に削減でき、より戦略的な分析やドメイン固有の課題解決に集中できるようになります。 開発チームは、数ヶ月かかっていた予測モデルの構築を数日に短縮し、市場投入までの時間を劇的に改善できるでしょう。

  2. 決定論的予測によるビジネス信頼性の向上: 確率的性質を持つ一部のAIモデルと異なり、NEXUSは常に一貫した再現可能な予測結果を生成します。 これは、金融取引の不正検出や医療診断など、予測の信頼性と説明可能性が極めて重要となるエンタープライズアプリケーションにおいて、ビジネスプロセスの自動化と意思決定の信頼性を大幅に向上させる重要な要素となります。

  3. 大規模・複雑な表形式データへのスケーラブルな対応: NEXUSは、数十億行のデータセットを切り捨てやサンプリングなしで処理し、クロススキーマ推論により異なるテーブル間の関係性を自動で理解します。 これにより、従来のMLモデルでは困難であった、エンタープライズにおける膨大かつ複雑に絡み合った構造化データ全体を対象とした、より高精度な予測分析が可能になります。開発者は、データ量の増加やデータソースの多様化に際しても、モデルのスケーラビリティや統合の複雑さに関する懸念を軽減できます。

Source / 元記事

この記事について

著者
AIBloom AI編集部
初回公開
最終更新

この記事は、公開されているニュース、論文、公式発表、RSSフィードなどをもとに、AIが要約・補足調査・考察を行って作成しています。

元記事の完全な翻訳・逐語的な要約ではなく、AIによる背景説明や開発者向けの考察を含みます。

重要な技術仕様・価格・提供状況などは、必ず元記事または公式情報をご確認ください。

About AIBloom

ADVERTISEMENT