GPU ベアメタル

ベアメタル GPU サーバーをレンタル

高性能なベアメタル GPU サーバー。完全な制御と低コストを実現し、AI、ML、ディープラーニングのワークロードに最適です。

ソリューション

あらゆるワークロードに最適な GPU

4つの主要な AI シナリオに、それぞれ専用設計のベアメタル GPU 構成を対応。

H100 SXM

ノードあたり 8x NVIDIA H100 SXM

  • GPU あたり 80 GB HBM3 · 合計 640 GB
  • NVLink 900 GB/s + RDMA
  • 1000+ GPU のリニアスケーリング

$1.70/GPU/hr

最高の価値

B200 SXM

ノードあたり 8x NVIDIA B200 SXM

  • GPU あたり 192 GB HBM3e · 合計 1,536 GB
  • NVLink 第5世代 1.8 TB/s + RDMA

$4.77/GPU/hr

最高性能
ソリューション

AI 推論

LLM サービング、リアルタイムチャット、マルチモーダル生成、エージェント推論を低レイテンシで大規模に実行。

H200 SXM

ノードあたり 8x NVIDIA H200 SXM

  • GPU あたり 141 GB HBM3e · 合計 1,128 GB
  • NVLink 900 GB/s + RDMA
  • 1000+ GPU のリニアスケーリング
  • KV キャッシュ負荷の高いワークロード
お問い合わせ大規模コンテキスト

RTX 5090

ノードあたり 8x NVIDIA RTX 5090

  • GPU あたり 32 GB GDDR7 · 合計 256 GB
  • PCIe 5.0
  • AIGC コンテンツ生成
  • コスト効率の高い推論
お問い合わせコスト効率に優れる
ソリューション

レンダリング&シミュレーション

3D レンダリング、クラウドゲーミング、自動運転シミュレーション、デジタルツイン環境。

RTX 5090

ノードあたり 8x NVIDIA RTX 5090

  • GPU あたり 32 GB GDDR7 · 合計 256 GB
  • PCIe 5.0 · 最新の Blackwell アーキテクチャ
  • リアルタイムレイトレーシング&DLSS 4
  • クラウドゲーミング&コンテンツ制作

RTX 4090

ノードあたり 8x NVIDIA RTX 4090

  • GPU あたり 24 GB GDDR6X · 合計 192 GB
  • PCIe 4.0 · 実績ある Ada Lovelace
  • 最も幅広いソフトウェア互換性
  • デジタルツイン&シミュレーション
お問い合わせ実戦で実証済み
ソリューション

科学技術計算

GPU アクセラレーション計算による、CPU で縮約可能なダイナミクス、リモートモデリング、分子科学。

H100 SXM

ノードあたり 8x NVIDIA H100 SXM

  • GPU あたり 80 GB HBM3 · 合計 640 GB
  • NVLink 900 GB/s + RDMA
  • HPC 向け FP64 倍精度
  • MPI + NCCL マルチノードスケーリング

$1.70/GPU/hr

HPC 対応

H200 SXM

ノードあたり 8x NVIDIA H200 SXM

  • GPU あたり 141 GB HBM3e · 合計 1,128 GB
  • NVLink 900 GB/s + RDMA
  • H100 より 76% 多い HBM
  • 大規模シミュレーション&モデリング
お問い合わせ最大メモリ
NOVITAを選ぶ理由

AI ワークロード向けに専用設計

すべての機能は GPU 性能を最大化し、運用負荷を最小化するよう設計されています。

仮想化オーバーヘッドゼロ

物理 GPU への直接アクセスにより、ハイパーバイザーレイヤーを排除。ベアメタル割り当てでシリコン性能を100%引き出します。

すぐに実行できる環境

CUDA ドライバー、ML フレームワーク、ネットワーキングを事前構成済み。数日ではなく数分でトレーニングジョブをデプロイできます。

提供保証

契約上の SLA に基づく予約容量。お客様の GPUs は物理的に割り当てられ、常に利用可能です — スポット中断はありません。

物理的に分離されたインフラストラクチャ

ハードウェアレベルの分離を備えた専用サーバー。お客様のデータが他のテナントとメモリ、ストレージ、ネットワーク経路を共有することはありません。

本番環境向けAIを構築するために必要なすべて。

200以上のモデル、オンデマンド GPUs、安全なエージェントランタイムを、1つの API に統合。無料で始められ、成長に合わせてスケールできます。