Spot GPU Instances

最大50%オフ – RTX 4090がわずか$0.18/時間から

デフォルトで1時間の保護、1時間前の終了通知、従来のSpotワークフローと完全互換。中断を許容できるワークロードに最適です
利用可能なGPUタイプ:4090A100H100
GPU料金の背景GPU料金の背景
GPUコストを50%削減
スポットインスタンスを選ぶ理由
信頼性を犠牲にすることなく、わずかなコストでワークロードを実行
最大50%節約
最大50%節約
Pay half the on-demand rate
組み込み保護
組み込み保護
Guaranteed 1-hour initial runtime
事前通知
事前通知
1-hour termination alerts via API, email, or console
柔軟なデプロイメント
柔軟なデプロイメント
Combine with on-demand or reserved instances for the right balance of cost and stability
スポットインスタンスのライフサイクル
1時間の実行時間が保証され、その後は自動回収の1時間前に通知されたうえで中断される可能性があります。スポットは余剰キャパシティを使用するため、低コストですがいつでも回収される可能性があります。
01
起動
Instance enters running state
02
1時間保護
No interruptions during this period
03
中断ウィンドウ
After protection ends, instance may be reclaimed
04
終了通知
Sent 1 hour in advance
05
強制終了
Instance is stopped and released automatically
注:ワークロードは中断に耐えられるようにする必要があります。データ損失を防ぐために、チェックポイント作成またはバックアップを使用してください。
最適なユースケース
Spotを最大限に活用するためのベストプラクティス
scence01
ディープラーニング
短期トレーニング、プロトタイピング、または小規模推論
トレーニング検証小規模推論
scence02
バッチ処理
夜間、週末、または大規模なデータジョブに費用対効果が高い
データ処理大規模コンピューティング
scence03
教育・デモ
クラスルームラボ、技術ワークショップ、概念実証
ラボワークショップ概念実証
ベストプラクティス
01
チェックポイントを有効にする
Save training state regularly to persistent storage
02
再試行可能なワークロードを設計する
Break jobs into smaller units with resume/retry
03
混合戦略を採用する
Run critical workloads on on-demand, offload flexible ones to Spot
04
迅速に対応する
Use termination notifications to trigger backup or shutdown logic
注意: スポットは柔軟なワークロードに最適です。ミッションクリティカルなアプリケーションにはオンデマンドまたは予約済みを使用してください。
APIs と自動化
完全な API サポートにより、スポットインスタンスをプログラムで管理
料金を確認
料金を確認
Real-time Spot rates
空き状況を確認
空き状況を確認
GPU capacity by model
インスタンスを起動
インスタンスを起動
Provision Spot with billing_type=spot
中断に対応
中断に対応
Subscribe to termination events via API, or email
半額で開始
最大50%のコスト削減
1時間の実行時間保証
1時間前の事前通知