Spot GPU Instances
最大50%オフ – RTX 4090がわずか$0.18/時間から
デフォルトで1時間の保護、1時間前の終了通知、従来のSpotワークフローと完全互換。中断を許容できるワークロードに最適です
利用可能なGPUタイプ:4090A100H100
GPUコストを50%削減
スポットインスタンスを選ぶ理由
信頼性を犠牲にすることなく、わずかなコストでワークロードを実行
最大50%節約
Pay half the on-demand rate
組み込み保護
Guaranteed 1-hour initial runtime
事前通知
1-hour termination alerts via API, email, or console
柔軟なデプロイメント
Combine with on-demand or reserved instances for the right balance of cost and stability
スポットインスタンスのライフサイクル
1時間の実行時間が保証され、その後は自動回収の1時間前に通知されたうえで中断される可能性があります。スポットは余剰キャパシティを使用するため、低コストですがいつでも回収される可能性があります。
01
起動
Instance enters running state
02
1時間保護
No interruptions during this period
03
中断ウィンドウ
After protection ends, instance may be reclaimed
04
終了通知
Sent 1 hour in advance
05
強制終了
Instance is stopped and released automatically
注:ワークロードは中断に耐えられるようにする必要があります。データ損失を防ぐために、チェックポイント作成またはバックアップを使用してください。
最適なユースケース
Spotを最大限に活用するためのベストプラクティス

ディープラーニング
短期トレーニング、プロトタイピング、または小規模推論
トレーニング検証小規模推論

バッチ処理
夜間、週末、または大規模なデータジョブに費用対効果が高い
データ処理大規模コンピューティング

教育・デモ
クラスルームラボ、技術ワークショップ、概念実証
ラボワークショップ概念実証
ベストプラクティス
01
チェックポイントを有効にする
Save training state regularly to persistent storage
02
再試行可能なワークロードを設計する
Break jobs into smaller units with resume/retry
03
混合戦略を採用する
Run critical workloads on on-demand, offload flexible ones to Spot
04
迅速に対応する
Use termination notifications to trigger backup or shutdown logic
注意: スポットは柔軟なワークロードに最適です。ミッションクリティカルなアプリケーションにはオンデマンドまたは予約済みを使用してください。
APIs と自動化
完全な API サポートにより、スポットインスタンスをプログラムで管理
料金を確認
Real-time Spot rates
空き状況を確認
GPU capacity by model
インスタンスを起動
Provision Spot with billing_type=spot
中断に対応
Subscribe to termination events via API, or email