For agents: fetch the complete documentation index at llms.txt. Markdown is available with Accept: text/markdown and with .md URL variants.

AI ネイティブクラウドビルダーとエージェント

モデルを実行し、GPU をスケールし、AI エージェントを構築できます。すべてを 1 つのプラットフォームで。

構築を始める

クリックしてエージェント向けの指示をコピー:

読む https://novita.ai/docs/skill.md そして指示に従ってください。

お問い合わせ

信頼されています

モデルAPI

LLM

IMAGE

AUDIO

VIDEO

VISION

MODEL

"KIMI-K2.5"

200+models

200mslatency

99.5%uptime

サーバーレスモデルAPI

単一のAPIで200以上のモデルを実行できます。
管理すべきインフラストラクチャはありません。

テキスト、画像、音声、動画 — すべてサーバーレス、すべて
本番対応。呼び出すだけで、私たちが実行します。課金は
時間単位ではなく、トークン単位です。

すべてのモデルを見る

Deepseek V4 Pro

$1.74/Mt Input · $3.48/Mt Output

1048576 Context

LLM

MiniMax M2.7

$0.3/Mt Input · $1.2/Mt Output

204800 Context

LLM

GLM-5.1

$1.4/Mt Input · $4.4/Mt Output

204800 Context

LLM

Kimi K2.6

$0.95/Mt Input · $4/Mt Output

262144 Context

LLM

Gemma 4 31B

$0.14/Mt Input · $0.4/Mt Output

262144 Context

LLM

Qwen3.5-397B-A17B

$0.6/Mt Input · $3.6/Mt Output

262144 Context

LLM

Deepseek V4 Pro

$1.74/Mt Input · $3.48/Mt Output

1048576 Context

LLM

MiniMax M2.7

$0.3/Mt Input · $1.2/Mt Output

204800 Context

LLM

GLM-5.1

$1.4/Mt Input · $4.4/Mt Output

204800 Context

LLM

Kimi K2.6

$0.95/Mt Input · $4/Mt Output

262144 Context

LLM

Gemma 4 31B

$0.14/Mt Input · $0.4/Mt Output

262144 Context

LLM

Qwen3.5-397B-A17B

$0.6/Mt Input · $3.6/Mt Output

262144 Context

LLM

Deepseek V4 Pro

$1.74/Mt Input · $3.48/Mt Output

1048576 Context

LLM

MiniMax M2.7

$0.3/Mt Input · $1.2/Mt Output

204800 Context

LLM

GLM-5.1

$1.4/Mt Input · $4.4/Mt Output

204800 Context

LLM

Kimi K2.6

$0.95/Mt Input · $4/Mt Output

262144 Context

LLM

Gemma 4 31B

$0.14/Mt Input · $0.4/Mt Output

262144 Context

LLM

Qwen3.5-397B-A17B

$0.6/Mt Input · $3.6/Mt Output

262144 Context

LLM

専用エンドポイント

プライベートエンドポイント。保証されたパフォーマンス。ノイジーネイバーなし。

あなたのモデル。あなたのコンピュート。分離されたリソースにより、どのスループットでも一貫したレイテンシを実現します。本番環境にはリトライ予算がないからです。

始める

エージェントサンドボックス

エージェント

"coding agents"

coding agent · active

sandbox runtime

テストスイートを実行 · pytest

キュー待ち

修正を書き込み · パッチ適用済み

実行中

バグを特定 · 84行目のヌルポインター

完了

コードベースを読み取り · src/api/routes.py

完了

起動~200ms

分離Full

請求per second

ステータスRUNNING

エージェントサンドボックス

安全で分離されたランタイム。実際にタスクを実行するエージェントのために構築されています。

ノートブックではありません。自分で設定するコンテナでもありません。エージェントが実行され、ツールを使用し、モデルを呼び出し、タスクを実行するために設計された専用環境です — 毎回、クリーンかつ分離された状態で。

始める

GPU クラウド

GPU

flagship

GPU Instances

完全に制御できる GPU マシン。数秒であなた専用に。

モデルのデプロイ、推論の実行、ゼロからのトレーニングを、完全に制御できる専用 GPU インスタンス上で行えます。予測可能なパフォーマンス。共有リソースなし。想定外なし。

Serverless GPU

ジョブを送信してください。残りは私たちが処理します。

プロビジョニングするインスタンスは不要。アイドル状態のコンピュートに支払う必要もありません。Novita は GPU リソースを自動的に割り当て、負荷時にはスケールアップし、完了後はゼロまでスケールダウンします。実行分だけを支払い、それ以外は一切不要です。

ジョブ

queued

running

complete

allocating gpu resources

allocating

12%

割り当て済み

auto

期間

0.1s

コスト

$0.0001

アイドル時間

$0.00

クラスター

"Cluster-01"

CLUSTER-01 · 6 nodesNVLink · GPUDirect RDMA · PCIe

Node-01

51%

Node-02

79%

Node-03

86%

Node-05

89%

Node-06

65%

Node-07

81%

GPU 8× NVIDIA H200

GPU Memory 141 GB HBM3e per GPU

1.128TB total

Nodes 6 / 6

Interconnect NVLink 4th Gen · 900 GB/s

Network 400 Gb/s RDMA

Bare Metal

最大のパフォーマンス。抽象化によるオーバーヘッドはゼロ。

大規模な推論、トレーニング実行、スループットを妥協できないエンタープライズ導入向けの専用物理 GPU クラスター。ハードウェアを独占する必要があるなら、これが最適です。

Novita AIが選ばれる理由

最初からAIのために構築。実際にあなたが構築しているもののために設計されています。

より優れた価格性能比

主要クラウドプロバイダーより最大50%低コスト。手を抜いたからではなく、インフラを自社で構築したからです。

本番環境の信頼性を重視して構築

低レイテンシ、高スループット、そして大規模環境での信頼性の高い稼働時間を備えた安定したインフラ。

AIスタック全体のための1つのプラットフォーム

Model APIs、GPUインフラ、エージェントランタイムを、すべて1つのプラットフォームで。

ワークロードに合わせてスケール

小さく始めて、APIsから専用クラスターまでシームレスにスケール。

必要なときに受けられる専任サポート

AIインフラを理解するチームによる迅速なテクニカルサポート。

Novita AIで構築

Testimonials

Don't take our word for it.

Novita AI が新しくリリースされたモデルを展開する速さには感心しています。同社のチームは、安定した本番対応の推論サポートをオンラインで提供する最初の存在になることが多く、初日から対応することも珍しくありません。このスピードは、オープンソース AI コミュニティ全体にとって非常に重要です。

Julien Chaumond

共同創業者兼CTO

Novita は Fish Audio にとって大きな助けとなっています。信頼性の高い GPU インフラストラクチャのおかげで、ハードウェアの悩みに対処する代わりに、テキスト読み上げモデルの開発と改善に集中できます。サポートとパフォーマンスにより、私たちの取り組みを前進させることがはるかに容易になりました。

Shijia Liao

共同創業者兼チーフサイエンティスト

Novita の Model API は統合が非常に簡単で、AI 駆動のフラッシュカードやクイズを支えるうえで大いに役立っています。プラットフォームが大変な処理を引き受けてくれるため、インフラストラクチャやスケーリングの問題を心配することなく、ユーザーのためにより良い学習ツールを構築することに集中できます。

Petros Christodoulou

共同創業者兼CEO

Novita AIとの協業は、Kiloにとって素晴らしい経験となっています。同社の推論プラットフォームは、複数のLLMsにわたって高速で信頼性の高いAIコーディングワークフローを提供するうえで役立っており、エージェント型ワークフローにおいても実環境で優れたパフォーマンスを発揮しています。そして、チームは非常に仕事がしやすいです！常に最新のモデルとテクノロジーに基づいて最適化を続けており、Kilo Codeにとって理想的なパートナーです。