For agents: fetch the complete documentation index at llms.txt. Markdown is available with Accept: text/markdown and with .md URL variants.

AI ネイティブクラウドビルダーとエージェント

モデルを実行し、GPU をスケールし、AI エージェントを構築できます。すべてを 1 つのプラットフォームで。

構築を始める
お問い合わせ

信頼されています

Hugging Face
TiDB
Kilo Code
Quora
OpenRouter
Fish Audio
Hygo
Gizmo
BeBee
Wiz
Harbor x Novita Hackathon

Run in Sandbox.Climb the board.

Benchmark your agent with Harbor + Novita Agent Sandbox.

View Details
1 / 2
モデルAPI
LLM
IMAGE
AUDIO
VIDEO
VISION
MODEL
"KIMI-K2.5"
200+models
200mslatency
99.5%uptime
1
サーバーレスモデルAPI

単一のAPIで200以上のモデルを実行できます。 管理すべきインフラストラクチャはありません。

テキスト、画像、音声、動画 — すべてサーバーレス、すべて本番対応。呼び出すだけで、私たちが実行します。課金は 時間単位ではなく、トークン単位です。

すべてのモデルを見る
2
専用エンドポイント

プライベートエンドポイント。保証されたパフォーマンス。ノイジーネイバーなし。

あなたのモデル。あなたのコンピュート。分離されたリソースにより、どのスループットでも一貫したレイテンシを実現します。本番環境にはリトライ予算がないからです。

始める
専用エンドポイント
エージェントサンドボックス
エージェント
"coding agents"
coding agent · active
sandbox runtime

テストスイートを実行 · pytest

キュー待ち

修正を書き込み · パッチ適用済み

実行中

バグを特定 · 84行目のヌルポインター

完了

コードベースを読み取り · src/api/routes.py

完了
起動~200ms
分離Full
請求per second
ステータスRUNNING
1
エージェントサンドボックス

安全で分離されたランタイム。実際にタスクを実行するエージェントのために構築されています。

ノートブックではありません。自分で設定するコンテナでもありません。エージェントが実行され、ツールを使用し、モデルを呼び出し、タスクを実行するために設計された専用環境です — 毎回、クリーンかつ分離された状態で。

始める
GPU クラウド
GPU
flagship
1
GPU Instances

完全に制御できる GPU マシン。数秒であなた専用に。

モデルのデプロイ、推論の実行、ゼロからのトレーニングを、完全に制御できる専用 GPU インスタンス上で行えます。予測可能なパフォーマンス。共有リソースなし。想定外なし。

2
Serverless GPU

ジョブを送信してください。残りは私たちが処理します。

プロビジョニングするインスタンスは不要。アイドル状態のコンピュートに支払う必要もありません。Novita は GPU リソースを自動的に割り当て、負荷時にはスケールアップし、完了後はゼロまでスケールダウンします。実行分だけを支払い、それ以外は一切不要です。

ジョブ
queued
running
complete

allocating gpu resources

allocating
12%

割り当て済み

auto

期間

0.1s

コスト

$0.0001

アイドル時間

$0.00

クラスター
"Cluster-01"
CLUSTER-01 · 6 nodesNVLink · GPUDirect RDMA · PCIe

Node-01

51%

Node-02

79%

Node-03

86%

Node-05

89%

Node-06

65%

Node-07

81%

GPU 8× NVIDIA H200

GPU Memory 141 GB HBM3e per GPU

1.128TB total

Nodes 6 / 6

Interconnect NVLink 4th Gen · 900 GB/s

Network 400 Gb/s RDMA

3
Bare Metal

最大のパフォーマンス。抽象化によるオーバーヘッドはゼロ。

大規模な推論、トレーニング実行、スループットを妥協できないエンタープライズ導入向けの専用物理 GPU クラスター。ハードウェアを独占する必要があるなら、これが最適です。

Novita AIが選ばれる理由

最初からAIのために構築。実際にあなたが構築しているもののために設計されています。

より優れた価格性能比

主要クラウドプロバイダーより最大50%低コスト。手を抜いたからではなく、インフラを自社で構築したからです。

本番環境の信頼性を重視して構築

低レイテンシ、高スループット、そして大規模環境での信頼性の高い稼働時間を備えた安定したインフラ。

AIスタック全体のための1つのプラットフォーム

Model APIs、GPUインフラ、エージェントランタイムを、すべて1つのプラットフォームで。

ワークロードに合わせてスケール

小さく始めて、APIsから専用クラスターまでシームレスにスケール。

必要なときに受けられる専任サポート

AIインフラを理解するチームによる迅速なテクニカルサポート。

Novita AIで構築
Testimonials

Don't take our word for it.

Hugging Face

Novita AI が新しくリリースされたモデルを展開する速さには感心しています。同社のチームは、安定した本番対応の推論サポートをオンラインで提供する最初の存在になることが多く、初日から対応することも珍しくありません。このスピードは、オープンソース AI コミュニティ全体にとって非常に重要です。

Julien Chaumond

Julien Chaumond

共同創業者兼CTO

Fish Audio

Novita は Fish Audio にとって大きな助けとなっています。信頼性の高い GPU インフラストラクチャのおかげで、ハードウェアの悩みに対処する代わりに、テキスト読み上げモデルの開発と改善に集中できます。サポートとパフォーマンスにより、私たちの取り組みを前進させることがはるかに容易になりました。

Shijia Liao

Shijia Liao

共同創業者兼チーフサイエンティスト

Partner

Novita の Model API は統合が非常に簡単で、AI 駆動のフラッシュカードやクイズを支えるうえで大いに役立っています。プラットフォームが大変な処理を引き受けてくれるため、インフラストラクチャやスケーリングの問題を心配することなく、ユーザーのためにより良い学習ツールを構築することに集中できます。

Petros Christodoulou

Petros Christodoulou

共同創業者兼CEO

Kilo Code

Novita AIとの協業は、Kiloにとって素晴らしい経験となっています。同社の推論プラットフォームは、複数のLLMsにわたって高速で信頼性の高いAIコーディングワークフローを提供するうえで役立っており、エージェント型ワークフローにおいても実環境で優れたパフォーマンスを発揮しています。そして、チームは非常に仕事がしやすいです!常に最新のモデルとテクノロジーに基づいて最適化を続けており、Kilo Codeにとって理想的なパートナーです。

Ari Messer

Ari Messer

パートナーシップ責任者

本番環境向けAIを構築するために必要なすべて。

200以上のモデル、オンデマンド GPUs、安全なエージェントランタイムを、1つの API に統合。無料で始められ、成長に合わせてスケールできます。