For agents: fetch the complete documentation index at llms.txt. Markdown is available with Accept: text/markdown and with .md URL variants.

AI 原生云面向构建者和智能体

运行模型、扩展 GPUs，并构建 AI 智能体，尽在同一平台。

点击复制给你的智能体的说明：

阅读 https://novita.ai/docs/skill.md 并按照说明操作。

受到信赖

Hugging Face

TiDB

Kilo Code

Quora

OpenRouter

Fish Audio

Hygo

Gizmo

Simular

Wiz

模型 APIs

LLM

IMAGE

AUDIO

VIDEO

VISION

MODEL

"KIMI-K2.5"

200+models

200mslatency

99.5%uptime

1

Serverless模型 APIs

通过单个 API 运行 200+ 个模型。
无需管理基础设施。

文本、图像、音频、视频——全部Serverless，全部
生产就绪。您调用，我们运行。按
token 计费，而不是按小时。

探索所有模型

Deepseek V4 Pro

$1.74/Mt Input · $3.48/Mt Output

1048576 Context

MiniMax M2.7

$0.3/Mt Input · $1.2/Mt Output

204800 Context

GLM-5.1

$1.4/Mt Input · $4.4/Mt Output

204800 Context

Kimi K2.6

$0.95/Mt Input · $4/Mt Output

262144 Context

Gemma 4 31B

$0.14/Mt Input · $0.4/Mt Output

262144 Context

Qwen3.5-397B-A17B

$0.6/Mt Input · $3.6/Mt Output

262144 Context

Deepseek V4 Pro

$1.74/Mt Input · $3.48/Mt Output

1048576 Context

MiniMax M2.7

$0.3/Mt Input · $1.2/Mt Output

204800 Context

GLM-5.1

$1.4/Mt Input · $4.4/Mt Output

204800 Context

Kimi K2.6

$0.95/Mt Input · $4/Mt Output

262144 Context

Gemma 4 31B

$0.14/Mt Input · $0.4/Mt Output

262144 Context

Qwen3.5-397B-A17B

$0.6/Mt Input · $3.6/Mt Output

262144 Context

Deepseek V4 Pro

$1.74/Mt Input · $3.48/Mt Output

1048576 Context

MiniMax M2.7

$0.3/Mt Input · $1.2/Mt Output

204800 Context

GLM-5.1

$1.4/Mt Input · $4.4/Mt Output

204800 Context

Kimi K2.6

$0.95/Mt Input · $4/Mt Output

262144 Context

Gemma 4 31B

$0.14/Mt Input · $0.4/Mt Output

262144 Context

Qwen3.5-397B-A17B

$0.6/Mt Input · $3.6/Mt Output

262144 Context

2

专用端点

私有端点。性能有保障。无嘈杂邻居。

您的模型。您的计算资源。隔离资源意味着在任何吞吐量下都能保持稳定延迟。因为生产环境没有重试预算。

专用端点

智能体沙箱

代理

"coding agents"

coding agent · active

sandbox runtime

运行测试套件 · pytest

排队中

编写修复 · 补丁已应用

运行中

识别错误 · 第 84 行空指针

已完成

读取代码库 · src/api/routes.py

已完成

启动~200ms

隔离Full

计费per second

状态RUNNING

1

智能体沙箱

安全、隔离的运行时。专为真正能做事的智能体而构建。

不是笔记本。也不是需要你自行配置的容器。而是一个专为智能体打造的环境，让智能体能够运行、使用工具、调用模型并执行任务——每一次都干净利落、相互隔离。

GPU 云

GPU

flagship

1

GPU Instances

完全掌控的 GPU 机器。数秒即可拥有。

在你完全掌控的专用 GPU 实例上部署模型、运行推理、从零开始训练。性能可预测。无共享资源。无意外状况。

2

Serverless GPU

提交作业。其余交给我们。

无需预置实例。无需为闲置算力付费。Novita 会自动分配 GPU 资源，在负载增加时扩容，在任务完成后缩容至零。你只需为执行付费，别无其他。

任务

queued

running

complete

allocating gpu resources

allocating

12%

已分配

auto

时长

0.1s

成本

$0.0001

空闲时间

$0.00

集群

"Cluster-01"

CLUSTER-01 · 6 nodesNVLink · GPUDirect RDMA · PCIe

Node-01

51%

Node-02

79%

Node-03

86%

Node-05

89%

Node-06

65%

Node-07

81%

GPU 8× NVIDIA H200

GPU Memory 141 GB HBM3e per GPU

1.128TB total

Nodes 6 / 6

Interconnect NVLink 4th Gen · 900 GB/s

Network 400 Gb/s RDMA

3

Bare Metal

极致性能。零抽象开销。

专用物理 GPU 集群，适用于大规模推理、训练运行以及不能在吞吐量上妥协的企业级部署。当你需要独占硬件时，这就是你的选择。

为什么选择 Novita AI

从第一天起就为 AI 而构建。专为你实际构建的内容而设计。

更优性价比

比主要云服务提供商最高低 50%。不是因为我们偷工减料，而是因为我们自建了基础设施。

为生产级可靠性而构建

稳定的基础设施，具备低延迟、高吞吐量和大规模可靠正常运行时间。

覆盖完整 AI 技术栈的一个平台

模型 APIs、GPU 基础设施和智能体运行时——全部集成于一个平台。

随工作负载扩展

从小规模开始，从 APIs 无缝扩展到专用集群。

在关键时刻提供专属支持

由深谙 AI 基础设施的团队提供快速技术支持。

使用 Novita AI 构建

Testimonials

Don't take our word for it.

我很欣赏 Novita AI 部署新发布模型的速度。他们的团队通常是最早将稳定、生产就绪的推理支持上线的团队之一，很多时候是在发布首日。这种速度对整个开源 AI 社区至关重要。

Julien Chaumond

联合创始人兼 CTO

Novita 对我们 Fish Audio 帮助巨大。他们可靠的 GPU 基础设施让我们能够专注于开发和改进我们的文本转语音模型，而不必处理硬件方面的麻烦。他们的支持和性能让我们更轻松地推动工作向前发展。

Shijia Liao

联合创始人兼首席科学家

Novita 的模型 API 集成起来非常简单，并且在驱动我们的 AI 闪卡和测验方面表现出色。该平台承担了繁重的工作，因此我们可以专注于为用户构建更好的学习工具，而无需担心基础设施或扩展问题。

Petros Christodoulou

联合创始人兼首席执行官

与 Novita AI 合作对 Kilo 来说是一次非常棒的体验。他们的推理平台帮助我们在多个 LLMs 上交付快速且可靠的 AI 编码工作流，并在智能体工作流的真实场景中展现出强大的性能。而且他们的团队非常易于合作！他们始终基于最新模型和技术进行优化——是 Kilo Code 的完美合作伙伴。

Ari Messer

合作伙伴关系负责人

最新动态

ANNOUNCEMENT

Macaron V1 Venti

Available on Novita AI now

$0/0 in/out MTokens | 1048576 Context

ANNOUNCEMENT

Ling-3.0-flash

Available on Novita AI now

$0/0 in/out M Tokens | 262144 Context

ANNOUNCEMENT

Deepseek V4 Pro

Available on Novita AI now

$1.6/3.38 in/out MTokens | 1048576 Context

CASE STUDY

Novita

Hugging Face

Novita available on Hugging Face now

Novita available on Hugging Face now

CASE STUDY

Novita

POE

Novita models on POE now

Novita models on POE now

CASE STUDY

Novita

LLM

Accelerate AI Inference

Accelerate AI Inference

CASE STUDY

Novita

品牌标识

Accelerate AI Inference

Accelerate AI Inference

ANNOUNCEMENT

Featured Blogs

insights, LLM tips, and GPU solutions

CHECK OUT THE LATEST ARTICLES

构建生产级 AI 所需的一切。

200+ 个模型、按需 GPUs 和安全的智能体运行时——统一在一个 API 下。免费开始，随业务增长灵活扩展。