For agents: fetch the complete documentation index at llms.txt. Markdown is available with Accept: text/markdown and with .md URL variants.

Die KI-native Cloudfür Entwickler undAgenten

Führen Sie Modelle aus, skalieren Sie GPUs und erstellen Sie KI-Agenten – alles auf einer Plattform.

Jetzt loslegen
Kontaktieren Sie uns

Vertraut von

Hugging Face
TiDB
Kilo Code
Quora
OpenRouter
Fish Audio
Hygo
Gizmo
BeBee
Wiz
Harbor x Novita Hackathon

Run in Sandbox.Climb the board.

Benchmark your agent with Harbor + Novita Agent Sandbox.

View Details
1 / 2
MODELL-APIs
LLM
IMAGE
AUDIO
VIDEO
VISION
MODELL
"KIMI-K2.5"
200+models
200mslatency
99.5%uptime
1
Serverless-Modell-APIs

Führen Sie 200+ Modelle über eine einzige API aus. Keine Infrastruktur zu verwalten.

Text, Bild, Audio, Video — alles serverless, allesproduktionsbereit. Sie rufen es auf, wir betreiben es. Abgerechnet nach Token, nicht nach Stunde.

Alle Modelle erkunden
2
Dedizierte Endpunkte

Private Endpunkte. Garantierte Leistung. Keine störenden Nachbarn.

Ihr Modell. Ihre Rechenleistung. Isolierte Ressourcen bedeuten konsistente Latenz bei jedem Durchsatz. Denn in der Produktion gibt es kein Retry-Budget.

Loslegen
Dedizierte Endpunkte
AGENT-SANDBOX
Agent
"coding agents"
coding agent · active
sandbox runtime

Testsuite ausführen · pytest

in der Warteschlange

Korrektur schreiben · Patch angewendet

läuft

Fehler identifizieren · Nullzeiger in Zeile 84

erledigt

Codebasis lesen · src/api/routes.py

erledigt
Start~200ms
IsolationFull
Abrechnungper second
StatusRUNNING
1
Agent-Sandbox

Sichere, isolierte Laufzeitumgebungen. Entwickelt für Agenten, die tatsächlich Dinge erledigen.

Kein Notebook. Kein Container, den Sie selbst konfigurieren. Eine speziell entwickelte Umgebung, in der Agenten ausgeführt werden, Tools nutzen, Modelle aufrufen und Aufgaben erledigen — sauber, isoliert, jedes Mal.

Loslegen
GPU-CLOUD
GPU
flagship
1
GPU Instances

GPU-Maschinen mit voller Kontrolle. In Sekunden für Sie bereit.

Deployen Sie Modelle, führen Sie Inferenz aus und trainieren Sie von Grund auf auf dedizierten GPU-Instanzen, die Sie vollständig kontrollieren. Vorhersehbare Leistung. Keine gemeinsam genutzten Ressourcen. Keine Überraschungen.

2
Serverless GPU

Reichen Sie einen Job ein. Wir erledigen den Rest.

Keine Instanzen bereitzustellen. Keine ungenutzte Rechenleistung, für die Sie bezahlen müssen. Novita weist GPU-Ressourcen automatisch zu, skaliert bei hoher Last hoch und skaliert auf null, wenn Sie fertig sind. Sie zahlen nur für die Ausführung, sonst nichts.

Job
queued
running
complete

allocating gpu resources

allocating
12%

zugewiesen

auto

Dauer

0.1s

Kosten

$0.0001

Leerlaufzeit

$0.00

Cluster
"Cluster-01"
CLUSTER-01 · 6 nodesNVLink · GPUDirect RDMA · PCIe

Node-01

51%

Node-02

79%

Node-03

86%

Node-05

89%

Node-06

65%

Node-07

81%

GPU 8× NVIDIA H200

GPU Memory 141 GB HBM3e per GPU

1.128TB total

Nodes 6 / 6

Interconnect NVLink 4th Gen · 900 GB/s

Network 400 Gb/s RDMA

3
Bare Metal

Maximale Leistung. Null Abstraktions-Overhead.

Dedizierte physische GPU-Cluster für Inferenz im großen Maßstab, Trainingsläufe und Enterprise-Deployments, bei denen keine Kompromisse beim Durchsatz möglich sind. Wenn Sie die Hardware ganz für sich allein benötigen, ist dies die richtige Lösung.

Warum Novita AI

Von Anfang an für AI entwickelt. Konzipiert für das, was Sie tatsächlich bauen.

Besseres Preis-Leistungs-Verhältnis

Bis zu 50 % günstiger als große Cloud-Anbieter. Nicht, weil wir Abstriche machen, sondern weil wir die Infrastruktur gebaut haben.

Für zuverlässigen Produktionsbetrieb entwickelt

Stabile Infrastruktur mit niedriger Latenz, hohem Durchsatz und zuverlässiger Verfügbarkeit in großem Maßstab.

Eine Plattform für den gesamten AI-Stack

Model APIs, GPU-Infrastruktur und Agent-Runtimes — alles auf einer Plattform.

Skalieren Sie mit Ihrer Workload

Klein anfangen und nahtlos von APIs zu dedizierten Clustern skalieren.

Dedizierter Support, wenn es darauf ankommt

Schneller technischer Support von einem Team, das AI-Infrastruktur versteht.

Entwickelt mit Novita AI
Testimonials

Don't take our word for it.

Hugging Face

Ich schätze, wie schnell Novita AI neu veröffentlichte Modelle bereitstellt. Ihr Team gehört oft zu den ersten, die stabile, produktionsreife Inferenzunterstützung online bringen, häufig schon am ersten Tag. Diese Geschwindigkeit ist für die gesamte Open-Source-KI-Community entscheidend.

Julien Chaumond

Julien Chaumond

Mitgründer & CTO

Fish Audio

Novita war für uns bei Fish Audio eine enorme Hilfe. Ihre zuverlässige GPU-Infrastruktur ermöglicht es uns, uns auf die Entwicklung und Verbesserung unserer Text-to-Speech-Modelle zu konzentrieren, statt uns mit Hardware-Problemen herumzuschlagen. Ihr Support und ihre Leistung haben es deutlich einfacher gemacht, unsere Arbeit voranzutreiben.

Shijia Liao

Shijia Liao

Mitgründer & Chief Scientist

Partner

Die Model API von Novita ließ sich super einfach integrieren und hat sich hervorragend bewährt, um unsere KI-gestützten Karteikarten und Quizze zu betreiben. Die Plattform übernimmt die aufwendige Arbeit, sodass wir uns darauf konzentrieren können, bessere Lerntools für unsere Nutzer zu entwickeln, ohne uns um Infrastruktur- oder Skalierungsprobleme sorgen zu müssen.

Petros Christodoulou

Petros Christodoulou

Mitgründer und CEO

Kilo Code

Die Zusammenarbeit mit Novita AI war für Kilo eine fantastische Erfahrung. Ihre Inferenzplattform hilft uns, schnelle und zuverlässige KI-Coding-Workflows über mehrere LLMs hinweg bereitzustellen, mit starker Leistung in der Praxis für agentische Workflows. Und die Zusammenarbeit mit dem Team war bemerkenswert unkompliziert! Sie optimieren stets auf Basis der neuesten Modelle und Technologien – ein perfekter Partner für Kilo Code.

Ari Messer

Ari Messer

Head of Partnerships

Alles, was Sie brauchen, um produktionsreife AI zu entwickeln.

Über 200 Modelle, GPUs auf Abruf und sichere Agent-Runtimes — vereint unter einer API. Kostenlos zum Einstieg, skaliert mit Ihrem Wachstum.