On-demand deployments allow you to use qwen/qwen3-8b-fp8 on dedicated GPUs with high-performance serving stack with high reliability and no rate limits.
Mais de 200 modelos, GPUs sob demanda e ambientes de execução de agentes seguros — unificados em uma única API. Grátis para começar, escala conforme você cresce.