On-demand deployments allow you to use meta-llama/llama-3.2-3b-instruct on dedicated GPUs with high-performance serving stack with high reliability and no rate limits.
Mais de 200 modelos, GPUs sob demanda e ambientes de execução de agentes seguros — unificados em uma única API. Grátis para começar, escala conforme você cresce.