Model Library/Qwen3 Max
qwen/qwen3-max

Qwen3 Max

Socio

qwen/qwen3-max
Qwen/qwen3-max, Enhanced with specialized upgrades in agent programming and tool calling. This official release achieves domain SOTA performance, supporting more complex agent scenarios.

Características

API serverless

Documentación

qwen/qwen3-max is available via Novita's serverless API, where you pay per token. There are several ways to call the API, including OpenAI-compatible endpoints with exceptional reasoning performance.

Serverless disponible

Ejecuta consultas de inmediato, paga solo por el uso

Entrada$2.11 / M Tokens
Salida$8.45 / M Tokens

Precios por niveles

Longitud de entradaPrecio de entrada (M tokens)Precio de salida (M tokens)
1 <= tokens < 32,768$0.845$3.38
32,768 <= tokens < 131,072$1.4$5.64
131,072 <= tokens < 258,048$2.11$8.45

Usa los siguientes ejemplos de código para integrarte con nuestra API:

1from openai import OpenAI
2
3client = OpenAI(
4    api_key="<Your API Key>",
5    base_url="https://api.novita.ai/openai"
6)
7
8response = client.chat.completions.create(
9    model="qwen/qwen3-max",
10    messages=[
11        {"role": "system", "content": "You are a helpful assistant."},
12        {"role": "user", "content": "Hello, how are you?"}
13    ],
14    max_tokens=65536,
15    temperature=0.7
16)
17
18print(response.choices[0].message.content)

Información

Proveedor
Qwen
Cuantización
fp8

Funcionalidad compatible

Longitud del contexto
262144
Salida máxima
65536
Serverless
Compatible
Function Calling
Compatible
Structured Output
Compatible
Capacidades de entrada
text
Capacidades de salida
text

Todo lo que necesitas para crear IA de producción.

Más de 200 modelos, GPUs bajo demanda y entornos de ejecución seguros para agentes, unificados bajo una API. Gratis para empezar, escala a medida que creces.