Modelos de Linguagem de Grande Porte

Explore nossos modelos de código aberto compatíveis e implante em endpoints dedicados

Novo
minimax-m3MiniMax-M3
$0.3/MtEntrada
$0.06/MtLeitura de cache
$1.2/MtSaída
1000000Contexto
131072Saída máxima
LLMServerless
Novo
deepseek-v4-proDeepseek V4 Pro
$1.6/MtEntrada
$0.135/MtLeitura de cache
$3.2/MtSaída
1048576Contexto
393216Saída máxima
LLMServerless
Novo
deepseek-v4-flashDeepseek V4 Flash
$0.14/MtEntrada
$0.028/MtLeitura de cache
$0.28/MtSaída
1048576Contexto
393216Saída máxima
LLMServerless
Em alta
deepseek-v3.2Deepseek V3.2
$0.269/MtEntrada
$0.1345/MtLeitura de cache
$0.4/MtSaída
163840Contexto
65536Saída máxima
LLMServerless
Novo
MXiaomiMiMo/MiMo-V2.5
$0.3/MtEntrada
$0.056/MtLeitura de cache
$1.4/MtSaída
1048576Contexto
131072Saída máxima
LLMServerless
LIMITED TIME 50% OFF
qwen3.7-maxQwen3.7-Max
$1.25/MtEntrada
$1.5625/MtGravação de cache (5m)
$0.125/MtLeitura de cache
$3.75/MtSaída
1000000Contexto
65536Saída máxima
LLMServerless
Novo
MXiaomiMiMo/MiMo-V2.5-Pro
$2/MtEntrada
$0.4/MtLeitura de cache
$6/MtSaída
1048576Contexto
131072Saída máxima
LLMServerless
Novo
qwen3.6-27bQwen3.6-27B
$0.6/MtEntrada
$3.6/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
kimi-k2.6Kimi K2.6
$0.8/MtEntrada
$0.16/MtLeitura de cache
$3.4/MtSaída
262144Contexto
262144Saída máxima
LLMServerless
Novo
glm-5.1GLM-5.1
$1.38/MtEntrada
$0.26/MtLeitura de cache
$4.4/MtSaída
204800Contexto
131072Saída máxima
LLMServerless
Novo
gemma-4-26b-a4b-itGemma 4 26B A4B
$0.13/MtEntrada
$0.4/MtSaída
262144Contexto
131072Saída máxima
LLMServerless
Novo
gemma-4-31b-itGemma 4 31B
$0.14/MtEntrada
$0.4/MtSaída
262144Contexto
131072Saída máxima
LLMServerless
Novo
minimax-m2.7MiniMax M2.7
$0.3/MtEntrada
$0.06/MtLeitura de cache
$1.2/MtSaída
204800Contexto
131072Saída máxima
LLMServerless
Novo
minimax-m2.5-highspeedMiniMax M2.5-highspeed
$0.6/MtEntrada
$0.03/MtLeitura de cache
$2.4/MtSaída
204800Contexto
131100Saída máxima
LLMServerless
Novo
qwen3.5-27bQwen3.5-27B
$0.3/MtEntrada
$2.4/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
qwen3.5-122b-a10bQwen3.5-122B-A10B
$0.4/MtEntrada
$3.2/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
qwen3.5-35b-a3bQwen3.5-35B-A3B
$0.25/MtEntrada
$2/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
qwen3.5-397b-a17bQwen3.5-397B-A17B
$0.6/MtEntrada
$3.6/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
minimax-m2.5MiniMax M2.5
$0.3/MtEntrada
$0.03/MtLeitura de cache
$1.2/MtSaída
204800Contexto
131100Saída máxima
LLMServerless
Novo
glm-5GLM-5
$1/MtEntrada
$0.2/MtLeitura de cache
$3.2/MtSaída
202800Contexto
131072Saída máxima
LLMServerless
Novo
qwen3-coder-nextQwen3 Coder Next
$0.2/MtEntrada
$1.5/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
deepseek-ocr-2DeepSeek-OCR 2
$0.03/MtEntrada
$0.03/MtSaída
8192Contexto
8192Saída máxima
LLMServerless
Novo
kimi-k2.5Kimi K2.5
$0.6/MtEntrada
$0.1/MtLeitura de cache
$3/MtSaída
262144Contexto
262144Saída máxima
LLMServerless
glm-4.7-flashGLM-4.7-Flash
$0.07/MtEntrada
$0.01/MtLeitura de cache
$0.4/MtSaída
200000Contexto
128000Saída máxima
LLMServerless
minimax-m2.1Minimax M2.1
$0.3/MtEntrada
$0.03/MtLeitura de cache
$1.2/MtSaída
204800Contexto
131072Saída máxima
LLMServerless
glm-4.7GLM-4.7
$0.6/MtEntrada
$0.11/MtLeitura de cache
$2.2/MtSaída
204800Contexto
131072Saída máxima
LLMServerless
Novo
MXiaomiMiMo/MiMo-V2-Flash
$0.11/MtEntrada
$0.024/MtLeitura de cache
$0.33/MtSaída
262144Contexto
32000Saída máxima
LLMServerless
Novo
autoglm-phone-9b-multilingualAutoGLM-Phone-9B-Multilingual
$0.035/MtEntrada
$0.138/MtSaída
65536Contexto
65536Saída máxima
LLMServerless
Novo
kimi-k2-thinkingKimi K2 Thinking
$0.6/MtEntrada
$0.15/MtLeitura de cache
$2.5/MtSaída
262144Contexto
262144Saída máxima
LLMServerless
minimax-m2MiniMax-M2
$0.3/MtEntrada
$0.03/MtLeitura de cache
$1.2/MtSaída
204800Contexto
131072Saída máxima
LLMServerless
paddleocr-vlPaddleOCR-VL
$0.02/MtEntrada
$0.02/MtSaída
16384Contexto
16384Saída máxima
LLM
deepseek-v3.2-expDeepseek V3.2 Exp
$0.27/MtEntrada
$0.41/MtSaída
163840Contexto
65536Saída máxima
LLMServerless
Novo
qwen3-vl-235b-a22b-thinkingQwen3 VL 235B A22B Thinking
$0.98/MtEntrada
$3.95/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
Novo
glm-4.6vGLM 4.6V
$0.3/MtEntrada
$0.055/MtLeitura de cache
$0.9/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
Novo
glm-4.6GLM 4.6
$0.55/MtEntrada
$0.11/MtLeitura de cache
$2.2/MtSaída
204800Contexto
131072Saída máxima
LLMServerless
Novo
qwen3.6-35b-a3bQwen3.6-35B-A3B
$0.248/MtEntrada
$1.485/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
kat-coder-proKat Coder Pro
$0.3/MtEntrada
$0.06/MtLeitura de cache
$1.2/MtSaída
256000Contexto
128000Saída máxima
LLMServerless
qwen3-next-80b-a3b-instructQwen3 Next 80B A3B Instruct
$0.15/MtEntrada
$1.5/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
qwen3-next-80b-a3b-thinkingQwen3 Next 80B A3B Thinking
$0.15/MtEntrada
$1.5/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
deepseek-ocrDeepSeek-OCR
$0.03/MtEntrada
$0.03/MtSaída
8192Contexto
8192Saída máxima
LLM
Novo
deepseek-v3.1-terminusDeepseek V3.1 Terminus
$0.27/MtEntrada
$0.135/MtLeitura de cache
$1/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
Novo
qwen3-vl-235b-a22b-instructQwen3 VL 235B A22B Instruct
$0.3/MtEntrada
$1.5/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
qwen3-maxQwen3 Max
$2.11/MtEntrada
$8.45/MtSaída
262144Contexto
65536Saída máxima

Parceiro

LLMServerless
deepseek-v3.1DeepSeek V3.1
$0.27/MtEntrada
$0.135/MtLeitura de cache
$1/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
kimi-k2-0905Kimi K2 0905
$0.6/MtEntrada
$2.5/MtSaída
262144Contexto
262144Saída máxima
LLMServerless
qwen3-coder-480b-a35b-instructQwen3 Coder 480B A35B Instruct
$0.38/MtEntrada
$1.55/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
Novo
qwen3-coder-30b-a3b-instructQwen3 Coder 30b A3B Instruct
$0.07/MtEntrada
$0.27/MtSaída
160000Contexto
32768Saída máxima
LLMServerless
OpenAI
OpenAI GPT OSS 120B
$0.05/MtEntrada
$0.25/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
kimi-k2-instructKimi K2 Instruct
$0.57/MtEntrada
$2.3/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
Em alta
deepseek-v3-0324DeepSeek V3 0324
$0.27/MtEntrada
$0.135/MtLeitura de cache
$1.12/MtSaída
163840Contexto
65536Saída máxima
LLMServerless
glm-4.5GLM-4.5
$0.6/MtEntrada
$0.11/MtLeitura de cache
$2.2/MtSaída
131072Contexto
98304Saída máxima
LLMServerless
qwen3-235b-a22b-thinking-2507Qwen3 235B A22b Thinking 2507
$0.3/MtEntrada
$3/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
llama-3.1-8b-instructLlama 3.1 8B Instruct
$0.02/MtEntrada
$0.05/MtSaída
16384Contexto
16384Saída máxima
LLMServerless
Novo
gemma-3-12b-itGemma3 12B
$0.05/MtEntrada
$0.1/MtSaída
131072Contexto
8192Saída máxima
LLM
glm-4.5vGLM 4.5V
$0.6/MtEntrada
$0.11/MtLeitura de cache
$1.8/MtSaída
65536Contexto
16384Saída máxima
LLMServerless
OpenAI
OpenAI: GPT OSS 20B
$0.04/MtEntrada
$0.15/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
qwen3-235b-a22b-instruct-2507Qwen3 235B A22B Instruct 2507
$0.09/MtEntrada
$0.58/MtSaída
131072Contexto
16384Saída máxima
LLMServerless
deepseek-r1-distill-qwen-14bDeepSeek R1 Distill Qwen 14B
$0.15/MtEntrada
$0.15/MtSaída
32768Contexto
16384Saída máxima
LLM
llama-3.3-70b-instructLlama 3.3 70B Instruct
$0.135/MtEntrada
$0.4/MtSaída
131072Contexto
120000Saída máxima
LLMServerless
qwen-2.5-72b-instructQwen 2.5 72B Instruct
$0.38/MtEntrada
$0.4/MtSaída
32000Contexto
8192Saída máxima
LLMServerless
mistral-nemoMistral Nemo
$0.04/MtEntrada
$0.17/MtSaída
60288Contexto
16000Saída máxima
LLMServerless
minimax-m1-80kMiniMax M1
$0.55/MtEntrada
$2.2/MtSaída
1000000Contexto
40000Saída máxima
LLMServerless
deepseek-r1-0528DeepSeek R1 0528
$0.7/MtEntrada
$0.35/MtLeitura de cache
$2.5/MtSaída
163840Contexto
32768Saída máxima
LLMServerless
deepseek-r1-distill-qwen-32bDeepSeek R1 Distill Qwen 32B
$0.3/MtEntrada
$0.3/MtSaída
64000Contexto
32000Saída máxima
LLM
llama-3-8b-instructLlama 3 8B Instruct
$0.04/MtEntrada
$0.04/MtSaída
8192Contexto
8192Saída máxima
LLMServerless
wizardlm-2-8x22bWizardlm 2 8x22B
$0.62/MtEntrada
$0.62/MtSaída
65535Contexto
8000Saída máxima
LLMServerless
Dedicated
deepseek-r1-0528-qwen3-8bDeepSeek R1 0528 Qwen3 8B
$0.06/MtEntrada
$0.09/MtSaída
128000Contexto
32000Saída máxima
LLM
deepseek-r1-distill-llama-70bDeepSeek R1 Distill LLama 70B
$0.8/MtEntrada
$0.8/MtSaída
8192Contexto
8192Saída máxima
LLMServerless
llama-3-70b-instructLlama3 70B Instruct
$0.51/MtEntrada
$0.74/MtSaída
8192Contexto
8000Saída máxima
LLMServerless
qwen3-235b-a22b-fp8Qwen3 235B A22B
$0.2/MtEntrada
$0.8/MtSaída
40960Contexto
20000Saída máxima
LLMServerless
llama-4-maverick-17b-128e-instruct-fp8Llama 4 Maverick Instruct
$0.27/MtEntrada
$0.85/MtSaída
1048576Contexto
8192Saída máxima
LLMServerless
Dedicated
llama-4-scout-17b-16e-instructLlama 4 Scout Instruct
$0.18/MtEntrada
$0.59/MtSaída
131072Contexto
131072Saída máxima
LLMServerless
hermes-2-pro-llama-3-8bHermes 2 Pro Llama 3 8B
$0.14/MtEntrada
$0.14/MtSaída
8192Contexto
8192Saída máxima
LLMServerless
l3-70b-euryale-v2.1L3 70B Euryale V2.1
$1.48/MtEntrada
$1.48/MtSaída
8192Contexto
8192Saída máxima
LLM
l3-8b-lunarisSao10k L3 8B Lunaris
$0.05/MtEntrada
$0.05/MtSaída
8192Contexto
8192Saída máxima
LLMServerless
Baichuan
BaiChuan M2 32B
$0.07/MtEntrada
$0.07/MtSaída
131072Contexto
131072Saída máxima
LLM
Wenxin
ERNIE 4.5 VL 424B A47B
$0.42/MtEntrada
$1.25/MtSaída
123000Contexto
16000Saída máxima
LLMServerless
deepseek-prover-v2-671bDeepseek Prover V2 671B
$0.7/MtEntrada
$2.5/MtSaída
160000Contexto
160000Saída máxima
LLMServerless
qwen3-32b-fp8Qwen3 32B
$0.1/MtEntrada
$0.45/MtSaída
40960Contexto
20000Saída máxima
LLMServerless
qwen3-30b-a3b-fp8Qwen3 30B A3B
$0.09/MtEntrada
$0.45/MtSaída
40960Contexto
20000Saída máxima
LLMServerless
gemma-3-27b-itGemma 3 27B
$0.119/MtEntrada
$0.2/MtSaída
98304Contexto
16384Saída máxima
LLMServerless
deepseek-v3-turboDeepSeek V3 (Turbo)
$0.4/MtEntrada
$1.3/MtSaída
64000Contexto
16000Saída máxima
LLMServerless
deepseek-r1-turboDeepSeek R1 (Turbo)
$0.7/MtEntrada
$2.5/MtSaída
64000Contexto
16000Saída máxima
LLMServerless
L3-8B-Stheno-v3.2L3 8B Stheno V3.2
$0.05/MtEntrada
$0.05/MtSaída
8192Contexto
32000Saída máxima
LLMServerless
MMythomax L2 13B
$0.09/MtEntrada
$0.09/MtSaída
4096Contexto
3200Saída máxima
LLM
RRing-2.6-1T
$0.3/MtEntrada
$0.06/MtLeitura de cache
$2.5/MtSaída
262144Contexto
65536Saída máxima
LLMServerless
LLing-2.6-flash
$0.1/MtEntrada
$0.02/MtLeitura de cache
$0.3/MtSaída
262144Contexto
32768Saída máxima
LLMServerless
LLing-2.6-1T
$0.3/MtEntrada
$0.06/MtLeitura de cache
$2.5/MtSaída
262144Contexto
32768Saída máxima
LLMServerless
ELing-2.6-flash
$0.1/MtEntrada
$0.02/MtLeitura de cache
$0.3/MtSaída
262144Contexto
32768Saída máxima
LLMServerless
qwen3-vl-8b-instructqwen/qwen3-vl-8b-instruct
$0.08/MtEntrada
$0.5/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
glm-4.5-airzai-org/glm-4.5-air
$0.13/MtEntrada
$0.025/MtLeitura de cache
$0.85/MtSaída
131072Contexto
98304Saída máxima
LLMServerless
qwen3-vl-30b-a3b-instructqwen/qwen3-vl-30b-a3b-instruct
$0.2/MtEntrada
$0.7/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
qwen3-vl-30b-a3b-thinkingqwen/qwen3-vl-30b-a3b-thinking
$0.2/MtEntrada
$1/MtSaída
131072Contexto
32768Saída máxima
LLMServerless
qwen3-omni-30b-a3b-thinkingQwen3 Omni 30B A3B Thinking
$0.25/MtEntrada
$0.97/MtSaída
65536Contexto
16384Saída máxima
LLMServerless
qwen3-omni-30b-a3b-instructQwen3 Omni 30B A3B Instruct
$0.25/MtEntrada
$0.97/MtSaída
65536Contexto
16384Saída máxima
LLMServerless
Novo
qwen-mt-plusQwen MT Plus
$0.25/MtEntrada
$0.75/MtSaída
16384Contexto
8192Saída máxima
LLMServerless
Wenxin
ERNIE 4.5 VL 28B A3B
$0.14/MtEntrada
$0.56/MtSaída
30000Contexto
8000Saída máxima
LLMServerless
Wenxin
ERNIE 4.5 21B A3B
$0.07/MtEntrada
$0.28/MtSaída
120000Contexto
8000Saída máxima
LLMServerless
Dedicated
qwen3-8b-fp8Qwen3 8B
$0.035/MtEntrada
$0.138/MtSaída
128000Contexto
20000Saída máxima
LLM
llama-3.2-3b-instructLlama 3.2 3B Instruct
$0.03/MtEntrada
$0.05/MtSaída
32768Contexto
32000Saída máxima
LLM
l31-70b-euryale-v2.2L31 70B Euryale V2.2
$1.48/MtEntrada
$1.48/MtSaída
8192Contexto
8192Saída máxima
LLMServerless

Endpoint dedicado

Infraestrutura de nível empresarial para IA

Para empresas que exigem maior desempenho, SLAs personalizados ou hospedagem privada para modelos personalizados
  • Custom pricing
  • Guaranteed uptime & latency
  • Unlimited scale
  • Dedicated clusters
Obter endpoint de nível empresarial
de-banner