Grands modèles de langage

Parcourez nos modèles open source pris en charge et déployez-les sur des points de terminaison dédiés

Nouveau
minimax-m3MiniMax-M3
$0.3/MtEntrée
$0.06/MtLecture du cache
$1.2/MtSortie
1000000Contexte
131072Sortie max.
LLMServerless
Nouveau
deepseek-v4-proDeepseek V4 Pro
$1.6/MtEntrée
$0.135/MtLecture du cache
$3.2/MtSortie
1048576Contexte
393216Sortie max.
LLMServerless
Nouveau
deepseek-v4-flashDeepseek V4 Flash
$0.14/MtEntrée
$0.028/MtLecture du cache
$0.28/MtSortie
1048576Contexte
393216Sortie max.
LLMServerless
Tendance
deepseek-v3.2Deepseek V3.2
$0.269/MtEntrée
$0.1345/MtLecture du cache
$0.4/MtSortie
163840Contexte
65536Sortie max.
LLMServerless
Nouveau
MXiaomiMiMo/MiMo-V2.5
$0.3/MtEntrée
$0.056/MtLecture du cache
$1.4/MtSortie
1048576Contexte
131072Sortie max.
LLMServerless
LIMITED TIME 50% OFF
qwen3.7-maxQwen3.7-Max
$1.25/MtEntrée
$1.5625/MtÉcriture dans le cache (5 min)
$0.125/MtLecture du cache
$3.75/MtSortie
1000000Contexte
65536Sortie max.
LLMServerless
Nouveau
MXiaomiMiMo/MiMo-V2.5-Pro
$2/MtEntrée
$0.4/MtLecture du cache
$6/MtSortie
1048576Contexte
131072Sortie max.
LLMServerless
Nouveau
qwen3.6-27bQwen3.6-27B
$0.6/MtEntrée
$3.6/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
kimi-k2.6Kimi K2.6
$0.8/MtEntrée
$0.16/MtLecture du cache
$3.4/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
Nouveau
glm-5.1GLM-5.1
$1.38/MtEntrée
$0.26/MtLecture du cache
$4.4/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
Nouveau
gemma-4-26b-a4b-itGemma 4 26B A4B
$0.13/MtEntrée
$0.4/MtSortie
262144Contexte
131072Sortie max.
LLMServerless
Nouveau
gemma-4-31b-itGemma 4 31B
$0.14/MtEntrée
$0.4/MtSortie
262144Contexte
131072Sortie max.
LLMServerless
Nouveau
minimax-m2.7MiniMax M2.7
$0.3/MtEntrée
$0.06/MtLecture du cache
$1.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
Nouveau
minimax-m2.5-highspeedMiniMax M2.5-highspeed
$0.6/MtEntrée
$0.03/MtLecture du cache
$2.4/MtSortie
204800Contexte
131100Sortie max.
LLMServerless
Nouveau
qwen3.5-27bQwen3.5-27B
$0.3/MtEntrée
$2.4/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
qwen3.5-122b-a10bQwen3.5-122B-A10B
$0.4/MtEntrée
$3.2/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
qwen3.5-35b-a3bQwen3.5-35B-A3B
$0.25/MtEntrée
$2/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
qwen3.5-397b-a17bQwen3.5-397B-A17B
$0.6/MtEntrée
$3.6/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
minimax-m2.5MiniMax M2.5
$0.3/MtEntrée
$0.03/MtLecture du cache
$1.2/MtSortie
204800Contexte
131100Sortie max.
LLMServerless
Nouveau
glm-5GLM-5
$1/MtEntrée
$0.2/MtLecture du cache
$3.2/MtSortie
202800Contexte
131072Sortie max.
LLMServerless
Nouveau
qwen3-coder-nextQwen3 Coder Next
$0.2/MtEntrée
$1.5/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
deepseek-ocr-2DeepSeek-OCR 2
$0.03/MtEntrée
$0.03/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
Nouveau
kimi-k2.5Kimi K2.5
$0.6/MtEntrée
$0.1/MtLecture du cache
$3/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
glm-4.7-flashGLM-4.7-Flash
$0.07/MtEntrée
$0.01/MtLecture du cache
$0.4/MtSortie
200000Contexte
128000Sortie max.
LLMServerless
minimax-m2.1Minimax M2.1
$0.3/MtEntrée
$0.03/MtLecture du cache
$1.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
glm-4.7GLM-4.7
$0.6/MtEntrée
$0.11/MtLecture du cache
$2.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
Nouveau
MXiaomiMiMo/MiMo-V2-Flash
$0.11/MtEntrée
$0.024/MtLecture du cache
$0.33/MtSortie
262144Contexte
32000Sortie max.
LLMServerless
Nouveau
autoglm-phone-9b-multilingualAutoGLM-Phone-9B-Multilingual
$0.035/MtEntrée
$0.138/MtSortie
65536Contexte
65536Sortie max.
LLMServerless
Nouveau
kimi-k2-thinkingKimi K2 Thinking
$0.6/MtEntrée
$0.15/MtLecture du cache
$2.5/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
minimax-m2MiniMax-M2
$0.3/MtEntrée
$0.03/MtLecture du cache
$1.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
paddleocr-vlPaddleOCR-VL
$0.02/MtEntrée
$0.02/MtSortie
16384Contexte
16384Sortie max.
LLM
deepseek-v3.2-expDeepseek V3.2 Exp
$0.27/MtEntrée
$0.41/MtSortie
163840Contexte
65536Sortie max.
LLMServerless
Nouveau
qwen3-vl-235b-a22b-thinkingQwen3 VL 235B A22B Thinking
$0.98/MtEntrée
$3.95/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Nouveau
glm-4.6vGLM 4.6V
$0.3/MtEntrée
$0.055/MtLecture du cache
$0.9/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Nouveau
glm-4.6GLM 4.6
$0.55/MtEntrée
$0.11/MtLecture du cache
$2.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
Nouveau
qwen3.6-35b-a3bQwen3.6-35B-A3B
$0.248/MtEntrée
$1.485/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
kat-coder-proKat Coder Pro
$0.3/MtEntrée
$0.06/MtLecture du cache
$1.2/MtSortie
256000Contexte
128000Sortie max.
LLMServerless
qwen3-next-80b-a3b-instructQwen3 Next 80B A3B Instruct
$0.15/MtEntrée
$1.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
qwen3-next-80b-a3b-thinkingQwen3 Next 80B A3B Thinking
$0.15/MtEntrée
$1.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
deepseek-ocrDeepSeek-OCR
$0.03/MtEntrée
$0.03/MtSortie
8192Contexte
8192Sortie max.
LLM
Nouveau
deepseek-v3.1-terminusDeepseek V3.1 Terminus
$0.27/MtEntrée
$0.135/MtLecture du cache
$1/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Nouveau
qwen3-vl-235b-a22b-instructQwen3 VL 235B A22B Instruct
$0.3/MtEntrée
$1.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
qwen3-maxQwen3 Max
$2.11/MtEntrée
$8.45/MtSortie
262144Contexte
65536Sortie max.

Partenaire

LLMServerless
deepseek-v3.1DeepSeek V3.1
$0.27/MtEntrée
$0.135/MtLecture du cache
$1/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
kimi-k2-0905Kimi K2 0905
$0.6/MtEntrée
$2.5/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
qwen3-coder-480b-a35b-instructQwen3 Coder 480B A35B Instruct
$0.38/MtEntrée
$1.55/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
qwen3-coder-30b-a3b-instructQwen3 Coder 30b A3B Instruct
$0.07/MtEntrée
$0.27/MtSortie
160000Contexte
32768Sortie max.
LLMServerless
OpenAI
OpenAI GPT OSS 120B
$0.05/MtEntrée
$0.25/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
kimi-k2-instructKimi K2 Instruct
$0.57/MtEntrée
$2.3/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Tendance
deepseek-v3-0324DeepSeek V3 0324
$0.27/MtEntrée
$0.135/MtLecture du cache
$1.12/MtSortie
163840Contexte
65536Sortie max.
LLMServerless
glm-4.5GLM-4.5
$0.6/MtEntrée
$0.11/MtLecture du cache
$2.2/MtSortie
131072Contexte
98304Sortie max.
LLMServerless
qwen3-235b-a22b-thinking-2507Qwen3 235B A22b Thinking 2507
$0.3/MtEntrée
$3/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
llama-3.1-8b-instructLlama 3.1 8B Instruct
$0.02/MtEntrée
$0.05/MtSortie
16384Contexte
16384Sortie max.
LLMServerless
Nouveau
gemma-3-12b-itGemma3 12B
$0.05/MtEntrée
$0.1/MtSortie
131072Contexte
8192Sortie max.
LLM
glm-4.5vGLM 4.5V
$0.6/MtEntrée
$0.11/MtLecture du cache
$1.8/MtSortie
65536Contexte
16384Sortie max.
LLMServerless
OpenAI
OpenAI: GPT OSS 20B
$0.04/MtEntrée
$0.15/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
qwen3-235b-a22b-instruct-2507Qwen3 235B A22B Instruct 2507
$0.09/MtEntrée
$0.58/MtSortie
131072Contexte
16384Sortie max.
LLMServerless
deepseek-r1-distill-qwen-14bDeepSeek R1 Distill Qwen 14B
$0.15/MtEntrée
$0.15/MtSortie
32768Contexte
16384Sortie max.
LLM
llama-3.3-70b-instructLlama 3.3 70B Instruct
$0.135/MtEntrée
$0.4/MtSortie
131072Contexte
120000Sortie max.
LLMServerless
qwen-2.5-72b-instructQwen 2.5 72B Instruct
$0.38/MtEntrée
$0.4/MtSortie
32000Contexte
8192Sortie max.
LLMServerless
mistral-nemoMistral Nemo
$0.04/MtEntrée
$0.17/MtSortie
60288Contexte
16000Sortie max.
LLMServerless
minimax-m1-80kMiniMax M1
$0.55/MtEntrée
$2.2/MtSortie
1000000Contexte
40000Sortie max.
LLMServerless
deepseek-r1-0528DeepSeek R1 0528
$0.7/MtEntrée
$0.35/MtLecture du cache
$2.5/MtSortie
163840Contexte
32768Sortie max.
LLMServerless
deepseek-r1-distill-qwen-32bDeepSeek R1 Distill Qwen 32B
$0.3/MtEntrée
$0.3/MtSortie
64000Contexte
32000Sortie max.
LLM
llama-3-8b-instructLlama 3 8B Instruct
$0.04/MtEntrée
$0.04/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
wizardlm-2-8x22bWizardlm 2 8x22B
$0.62/MtEntrée
$0.62/MtSortie
65535Contexte
8000Sortie max.
LLMServerless
Dedicated
deepseek-r1-0528-qwen3-8bDeepSeek R1 0528 Qwen3 8B
$0.06/MtEntrée
$0.09/MtSortie
128000Contexte
32000Sortie max.
LLM
deepseek-r1-distill-llama-70bDeepSeek R1 Distill LLama 70B
$0.8/MtEntrée
$0.8/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
llama-3-70b-instructLlama3 70B Instruct
$0.51/MtEntrée
$0.74/MtSortie
8192Contexte
8000Sortie max.
LLMServerless
qwen3-235b-a22b-fp8Qwen3 235B A22B
$0.2/MtEntrée
$0.8/MtSortie
40960Contexte
20000Sortie max.
LLMServerless
llama-4-maverick-17b-128e-instruct-fp8Llama 4 Maverick Instruct
$0.27/MtEntrée
$0.85/MtSortie
1048576Contexte
8192Sortie max.
LLMServerless
Dedicated
llama-4-scout-17b-16e-instructLlama 4 Scout Instruct
$0.18/MtEntrée
$0.59/MtSortie
131072Contexte
131072Sortie max.
LLMServerless
hermes-2-pro-llama-3-8bHermes 2 Pro Llama 3 8B
$0.14/MtEntrée
$0.14/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
l3-70b-euryale-v2.1L3 70B Euryale V2.1
$1.48/MtEntrée
$1.48/MtSortie
8192Contexte
8192Sortie max.
LLM
l3-8b-lunarisSao10k L3 8B Lunaris
$0.05/MtEntrée
$0.05/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
Baichuan
BaiChuan M2 32B
$0.07/MtEntrée
$0.07/MtSortie
131072Contexte
131072Sortie max.
LLM
Wenxin
ERNIE 4.5 VL 424B A47B
$0.42/MtEntrée
$1.25/MtSortie
123000Contexte
16000Sortie max.
LLMServerless
deepseek-prover-v2-671bDeepseek Prover V2 671B
$0.7/MtEntrée
$2.5/MtSortie
160000Contexte
160000Sortie max.
LLMServerless
qwen3-32b-fp8Qwen3 32B
$0.1/MtEntrée
$0.45/MtSortie
40960Contexte
20000Sortie max.
LLMServerless
qwen3-30b-a3b-fp8Qwen3 30B A3B
$0.09/MtEntrée
$0.45/MtSortie
40960Contexte
20000Sortie max.
LLMServerless
gemma-3-27b-itGemma 3 27B
$0.119/MtEntrée
$0.2/MtSortie
98304Contexte
16384Sortie max.
LLMServerless
deepseek-v3-turboDeepSeek V3 (Turbo)
$0.4/MtEntrée
$1.3/MtSortie
64000Contexte
16000Sortie max.
LLMServerless
deepseek-r1-turboDeepSeek R1 (Turbo)
$0.7/MtEntrée
$2.5/MtSortie
64000Contexte
16000Sortie max.
LLMServerless
L3-8B-Stheno-v3.2L3 8B Stheno V3.2
$0.05/MtEntrée
$0.05/MtSortie
8192Contexte
32000Sortie max.
LLMServerless
MMythomax L2 13B
$0.09/MtEntrée
$0.09/MtSortie
4096Contexte
3200Sortie max.
LLM
RRing-2.6-1T
$0.3/MtEntrée
$0.06/MtLecture du cache
$2.5/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
LLing-2.6-flash
$0.1/MtEntrée
$0.02/MtLecture du cache
$0.3/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
LLing-2.6-1T
$0.3/MtEntrée
$0.06/MtLecture du cache
$2.5/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
ELing-2.6-flash
$0.1/MtEntrée
$0.02/MtLecture du cache
$0.3/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
qwen3-vl-8b-instructqwen/qwen3-vl-8b-instruct
$0.08/MtEntrée
$0.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
glm-4.5-airzai-org/glm-4.5-air
$0.13/MtEntrée
$0.025/MtLecture du cache
$0.85/MtSortie
131072Contexte
98304Sortie max.
LLMServerless
qwen3-vl-30b-a3b-instructqwen/qwen3-vl-30b-a3b-instruct
$0.2/MtEntrée
$0.7/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
qwen3-vl-30b-a3b-thinkingqwen/qwen3-vl-30b-a3b-thinking
$0.2/MtEntrée
$1/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
qwen3-omni-30b-a3b-thinkingQwen3 Omni 30B A3B Thinking
$0.25/MtEntrée
$0.97/MtSortie
65536Contexte
16384Sortie max.
LLMServerless
qwen3-omni-30b-a3b-instructQwen3 Omni 30B A3B Instruct
$0.25/MtEntrée
$0.97/MtSortie
65536Contexte
16384Sortie max.
LLMServerless
Nouveau
qwen-mt-plusQwen MT Plus
$0.25/MtEntrée
$0.75/MtSortie
16384Contexte
8192Sortie max.
LLMServerless
Wenxin
ERNIE 4.5 VL 28B A3B
$0.14/MtEntrée
$0.56/MtSortie
30000Contexte
8000Sortie max.
LLMServerless
Wenxin
ERNIE 4.5 21B A3B
$0.07/MtEntrée
$0.28/MtSortie
120000Contexte
8000Sortie max.
LLMServerless
Dedicated
qwen3-8b-fp8Qwen3 8B
$0.035/MtEntrée
$0.138/MtSortie
128000Contexte
20000Sortie max.
LLM
llama-3.2-3b-instructLlama 3.2 3B Instruct
$0.03/MtEntrée
$0.05/MtSortie
32768Contexte
32000Sortie max.
LLM
l31-70b-euryale-v2.2L31 70B Euryale V2.2
$1.48/MtEntrée
$1.48/MtSortie
8192Contexte
8192Sortie max.
LLMServerless

Point de terminaison dédié

Infrastructure de niveau entreprise pour l’IA

Pour les entreprises qui nécessitent des performances supérieures, des SLA adaptés ou un hébergement privé pour des modèles personnalisés
  • Custom pricing
  • Guaranteed uptime & latency
  • Unlimited scale
  • Dedicated clusters
Obtenir un point de terminaison de niveau entreprise
de-banner