Grands modèles de langage

Parcourez nos modèles open source pris en charge et déployez-les sur des points de terminaison dédiés

Nouveau
GLM 5.2GLM 5.2
$1.4/MtEntrée
$0.26/MtLecture du cache
$4.4/MtSortie
1048576Contexte
131072Sortie max.
LLMServerless
Nouveau
MoonshotAI
Kimi K2.7 Code
$0.95/MtEntrée
$0.19/MtLecture du cache
$4/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
Nouveau
MiniMax M3MiniMax M3
$0.3/MtEntrée
$0.06/MtLecture du cache
$1.2/MtSortie
1000000Contexte
131072Sortie max.
LLMServerless
Nouveau
Deepseek V4 ProDeepseek V4 Pro
$1.6/MtEntrée
$0.135/MtLecture du cache
$3.2/MtSortie
1048576Contexte
393216Sortie max.
LLMServerless
Nouveau
Deepseek V4 FlashDeepseek V4 Flash
$0.14/MtEntrée
$0.028/MtLecture du cache
$0.28/MtSortie
1048576Contexte
393216Sortie max.
LLMServerless
Tendance
Deepseek V3.2Deepseek V3.2
$0.269/MtEntrée
$0.1345/MtLecture du cache
$0.4/MtSortie
163840Contexte
65536Sortie max.
LLMServerless
Nouveau
Step 3.7 FlashStep 3.7 Flash
$0.2/MtEntrée
$0.04/MtLecture du cache
$1.15/MtSortie
262144Contexte
256000Sortie max.
LLMServerless
Nouveau
Nemotron 3 Nano 30B A3BNemotron 3 Nano 30B A3B
$0.05/MtEntrée
$0.2/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
Nouveau
Wenxin
CoBuddy
$0.28/MtEntrée
$0.07/MtLecture du cache
$1.13/MtSortie
131072Contexte
65536Sortie max.
LLMServerless
Nouveau
XXiaomiMiMo/MiMo-V2.5
$0.168/MtEntrée
$0.0034/MtLecture du cache
$0.336/MtSortie
1048576Contexte
131072Sortie max.
LLMServerless
LIMITED TIME 50% OFF
Qwen3.7-MaxQwen3.7-Max
$1.25/MtEntrée
$0.25/MtLecture du cache
$3.75/MtSortie
1000000Contexte
65536Sortie max.
LLMServerless
Nouveau
XXiaomiMiMo/MiMo-V2.5-Pro
$0.522/MtEntrée
$0.0043/MtLecture du cache
$1.044/MtSortie
1048576Contexte
131072Sortie max.
LLMServerless
Nouveau
Qwen3.6-27BQwen3.6-27B
$0.6/MtEntrée
$3.6/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Nouveau
MoonshotAI
Kimi K2.6
$0.8/MtEntrée
$0.16/MtLecture du cache
$3.4/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
Nouveau
GLM-5.1GLM-5.1
$1.38/MtEntrée
$0.26/MtLecture du cache
$4.4/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
Gemma 4 26B A4BGemma 4 26B A4B
$0.13/MtEntrée
$0.4/MtSortie
262144Contexte
131072Sortie max.
LLMServerless
Gemma 4 31BGemma 4 31B
$0.14/MtEntrée
$0.4/MtSortie
262144Contexte
131072Sortie max.
LLMServerless
Nouveau
MiniMax M2.7MiniMax M2.7
$0.3/MtEntrée
$0.06/MtLecture du cache
$1.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
MiniMax M2.5-highspeedMiniMax M2.5-highspeed
$0.6/MtEntrée
$0.03/MtLecture du cache
$2.4/MtSortie
204800Contexte
131100Sortie max.
LLMServerless
Qwen3.5-27BQwen3.5-27B
$0.3/MtEntrée
$2.4/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Qwen3.5-122B-A10BQwen3.5-122B-A10B
$0.4/MtEntrée
$3.2/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Qwen3.5-35B-A3BQwen3.5-35B-A3B
$0.25/MtEntrée
$2/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Qwen3.5-397B-A17BQwen3.5-397B-A17B
$0.6/MtEntrée
$3.6/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
MiniMax M2.5MiniMax M2.5
$0.3/MtEntrée
$0.03/MtLecture du cache
$1.2/MtSortie
204800Contexte
131100Sortie max.
LLMServerless
GLM-5GLM-5
$1/MtEntrée
$0.2/MtLecture du cache
$3.2/MtSortie
202800Contexte
131072Sortie max.
LLMServerless
Qwen3 Coder NextQwen3 Coder Next
$0.2/MtEntrée
$1.5/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
DeepSeek-OCR 2DeepSeek-OCR 2
$0.03/MtEntrée
$0.03/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
MoonshotAI
Kimi K2.5
$0.6/MtEntrée
$0.1/MtLecture du cache
$3/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
GLM-4.7-FlashGLM-4.7-Flash
$0.07/MtEntrée
$0.01/MtLecture du cache
$0.4/MtSortie
200000Contexte
128000Sortie max.
LLMServerless
Minimax M2.1Minimax M2.1
$0.3/MtEntrée
$0.03/MtLecture du cache
$1.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
GLM-4.7GLM-4.7
$0.6/MtEntrée
$0.11/MtLecture du cache
$2.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
AutoGLM-Phone-9B-MultilingualAutoGLM-Phone-9B-Multilingual
$0.035/MtEntrée
$0.138/MtSortie
65536Contexte
65536Sortie max.
LLMServerless
MoonshotAI
Kimi K2 Thinking
$0.6/MtEntrée
$0.15/MtLecture du cache
$2.5/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
MiniMax-M2MiniMax-M2
$0.3/MtEntrée
$0.03/MtLecture du cache
$1.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
PaddleOCR-VLPaddleOCR-VL
$0.02/MtEntrée
$0.02/MtSortie
16384Contexte
16384Sortie max.
LLM
Deepseek V3.2 ExpDeepseek V3.2 Exp
$0.27/MtEntrée
$0.41/MtSortie
163840Contexte
65536Sortie max.
LLMServerless
Qwen3 VL 235B A22B ThinkingQwen3 VL 235B A22B Thinking
$0.98/MtEntrée
$3.95/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
GLM 4.6VGLM 4.6V
$0.3/MtEntrée
$0.055/MtLecture du cache
$0.9/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
GLM 4.6GLM 4.6
$0.55/MtEntrée
$0.11/MtLecture du cache
$2.2/MtSortie
204800Contexte
131072Sortie max.
LLMServerless
Nouveau
Qwen3.6-35B-A3BQwen3.6-35B-A3B
$0.248/MtEntrée
$1.485/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Kat Coder ProKat Coder Pro
$0.3/MtEntrée
$0.06/MtLecture du cache
$1.2/MtSortie
256000Contexte
128000Sortie max.
LLMServerless
Qwen3 Next 80B A3B InstructQwen3 Next 80B A3B Instruct
$0.15/MtEntrée
$1.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Qwen3 Next 80B A3B ThinkingQwen3 Next 80B A3B Thinking
$0.15/MtEntrée
$1.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
DeepSeek-OCRDeepSeek-OCR
$0.03/MtEntrée
$0.03/MtSortie
8192Contexte
8192Sortie max.
LLM
Deepseek V3.1 TerminusDeepseek V3.1 Terminus
$0.27/MtEntrée
$0.135/MtLecture du cache
$1/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Qwen3 VL 235B A22B InstructQwen3 VL 235B A22B Instruct
$0.3/MtEntrée
$1.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Qwen3 MaxQwen3 Max
$2.11/MtEntrée
$8.45/MtSortie
262144Contexte
65536Sortie max.

Partenaire

LLMServerless
DeepSeek V3.1DeepSeek V3.1
$0.27/MtEntrée
$0.135/MtLecture du cache
$1/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
MoonshotAI
Kimi K2 0905
$0.6/MtEntrée
$2.5/MtSortie
262144Contexte
262144Sortie max.
LLMServerless
Qwen3 Coder 480B A35B InstructQwen3 Coder 480B A35B Instruct
$0.38/MtEntrée
$1.55/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
Qwen3 Coder 30b A3B InstructQwen3 Coder 30b A3B Instruct
$0.07/MtEntrée
$0.27/MtSortie
160000Contexte
32768Sortie max.
LLMServerless
OpenAI
OpenAI GPT OSS 120B
$0.05/MtEntrée
$0.25/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
MoonshotAI
Kimi K2 Instruct
$0.57/MtEntrée
$2.3/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Tendance
DeepSeek V3 0324DeepSeek V3 0324
$0.27/MtEntrée
$0.135/MtLecture du cache
$1.12/MtSortie
163840Contexte
65536Sortie max.
LLMServerless
GLM-4.5GLM-4.5
$0.6/MtEntrée
$0.11/MtLecture du cache
$2.2/MtSortie
131072Contexte
98304Sortie max.
LLMServerless
Qwen3 235B A22b Thinking 2507Qwen3 235B A22b Thinking 2507
$0.3/MtEntrée
$3/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Llama 3.1 8B InstructLlama 3.1 8B Instruct
$0.02/MtEntrée
$0.05/MtSortie
16384Contexte
16384Sortie max.
LLMServerless
Gemma3 12BGemma3 12B
$0.05/MtEntrée
$0.1/MtSortie
131072Contexte
8192Sortie max.
LLM
GLM 4.5VGLM 4.5V
$0.6/MtEntrée
$0.11/MtLecture du cache
$1.8/MtSortie
65536Contexte
16384Sortie max.
LLMServerless
OpenAI
OpenAI: GPT OSS 20B
$0.04/MtEntrée
$0.15/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Qwen3 235B A22B Instruct 2507Qwen3 235B A22B Instruct 2507
$0.09/MtEntrée
$0.58/MtSortie
131072Contexte
16384Sortie max.
LLMServerless
DeepSeek R1 Distill Qwen 14BDeepSeek R1 Distill Qwen 14B
$0.15/MtEntrée
$0.15/MtSortie
32768Contexte
16384Sortie max.
LLM
Llama 3.3 70B InstructLlama 3.3 70B Instruct
$0.135/MtEntrée
$0.4/MtSortie
131072Contexte
120000Sortie max.
LLMServerless
Qwen 2.5 72B InstructQwen 2.5 72B Instruct
$0.38/MtEntrée
$0.4/MtSortie
32000Contexte
8192Sortie max.
LLMServerless
Mistral
Mistral Nemo
$0.04/MtEntrée
$0.17/MtSortie
60288Contexte
16000Sortie max.
LLMServerless
MiniMax M1MiniMax M1
$0.55/MtEntrée
$2.2/MtSortie
1000000Contexte
40000Sortie max.
LLMServerless
DeepSeek R1 0528DeepSeek R1 0528
$0.7/MtEntrée
$0.35/MtLecture du cache
$2.5/MtSortie
163840Contexte
32768Sortie max.
LLMServerless
DeepSeek R1 Distill Qwen 32BDeepSeek R1 Distill Qwen 32B
$0.3/MtEntrée
$0.3/MtSortie
64000Contexte
32000Sortie max.
LLM
Llama 3 8B InstructLlama 3 8B Instruct
$0.04/MtEntrée
$0.04/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
Azure
Wizardlm 2 8x22B
$0.62/MtEntrée
$0.62/MtSortie
65535Contexte
8000Sortie max.
LLMServerless
Dedicated
DeepSeek R1 0528 Qwen3 8BDeepSeek R1 0528 Qwen3 8B
$0.06/MtEntrée
$0.09/MtSortie
128000Contexte
32000Sortie max.
LLM
DeepSeek R1 Distill LLama 70BDeepSeek R1 Distill LLama 70B
$0.8/MtEntrée
$0.8/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
Llama3 70B InstructLlama3 70B Instruct
$0.51/MtEntrée
$0.74/MtSortie
8192Contexte
8000Sortie max.
LLMServerless
Qwen3 235B A22BQwen3 235B A22B
$0.2/MtEntrée
$0.8/MtSortie
40960Contexte
20000Sortie max.
LLMServerless
Llama 4 Maverick InstructLlama 4 Maverick Instruct
$0.27/MtEntrée
$0.85/MtSortie
1048576Contexte
8192Sortie max.
LLMServerless
Dedicated
Llama 4 Scout InstructLlama 4 Scout Instruct
$0.18/MtEntrée
$0.59/MtSortie
131072Contexte
131072Sortie max.
LLMServerless
Hermes 2 Pro Llama 3 8BHermes 2 Pro Llama 3 8B
$0.14/MtEntrée
$0.14/MtSortie
8192Contexte
8192Sortie max.
LLM
L3 70B Euryale V2.1	L3 70B Euryale V2.1
$1.48/MtEntrée
$1.48/MtSortie
8192Contexte
8192Sortie max.
LLM
Sao10k L3 8B Lunaris	Sao10k L3 8B Lunaris
$0.05/MtEntrée
$0.05/MtSortie
8192Contexte
8192Sortie max.
LLMServerless
Baichuan
BaiChuan M2 32B
$0.07/MtEntrée
$0.07/MtSortie
131072Contexte
131072Sortie max.
LLM
Wenxin
ERNIE 4.5 VL 424B A47B
$0.42/MtEntrée
$1.25/MtSortie
123000Contexte
16000Sortie max.
LLMServerless
Deepseek Prover V2 671BDeepseek Prover V2 671B
$0.7/MtEntrée
$2.5/MtSortie
160000Contexte
160000Sortie max.
LLMServerless
Qwen3 32BQwen3 32B
$0.1/MtEntrée
$0.45/MtSortie
40960Contexte
20000Sortie max.
LLM
Gemma 3 27BGemma 3 27B
$0.119/MtEntrée
$0.2/MtSortie
98304Contexte
16384Sortie max.
LLMServerless
DeepSeek V3 (Turbo)	DeepSeek V3 (Turbo)
$0.4/MtEntrée
$1.3/MtSortie
64000Contexte
16000Sortie max.
LLMServerless
DeepSeek R1 (Turbo)	DeepSeek R1 (Turbo)
$0.7/MtEntrée
$2.5/MtSortie
64000Contexte
16000Sortie max.
LLMServerless
L3 8B Stheno V3.2L3 8B Stheno V3.2
$0.05/MtEntrée
$0.05/MtSortie
8192Contexte
32000Sortie max.
LLMServerless
MMythomax L2 13B
$0.09/MtEntrée
$0.09/MtSortie
4096Contexte
3200Sortie max.
LLM
RRing-2.6-1T
$0.3/MtEntrée
$0.06/MtLecture du cache
$2.5/MtSortie
262144Contexte
65536Sortie max.
LLMServerless
LLing-2.6-flash
$0.1/MtEntrée
$0.02/MtLecture du cache
$0.3/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
LLing-2.6-1T
$0.3/MtEntrée
$0.06/MtLecture du cache
$2.5/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
LLing-2.6-flash
$0.1/MtEntrée
$0.02/MtLecture du cache
$0.3/MtSortie
262144Contexte
32768Sortie max.
LLMServerless
qwen/qwen3-vl-8b-instructqwen/qwen3-vl-8b-instruct
$0.08/MtEntrée
$0.5/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
zai-org/glm-4.5-airzai-org/glm-4.5-air
$0.13/MtEntrée
$0.025/MtLecture du cache
$0.85/MtSortie
131072Contexte
98304Sortie max.
LLMServerless
qwen/qwen3-vl-30b-a3b-instructqwen/qwen3-vl-30b-a3b-instruct
$0.2/MtEntrée
$0.7/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
qwen/qwen3-vl-30b-a3b-thinkingqwen/qwen3-vl-30b-a3b-thinking
$0.2/MtEntrée
$1/MtSortie
131072Contexte
32768Sortie max.
LLMServerless
Qwen3 Omni 30B A3B ThinkingQwen3 Omni 30B A3B Thinking
$0.25/MtEntrée
$0.97/MtSortie
65536Contexte
16384Sortie max.
LLMServerless
Qwen3 Omni 30B A3B InstructQwen3 Omni 30B A3B Instruct
$0.25/MtEntrée
$0.97/MtSortie
65536Contexte
16384Sortie max.
LLMServerless
Qwen MT PlusQwen MT Plus
$0.25/MtEntrée
$0.75/MtSortie
16384Contexte
8192Sortie max.
LLMServerless
Wenxin
ERNIE 4.5 VL 28B A3B
$0.14/MtEntrée
$0.56/MtSortie
30000Contexte
8000Sortie max.
LLMServerless
Wenxin
ERNIE 4.5 21B A3B
$0.07/MtEntrée
$0.28/MtSortie
120000Contexte
8000Sortie max.
LLMServerless
Dedicated
Qwen3 8BQwen3 8B
$0.035/MtEntrée
$0.138/MtSortie
128000Contexte
20000Sortie max.
LLM
Llama 3.2 3B InstructLlama 3.2 3B Instruct
$0.03/MtEntrée
$0.05/MtSortie
32768Contexte
32000Sortie max.
LLM
L31 70B Euryale V2.2L31 70B Euryale V2.2
$1.48/MtEntrée
$1.48/MtSortie
8192Contexte
8192Sortie max.
LLMServerless

Point de terminaison dédié

Infrastructure de niveau entreprise pour l’IA

Pour les entreprises qui nécessitent des performances supérieures, des SLA adaptés ou un hébergement privé pour des modèles personnalisés
  • Custom pricing
  • Guaranteed uptime & latency
  • Unlimited scale
  • Dedicated clusters
Obtenir un point de terminaison de niveau entreprise
de-banner