Große Sprachmodelle

Durchsuchen Sie unsere unterstützten Open-Source-Modelle und stellen Sie sie in dedizierten Endpunkten bereit

Neu
GLM 5.2GLM 5.2
$1.4/MtEingabe
$0.26/MtCache-Lesen
$4.4/MtAusgabe
1048576Kontext
131072Max. Ausgabe
LLMServerless
Neu
MoonshotAI
Kimi K2.7 Code
$0.95/MtEingabe
$0.19/MtCache-Lesen
$4/MtAusgabe
262144Kontext
262144Max. Ausgabe
LLMServerless
Neu
MiniMax M3MiniMax M3
$0.3/MtEingabe
$0.06/MtCache-Lesen
$1.2/MtAusgabe
1000000Kontext
131072Max. Ausgabe
LLMServerless
Neu
Deepseek V4 ProDeepseek V4 Pro
$1.6/MtEingabe
$0.135/MtCache-Lesen
$3.2/MtAusgabe
1048576Kontext
393216Max. Ausgabe
LLMServerless
Neu
Deepseek V4 FlashDeepseek V4 Flash
$0.14/MtEingabe
$0.028/MtCache-Lesen
$0.28/MtAusgabe
1048576Kontext
393216Max. Ausgabe
LLMServerless
Heiß
Deepseek V3.2Deepseek V3.2
$0.269/MtEingabe
$0.1345/MtCache-Lesen
$0.4/MtAusgabe
163840Kontext
65536Max. Ausgabe
LLMServerless
Neu
Step 3.7 FlashStep 3.7 Flash
$0.2/MtEingabe
$0.04/MtCache-Lesen
$1.15/MtAusgabe
262144Kontext
256000Max. Ausgabe
LLMServerless
Neu
Nemotron 3 Nano 30B A3BNemotron 3 Nano 30B A3B
$0.05/MtEingabe
$0.2/MtAusgabe
262144Kontext
32768Max. Ausgabe
LLMServerless
Neu
Wenxin
CoBuddy
$0.28/MtEingabe
$0.07/MtCache-Lesen
$1.13/MtAusgabe
131072Kontext
65536Max. Ausgabe
LLMServerless
Neu
XXiaomiMiMo/MiMo-V2.5
$0.168/MtEingabe
$0.0034/MtCache-Lesen
$0.336/MtAusgabe
1048576Kontext
131072Max. Ausgabe
LLMServerless
LIMITED TIME 50% OFF
Qwen3.7-MaxQwen3.7-Max
$1.25/MtEingabe
$0.25/MtCache-Lesen
$3.75/MtAusgabe
1000000Kontext
65536Max. Ausgabe
LLMServerless
Neu
XXiaomiMiMo/MiMo-V2.5-Pro
$0.522/MtEingabe
$0.0043/MtCache-Lesen
$1.044/MtAusgabe
1048576Kontext
131072Max. Ausgabe
LLMServerless
Neu
Qwen3.6-27BQwen3.6-27B
$0.6/MtEingabe
$3.6/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
Neu
MoonshotAI
Kimi K2.6
$0.8/MtEingabe
$0.16/MtCache-Lesen
$3.4/MtAusgabe
262144Kontext
262144Max. Ausgabe
LLMServerless
Neu
GLM-5.1GLM-5.1
$1.38/MtEingabe
$0.26/MtCache-Lesen
$4.4/MtAusgabe
204800Kontext
131072Max. Ausgabe
LLMServerless
Gemma 4 26B A4BGemma 4 26B A4B
$0.13/MtEingabe
$0.4/MtAusgabe
262144Kontext
131072Max. Ausgabe
LLMServerless
Gemma 4 31BGemma 4 31B
$0.14/MtEingabe
$0.4/MtAusgabe
262144Kontext
131072Max. Ausgabe
LLMServerless
Neu
MiniMax M2.7MiniMax M2.7
$0.3/MtEingabe
$0.06/MtCache-Lesen
$1.2/MtAusgabe
204800Kontext
131072Max. Ausgabe
LLMServerless
MiniMax M2.5-highspeedMiniMax M2.5-highspeed
$0.6/MtEingabe
$0.03/MtCache-Lesen
$2.4/MtAusgabe
204800Kontext
131100Max. Ausgabe
LLMServerless
Qwen3.5-27BQwen3.5-27B
$0.3/MtEingabe
$2.4/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
Qwen3.5-122B-A10BQwen3.5-122B-A10B
$0.4/MtEingabe
$3.2/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
Qwen3.5-35B-A3BQwen3.5-35B-A3B
$0.25/MtEingabe
$2/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
Qwen3.5-397B-A17BQwen3.5-397B-A17B
$0.6/MtEingabe
$3.6/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
MiniMax M2.5MiniMax M2.5
$0.3/MtEingabe
$0.03/MtCache-Lesen
$1.2/MtAusgabe
204800Kontext
131100Max. Ausgabe
LLMServerless
GLM-5GLM-5
$1/MtEingabe
$0.2/MtCache-Lesen
$3.2/MtAusgabe
202800Kontext
131072Max. Ausgabe
LLMServerless
Qwen3 Coder NextQwen3 Coder Next
$0.2/MtEingabe
$1.5/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
DeepSeek-OCR 2DeepSeek-OCR 2
$0.03/MtEingabe
$0.03/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLMServerless
MoonshotAI
Kimi K2.5
$0.6/MtEingabe
$0.1/MtCache-Lesen
$3/MtAusgabe
262144Kontext
262144Max. Ausgabe
LLMServerless
GLM-4.7-FlashGLM-4.7-Flash
$0.07/MtEingabe
$0.01/MtCache-Lesen
$0.4/MtAusgabe
200000Kontext
128000Max. Ausgabe
LLMServerless
Minimax M2.1Minimax M2.1
$0.3/MtEingabe
$0.03/MtCache-Lesen
$1.2/MtAusgabe
204800Kontext
131072Max. Ausgabe
LLMServerless
GLM-4.7GLM-4.7
$0.6/MtEingabe
$0.11/MtCache-Lesen
$2.2/MtAusgabe
204800Kontext
131072Max. Ausgabe
LLMServerless
AutoGLM-Phone-9B-MultilingualAutoGLM-Phone-9B-Multilingual
$0.035/MtEingabe
$0.138/MtAusgabe
65536Kontext
65536Max. Ausgabe
LLMServerless
MoonshotAI
Kimi K2 Thinking
$0.6/MtEingabe
$0.15/MtCache-Lesen
$2.5/MtAusgabe
262144Kontext
262144Max. Ausgabe
LLMServerless
MiniMax-M2MiniMax-M2
$0.3/MtEingabe
$0.03/MtCache-Lesen
$1.2/MtAusgabe
204800Kontext
131072Max. Ausgabe
LLMServerless
PaddleOCR-VLPaddleOCR-VL
$0.02/MtEingabe
$0.02/MtAusgabe
16384Kontext
16384Max. Ausgabe
LLM
Deepseek V3.2 ExpDeepseek V3.2 Exp
$0.27/MtEingabe
$0.41/MtAusgabe
163840Kontext
65536Max. Ausgabe
LLMServerless
Qwen3 VL 235B A22B ThinkingQwen3 VL 235B A22B Thinking
$0.98/MtEingabe
$3.95/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
GLM 4.6VGLM 4.6V
$0.3/MtEingabe
$0.055/MtCache-Lesen
$0.9/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
GLM 4.6GLM 4.6
$0.55/MtEingabe
$0.11/MtCache-Lesen
$2.2/MtAusgabe
204800Kontext
131072Max. Ausgabe
LLMServerless
Neu
Qwen3.6-35B-A3BQwen3.6-35B-A3B
$0.248/MtEingabe
$1.485/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
Kat Coder ProKat Coder Pro
$0.3/MtEingabe
$0.06/MtCache-Lesen
$1.2/MtAusgabe
256000Kontext
128000Max. Ausgabe
LLMServerless
Qwen3 Next 80B A3B InstructQwen3 Next 80B A3B Instruct
$0.15/MtEingabe
$1.5/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Qwen3 Next 80B A3B ThinkingQwen3 Next 80B A3B Thinking
$0.15/MtEingabe
$1.5/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
DeepSeek-OCRDeepSeek-OCR
$0.03/MtEingabe
$0.03/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLM
Deepseek V3.1 TerminusDeepseek V3.1 Terminus
$0.27/MtEingabe
$0.135/MtCache-Lesen
$1/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Qwen3 VL 235B A22B InstructQwen3 VL 235B A22B Instruct
$0.3/MtEingabe
$1.5/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Qwen3 MaxQwen3 Max
$2.11/MtEingabe
$8.45/MtAusgabe
262144Kontext
65536Max. Ausgabe

Partner

LLMServerless
DeepSeek V3.1DeepSeek V3.1
$0.27/MtEingabe
$0.135/MtCache-Lesen
$1/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
MoonshotAI
Kimi K2 0905
$0.6/MtEingabe
$2.5/MtAusgabe
262144Kontext
262144Max. Ausgabe
LLMServerless
Qwen3 Coder 480B A35B InstructQwen3 Coder 480B A35B Instruct
$0.38/MtEingabe
$1.55/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
Qwen3 Coder 30b A3B InstructQwen3 Coder 30b A3B Instruct
$0.07/MtEingabe
$0.27/MtAusgabe
160000Kontext
32768Max. Ausgabe
LLMServerless
OpenAI
OpenAI GPT OSS 120B
$0.05/MtEingabe
$0.25/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
MoonshotAI
Kimi K2 Instruct
$0.57/MtEingabe
$2.3/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Heiß
DeepSeek V3 0324DeepSeek V3 0324
$0.27/MtEingabe
$0.135/MtCache-Lesen
$1.12/MtAusgabe
163840Kontext
65536Max. Ausgabe
LLMServerless
GLM-4.5GLM-4.5
$0.6/MtEingabe
$0.11/MtCache-Lesen
$2.2/MtAusgabe
131072Kontext
98304Max. Ausgabe
LLMServerless
Qwen3 235B A22b Thinking 2507Qwen3 235B A22b Thinking 2507
$0.3/MtEingabe
$3/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Llama 3.1 8B InstructLlama 3.1 8B Instruct
$0.02/MtEingabe
$0.05/MtAusgabe
16384Kontext
16384Max. Ausgabe
LLMServerless
Gemma3 12BGemma3 12B
$0.05/MtEingabe
$0.1/MtAusgabe
131072Kontext
8192Max. Ausgabe
LLM
GLM 4.5VGLM 4.5V
$0.6/MtEingabe
$0.11/MtCache-Lesen
$1.8/MtAusgabe
65536Kontext
16384Max. Ausgabe
LLMServerless
OpenAI
OpenAI: GPT OSS 20B
$0.04/MtEingabe
$0.15/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Qwen3 235B A22B Instruct 2507Qwen3 235B A22B Instruct 2507
$0.09/MtEingabe
$0.58/MtAusgabe
131072Kontext
16384Max. Ausgabe
LLMServerless
DeepSeek R1 Distill Qwen 14BDeepSeek R1 Distill Qwen 14B
$0.15/MtEingabe
$0.15/MtAusgabe
32768Kontext
16384Max. Ausgabe
LLM
Llama 3.3 70B InstructLlama 3.3 70B Instruct
$0.135/MtEingabe
$0.4/MtAusgabe
131072Kontext
120000Max. Ausgabe
LLMServerless
Qwen 2.5 72B InstructQwen 2.5 72B Instruct
$0.38/MtEingabe
$0.4/MtAusgabe
32000Kontext
8192Max. Ausgabe
LLMServerless
Mistral
Mistral Nemo
$0.04/MtEingabe
$0.17/MtAusgabe
60288Kontext
16000Max. Ausgabe
LLMServerless
MiniMax M1MiniMax M1
$0.55/MtEingabe
$2.2/MtAusgabe
1000000Kontext
40000Max. Ausgabe
LLMServerless
DeepSeek R1 0528DeepSeek R1 0528
$0.7/MtEingabe
$0.35/MtCache-Lesen
$2.5/MtAusgabe
163840Kontext
32768Max. Ausgabe
LLMServerless
DeepSeek R1 Distill Qwen 32BDeepSeek R1 Distill Qwen 32B
$0.3/MtEingabe
$0.3/MtAusgabe
64000Kontext
32000Max. Ausgabe
LLM
Llama 3 8B InstructLlama 3 8B Instruct
$0.04/MtEingabe
$0.04/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLMServerless
Azure
Wizardlm 2 8x22B
$0.62/MtEingabe
$0.62/MtAusgabe
65535Kontext
8000Max. Ausgabe
LLMServerless
Dedicated
DeepSeek R1 0528 Qwen3 8BDeepSeek R1 0528 Qwen3 8B
$0.06/MtEingabe
$0.09/MtAusgabe
128000Kontext
32000Max. Ausgabe
LLM
DeepSeek R1 Distill LLama 70BDeepSeek R1 Distill LLama 70B
$0.8/MtEingabe
$0.8/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLMServerless
Llama3 70B InstructLlama3 70B Instruct
$0.51/MtEingabe
$0.74/MtAusgabe
8192Kontext
8000Max. Ausgabe
LLMServerless
Qwen3 235B A22BQwen3 235B A22B
$0.2/MtEingabe
$0.8/MtAusgabe
40960Kontext
20000Max. Ausgabe
LLMServerless
Llama 4 Maverick InstructLlama 4 Maverick Instruct
$0.27/MtEingabe
$0.85/MtAusgabe
1048576Kontext
8192Max. Ausgabe
LLMServerless
Dedicated
Llama 4 Scout InstructLlama 4 Scout Instruct
$0.18/MtEingabe
$0.59/MtAusgabe
131072Kontext
131072Max. Ausgabe
LLMServerless
Hermes 2 Pro Llama 3 8BHermes 2 Pro Llama 3 8B
$0.14/MtEingabe
$0.14/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLM
L3 70B Euryale V2.1	L3 70B Euryale V2.1
$1.48/MtEingabe
$1.48/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLM
Sao10k L3 8B Lunaris	Sao10k L3 8B Lunaris
$0.05/MtEingabe
$0.05/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLMServerless
Baichuan
BaiChuan M2 32B
$0.07/MtEingabe
$0.07/MtAusgabe
131072Kontext
131072Max. Ausgabe
LLM
Wenxin
ERNIE 4.5 VL 424B A47B
$0.42/MtEingabe
$1.25/MtAusgabe
123000Kontext
16000Max. Ausgabe
LLMServerless
Deepseek Prover V2 671BDeepseek Prover V2 671B
$0.7/MtEingabe
$2.5/MtAusgabe
160000Kontext
160000Max. Ausgabe
LLMServerless
Qwen3 32BQwen3 32B
$0.1/MtEingabe
$0.45/MtAusgabe
40960Kontext
20000Max. Ausgabe
LLM
Gemma 3 27BGemma 3 27B
$0.119/MtEingabe
$0.2/MtAusgabe
98304Kontext
16384Max. Ausgabe
LLMServerless
DeepSeek V3 (Turbo)	DeepSeek V3 (Turbo)
$0.4/MtEingabe
$1.3/MtAusgabe
64000Kontext
16000Max. Ausgabe
LLMServerless
DeepSeek R1 (Turbo)	DeepSeek R1 (Turbo)
$0.7/MtEingabe
$2.5/MtAusgabe
64000Kontext
16000Max. Ausgabe
LLMServerless
L3 8B Stheno V3.2L3 8B Stheno V3.2
$0.05/MtEingabe
$0.05/MtAusgabe
8192Kontext
32000Max. Ausgabe
LLMServerless
MMythomax L2 13B
$0.09/MtEingabe
$0.09/MtAusgabe
4096Kontext
3200Max. Ausgabe
LLM
RRing-2.6-1T
$0.3/MtEingabe
$0.06/MtCache-Lesen
$2.5/MtAusgabe
262144Kontext
65536Max. Ausgabe
LLMServerless
LLing-2.6-flash
$0.1/MtEingabe
$0.02/MtCache-Lesen
$0.3/MtAusgabe
262144Kontext
32768Max. Ausgabe
LLMServerless
LLing-2.6-1T
$0.3/MtEingabe
$0.06/MtCache-Lesen
$2.5/MtAusgabe
262144Kontext
32768Max. Ausgabe
LLMServerless
LLing-2.6-flash
$0.1/MtEingabe
$0.02/MtCache-Lesen
$0.3/MtAusgabe
262144Kontext
32768Max. Ausgabe
LLMServerless
qwen/qwen3-vl-8b-instructqwen/qwen3-vl-8b-instruct
$0.08/MtEingabe
$0.5/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
zai-org/glm-4.5-airzai-org/glm-4.5-air
$0.13/MtEingabe
$0.025/MtCache-Lesen
$0.85/MtAusgabe
131072Kontext
98304Max. Ausgabe
LLMServerless
qwen/qwen3-vl-30b-a3b-instructqwen/qwen3-vl-30b-a3b-instruct
$0.2/MtEingabe
$0.7/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
qwen/qwen3-vl-30b-a3b-thinkingqwen/qwen3-vl-30b-a3b-thinking
$0.2/MtEingabe
$1/MtAusgabe
131072Kontext
32768Max. Ausgabe
LLMServerless
Qwen3 Omni 30B A3B ThinkingQwen3 Omni 30B A3B Thinking
$0.25/MtEingabe
$0.97/MtAusgabe
65536Kontext
16384Max. Ausgabe
LLMServerless
Qwen3 Omni 30B A3B InstructQwen3 Omni 30B A3B Instruct
$0.25/MtEingabe
$0.97/MtAusgabe
65536Kontext
16384Max. Ausgabe
LLMServerless
Qwen MT PlusQwen MT Plus
$0.25/MtEingabe
$0.75/MtAusgabe
16384Kontext
8192Max. Ausgabe
LLMServerless
Wenxin
ERNIE 4.5 VL 28B A3B
$0.14/MtEingabe
$0.56/MtAusgabe
30000Kontext
8000Max. Ausgabe
LLMServerless
Wenxin
ERNIE 4.5 21B A3B
$0.07/MtEingabe
$0.28/MtAusgabe
120000Kontext
8000Max. Ausgabe
LLMServerless
Dedicated
Qwen3 8BQwen3 8B
$0.035/MtEingabe
$0.138/MtAusgabe
128000Kontext
20000Max. Ausgabe
LLM
Llama 3.2 3B InstructLlama 3.2 3B Instruct
$0.03/MtEingabe
$0.05/MtAusgabe
32768Kontext
32000Max. Ausgabe
LLM
L31 70B Euryale V2.2L31 70B Euryale V2.2
$1.48/MtEingabe
$1.48/MtAusgabe
8192Kontext
8192Max. Ausgabe
LLMServerless

Dedizierter Endpoint

Unternehmensgerechte Infrastruktur für AI

Für Unternehmen, die höhere Leistung, maßgeschneiderte SLAs oder privates Hosting für individuelle Modelle benötigen
  • Custom pricing
  • Guaranteed uptime & latency
  • Unlimited scale
  • Dedicated clusters
Unternehmensgerechten Endpoint erhalten
de-banner