Große Sprachmodelle

Durchsuchen Sie unsere unterstützten Open-Source-Modelle und stellen Sie sie in dedizierten Endpunkten bereit

Neuen Endpunkt erstellen

Neu

Kimi K3

$3/MtEingabe

$0.3/MtCache-Lesen

$15/MtAusgabe

1048576Kontext

1048576Max. Ausgabe

LLMServerless

Neu

Hy3

$0.14/MtEingabe

$0.035/MtCache-Lesen

$0.58/MtAusgabe

262144Kontext

262144Max. Ausgabe

LLMServerless

Neu

GLM 5.2

$1.4/MtEingabe

$0.26/MtCache-Lesen

$4.4/MtAusgabe

1048576Kontext

131072Max. Ausgabe

LLMServerless

Neu

Kimi K2.7 Code

$0.95/MtEingabe

$0.19/MtCache-Lesen

$4/MtAusgabe

262144Kontext

262144Max. Ausgabe

LLMServerless

Neu

Deepseek V4 Flash 0731

$0.14/MtEingabe

$0.028/MtCache-Lesen

$0.28/MtAusgabe

1048576Kontext

393216Max. Ausgabe

LLMServerless

NeuTIME LIMITED FREE

Macaron V1 Venti

$0/MtEingabe

$0/MtAusgabe

1048576Kontext

131072Max. Ausgabe

LLMServerless

Neu

MiniMax M3

$0.3/MtEingabe

$0.06/MtCache-Lesen

$1.2/MtAusgabe

1000000Kontext

131072Max. Ausgabe

LLMServerless

Neu

Deepseek V4 Flash

$0.14/MtEingabe

$0.028/MtCache-Lesen

$0.28/MtAusgabe

1048576Kontext

393216Max. Ausgabe

LLMServerless

Neu

Deepseek V4 Pro

$1.6/MtEingabe

$0.135/MtCache-Lesen

$3.2/MtAusgabe

1048576Kontext

393216Max. Ausgabe

LLMServerless

Heiß

Deepseek V3.2

$0.269/MtEingabe

$0.1345/MtCache-Lesen

$0.4/MtAusgabe

163840Kontext

65536Max. Ausgabe

LLMServerless

NeuTIME LIMITED FREE

Ling-3.0-flash

$0/MtEingabe

$0/MtAusgabe

262144Kontext

32768Max. Ausgabe

LLMServerless

NeuTIME LIMITED FREE

Macaron V1 Tall

$0/MtEingabe

$0/MtAusgabe

262144Kontext

32768Max. Ausgabe

LLMServerless

Neu

Step 3.7 Flash

$0.2/MtEingabe

$0.04/MtCache-Lesen

$1.15/MtAusgabe

262144Kontext

256000Max. Ausgabe

LLMServerless

Neu

Nemotron 3 Nano 30B A3B

$0.05/MtEingabe

$0.2/MtAusgabe

262144Kontext

32768Max. Ausgabe

LLMServerless

CoBuddy

$0.28/MtEingabe

$0.07/MtCache-Lesen

$1.13/MtAusgabe

131072Kontext

65536Max. Ausgabe

LLMServerless

Neu

XiaomiMiMo/MiMo-V2.5

$0.168/MtEingabe

$0.0034/MtCache-Lesen

$0.336/MtAusgabe

1048576Kontext

131072Max. Ausgabe

LLMServerless

LIMITED TIME 50% OFF

Qwen3.7-Max

$1.25/MtEingabe

$0.25/MtCache-Lesen

$3.75/MtAusgabe

1000000Kontext

65536Max. Ausgabe

LLMServerless

Neu

XiaomiMiMo/MiMo-V2.5-Pro

$0.522/MtEingabe

$0.0043/MtCache-Lesen

$1.044/MtAusgabe

1048576Kontext

131072Max. Ausgabe

LLMServerless

Neu

Qwen3.6-27B

$0.6/MtEingabe

$3.6/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Kimi K2.6

$0.8/MtEingabe

$0.16/MtCache-Lesen

$3.4/MtAusgabe

262144Kontext

262144Max. Ausgabe

LLMServerless

GLM-5.1

$1.38/MtEingabe

$0.26/MtCache-Lesen

$4.4/MtAusgabe

204800Kontext

131072Max. Ausgabe

LLMServerless

Gemma 4 26B A4B

$0.13/MtEingabe

$0.4/MtAusgabe

262144Kontext

131072Max. Ausgabe

LLMServerless

Gemma 4 31B

$0.14/MtEingabe

$0.4/MtAusgabe

262144Kontext

131072Max. Ausgabe

LLMServerless

MiniMax M2.7

$0.3/MtEingabe

$0.06/MtCache-Lesen

$1.2/MtAusgabe

204800Kontext

131072Max. Ausgabe

LLMServerless

MiniMax M2.5-highspeed

$0.6/MtEingabe

$0.03/MtCache-Lesen

$2.4/MtAusgabe

204800Kontext

131100Max. Ausgabe

LLMServerless

Qwen3.5-27B

$0.3/MtEingabe

$2.4/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Qwen3.5-122B-A10B

$0.4/MtEingabe

$3.2/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Qwen3.5-35B-A3B

$0.25/MtEingabe

$2/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Qwen3.5-397B-A17B

$0.6/MtEingabe

$3.6/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

MiniMax M2.5

$0.3/MtEingabe

$0.03/MtCache-Lesen

$1.2/MtAusgabe

204800Kontext

131100Max. Ausgabe

LLMServerless

GLM-5

$1/MtEingabe

$0.2/MtCache-Lesen

$3.2/MtAusgabe

202800Kontext

131072Max. Ausgabe

LLMServerless

Qwen3 Coder Next

$0.2/MtEingabe

$1.5/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

DeepSeek-OCR 2

$0.03/MtEingabe

$0.03/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLMServerless

Kimi K2.5

$0.6/MtEingabe

$0.1/MtCache-Lesen

$3/MtAusgabe

262144Kontext

262144Max. Ausgabe

LLMServerless

GLM-4.7-Flash

$0.07/MtEingabe

$0.01/MtCache-Lesen

$0.4/MtAusgabe

200000Kontext

128000Max. Ausgabe

LLMServerless

Minimax M2.1

$0.3/MtEingabe

$0.03/MtCache-Lesen

$1.2/MtAusgabe

204800Kontext

131072Max. Ausgabe

LLMServerless

GLM-4.7

$0.6/MtEingabe

$0.11/MtCache-Lesen

$2.2/MtAusgabe

204800Kontext

131072Max. Ausgabe

LLMServerless

AutoGLM-Phone-9B-Multilingual

$0.035/MtEingabe

$0.138/MtAusgabe

65536Kontext

65536Max. Ausgabe

LLMServerless

Kimi K2 Thinking

$0.6/MtEingabe

$0.15/MtCache-Lesen

$2.5/MtAusgabe

262144Kontext

100352Max. Ausgabe

LLMServerless

MiniMax-M2

$0.3/MtEingabe

$0.03/MtCache-Lesen

$1.2/MtAusgabe

204800Kontext

131072Max. Ausgabe

LLMServerless

PaddleOCR-VL

$0.02/MtEingabe

$0.02/MtAusgabe

16384Kontext

16384Max. Ausgabe

LLM

Deepseek V3.2 Exp

$0.27/MtEingabe

$0.41/MtAusgabe

163840Kontext

65536Max. Ausgabe

LLMServerless

Qwen3 VL 235B A22B Thinking

$0.98/MtEingabe

$3.95/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

GLM 4.6V

$0.3/MtEingabe

$0.055/MtCache-Lesen

$0.9/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

GLM 4.6

$0.55/MtEingabe

$0.11/MtCache-Lesen

$2.2/MtAusgabe

204800Kontext

131072Max. Ausgabe

LLMServerless

Neu

Qwen3.6-35B-A3B

$0.248/MtEingabe

$1.485/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Kat Coder Pro

$0.3/MtEingabe

$0.06/MtCache-Lesen

$1.2/MtAusgabe

256000Kontext

128000Max. Ausgabe

LLMServerless

Qwen3 Next 80B A3B Instruct

$0.15/MtEingabe

$1.5/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

DeepSeek-OCR

$0.03/MtEingabe

$0.03/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLM

Deepseek V3.1 Terminus

$0.27/MtEingabe

$0.135/MtCache-Lesen

$1/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Qwen3 VL 235B A22B Instruct

$0.3/MtEingabe

$1.5/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Qwen3 Max

$2.11/MtEingabe

$8.45/MtAusgabe

262144Kontext

65536Max. Ausgabe

Partner

LLMServerless

DeepSeek V3.1

$0.27/MtEingabe

$0.135/MtCache-Lesen

$1/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Kimi K2 0905

$0.6/MtEingabe

$2.5/MtAusgabe

262144Kontext

100352Max. Ausgabe

LLMServerless

Qwen3 Coder 480B A35B Instruct

$0.38/MtEingabe

$1.55/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Qwen3 Coder 30b A3B Instruct

$0.07/MtEingabe

$0.27/MtAusgabe

160000Kontext

32768Max. Ausgabe

LLMServerless

OpenAI GPT OSS 120B

$0.05/MtEingabe

$0.25/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Kimi K2 Instruct

$0.57/MtEingabe

$2.3/MtAusgabe

131072Kontext

100352Max. Ausgabe

LLMServerless

Heiß

DeepSeek V3 0324

$0.27/MtEingabe

$0.135/MtCache-Lesen

$1.12/MtAusgabe

163840Kontext

65536Max. Ausgabe

LLMServerless

Qwen3 235B A22b Thinking 2507

$0.3/MtEingabe

$3/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Llama 3.1 8B Instruct

$0.02/MtEingabe

$0.05/MtAusgabe

16384Kontext

16384Max. Ausgabe

LLMServerless

Gemma3 12B

$0.05/MtEingabe

$0.1/MtAusgabe

131072Kontext

8192Max. Ausgabe

LLM

GLM 4.5V

$0.6/MtEingabe

$0.11/MtCache-Lesen

$1.8/MtAusgabe

65536Kontext

16384Max. Ausgabe

LLMServerless

OpenAI: GPT OSS 20B

$0.04/MtEingabe

$0.15/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Qwen3 235B A22B Instruct 2507

$0.09/MtEingabe

$0.58/MtAusgabe

131072Kontext

16384Max. Ausgabe

LLMServerless

Llama 3.3 70B Instruct

$0.135/MtEingabe

$0.4/MtAusgabe

6000Kontext

120000Max. Ausgabe

LLMServerless

Qwen 2.5 72B Instruct

$0.38/MtEingabe

$0.4/MtAusgabe

32000Kontext

8192Max. Ausgabe

LLMServerless

Mistral Nemo

$0.04/MtEingabe

$0.17/MtAusgabe

60288Kontext

16000Max. Ausgabe

LLMServerless

MiniMax M1

$0.55/MtEingabe

$2.2/MtAusgabe

1000000Kontext

40000Max. Ausgabe

LLMServerless

DeepSeek R1 0528

$0.7/MtEingabe

$0.35/MtCache-Lesen

$2.5/MtAusgabe

163840Kontext

32768Max. Ausgabe

LLMServerless

Wizardlm 2 8x22B

$0.62/MtEingabe

$0.62/MtAusgabe

65535Kontext

8000Max. Ausgabe

LLMServerless

Dedicated

DeepSeek R1 0528 Qwen3 8B

$0.06/MtEingabe

$0.09/MtAusgabe

128000Kontext

32000Max. Ausgabe

LLM

DeepSeek R1 Distill LLama 70B

$0.8/MtEingabe

$0.8/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLMServerless

Qwen3 235B A22B

$0.2/MtEingabe

$0.8/MtAusgabe

40960Kontext

20000Max. Ausgabe

LLMServerless

Llama 4 Maverick Instruct

$0.27/MtEingabe

$0.85/MtAusgabe

1048576Kontext

8192Max. Ausgabe

LLMServerless

Dedicated

Llama 4 Scout Instruct

$0.18/MtEingabe

$0.59/MtAusgabe

131072Kontext

131072Max. Ausgabe

LLMServerless

Hermes 2 Pro Llama 3 8B

$0.14/MtEingabe

$0.14/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLM

L3 70B Euryale V2.1

$1.48/MtEingabe

$1.48/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLM

Sao10k L3 8B Lunaris

$0.05/MtEingabe

$0.05/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLMServerless

BaiChuan M2 32B

$0.07/MtEingabe

$0.07/MtAusgabe

131072Kontext

131072Max. Ausgabe

LLM

ERNIE 4.5 VL 424B A47B

$0.42/MtEingabe

$1.25/MtAusgabe

123000Kontext

16000Max. Ausgabe

LLMServerless

Gemma 3 27B

$0.119/MtEingabe

$0.2/MtAusgabe

98304Kontext

16384Max. Ausgabe

LLMServerless

DeepSeek V3 (Turbo)

$0.4/MtEingabe

$1.3/MtAusgabe

64000Kontext

16000Max. Ausgabe

LLMServerless

DeepSeek R1 (Turbo)

$0.7/MtEingabe

$2.5/MtAusgabe

64000Kontext

16000Max. Ausgabe

LLMServerless

L3 8B Stheno V3.2

$0.05/MtEingabe

$0.05/MtAusgabe

8192Kontext

32000Max. Ausgabe

LLMServerless

MMythomax L2 13B

$0.09/MtEingabe

$0.09/MtAusgabe

4096Kontext

3200Max. Ausgabe

LLM

RRing-2.6-1T

$0.3/MtEingabe

$0.06/MtCache-Lesen

$2.5/MtAusgabe

262144Kontext

65536Max. Ausgabe

LLMServerless

Ling-2.6-flash

$0.1/MtEingabe

$0.02/MtCache-Lesen

$0.3/MtAusgabe

262144Kontext

32768Max. Ausgabe

LLMServerless

Ling-2.6-1T

$0.3/MtEingabe

$0.06/MtCache-Lesen

$2.5/MtAusgabe

262144Kontext

32768Max. Ausgabe

LLMServerless

zai-org/glm-4.5-air

$0.13/MtEingabe

$0.025/MtCache-Lesen

$0.85/MtAusgabe

131072Kontext

98304Max. Ausgabe

LLMServerless

qwen/qwen3-vl-30b-a3b-instruct

$0.2/MtEingabe

$0.7/MtAusgabe

131072Kontext

32768Max. Ausgabe

LLMServerless

Qwen3 Omni 30B A3B Thinking

$0.25/MtEingabe

$0.97/MtAusgabe

65536Kontext

16384Max. Ausgabe

LLMServerless

Qwen3 Omni 30B A3B Instruct

$0.25/MtEingabe

$0.97/MtAusgabe

65536Kontext

16384Max. Ausgabe

LLMServerless

Qwen MT Plus

$0.25/MtEingabe

$0.75/MtAusgabe

16384Kontext

8192Max. Ausgabe

LLMServerless

ERNIE 4.5 21B A3B

$0.07/MtEingabe

$0.28/MtAusgabe

120000Kontext

8000Max. Ausgabe

LLMServerless

Llama 3.2 3B Instruct

$0.03/MtEingabe

$0.05/MtAusgabe

32768Kontext

32000Max. Ausgabe

LLM

L31 70B Euryale V2.2

$1.48/MtEingabe

$1.48/MtAusgabe

8192Kontext

8192Max. Ausgabe

LLMServerless

Große Sprachmodelle

Dedizierter Endpoint