Model Library/DeepSeek R1 0528 Qwen3 8B
deepseek/deepseek-r1-0528-qwen3-8b

DeepSeek R1 0528 Qwen3 8B

deepseek/deepseek-r1-0528-qwen3-8b
DeepSeek-R1-0528-Qwen3-8B is a high-performance reasoning model based on the Qwen3 8B Base model, enhanced through the integration of DeepSeek-R1-0528's Chain-of-Thought (CoT) optimization. In the AIME 2024 evaluation, this open-source model achieved state-of-the-art (SOTA) performance, delivering a 10% improvement over the original Qwen3 8B while matching the reasoning capabilities of the much larger 235-billion-parameter Qwen3-235B-thinking.

Recursos

Implantações sob demanda

Documentação

On-demand deployments allow you to use deepseek/deepseek-r1-0528-qwen3-8b on dedicated GPUs with high-performance serving stack with high reliability and no rate limits.

Informações

Provedor
-
Quantização
bf16

Funcionalidades compatíveis

Comprimento do contexto
128000
Saída máxima
32000
Serverless
Não compatível
Capacidades de entrada
text
Capacidades de saída
text

Tudo o que você precisa para criar IA de produção.

Mais de 200 modelos, GPUs sob demanda e ambientes de execução de agentes seguros — unificados em uma única API. Grátis para começar, escala conforme você cresce.