DeepSeek-R1-0528-Qwen3-8B is a high-performance reasoning model based on the Qwen3 8B Base model, enhanced through the integration of DeepSeek-R1-0528's Chain-of-Thought (CoT) optimization. In the AIME 2024 evaluation, this open-source model achieved state-of-the-art (SOTA) performance, delivering a 10% improvement over the original Qwen3 8B while matching the reasoning capabilities of the much larger 235-billion-parameter Qwen3-235B-thinking.
機能
オンデマンドデプロイメント
ドキュメント
On-demand deployments allow you to use deepseek/deepseek-r1-0528-qwen3-8b on dedicated GPUs with high-performance serving stack with high reliability and no rate limits.
情報
プロバイダー
-
量子化
bf16
サポートされている機能
コンテキスト長
128000
最大出力
32000
Serverless
サポートされていません
入力機能
text
出力機能
text
本番環境向けAIを構築するために必要なすべて。
200以上のモデル、オンデマンド GPUs、安全なエージェントランタイムを、1つの API に統合。無料で始められ、成長に合わせてスケールできます。