On-demand deployments allow you to use google/gemma-3-12b-it on dedicated GPUs with high-performance serving stack with high reliability and no rate limits.
信息
提供商
Gemma
量化
bf16
支持的功能
上下文长度
131072
最大输出
8192
Serverless
不支持
输入能力
text, image
输出能力
text
构建生产级 AI 所需的一切。
200+ 个模型、按需 GPUs 和安全的智能体运行时——统一在一个 API 下。免费开始,随业务增长灵活扩展。