Model Library/Qwen3.5-397B-A17B
qwen/qwen3.5-397b-a17b

Qwen3.5-397B-A17B

qwen/qwen3.5-397b-a17b
The Qwen3.5 series 397B-A17B native vision-language model is based on a hybrid architecture design that integrates linear attention mechanisms with sparse Mixture-of-Experts (MoE), achieving higher inference efficiency. Across a variety of tasks—including language understanding, logical reasoning, code generation, agentic tasks, image understanding, video understanding, and graphical user interface (GUI) interaction—it demonstrates exceptional performance comparable to current top-tier frontier models. Possessing robust code generation and agentic capabilities, it exhibits strong generalization across various agent scenarios.

Funktionen

Serverless API

Dokumentation

qwen/qwen3.5-397b-a17b is available via Novita's serverless API, where you pay per token. There are several ways to call the API, including OpenAI-compatible endpoints with exceptional reasoning performance.

Verfügbare Serverless

Abfragen sofort ausführen, nur für die Nutzung bezahlen

Eingabe$0.6 / M Tokens
Ausgabe$3.6 / M Tokens

Verwenden Sie die folgenden Codebeispiele, um unsere API zu integrieren:

1from openai import OpenAI
2
3client = OpenAI(
4    api_key="<Your API Key>",
5    base_url="https://api.novita.ai/openai"
6)
7
8response = client.chat.completions.create(
9    model="qwen/qwen3.5-397b-a17b",
10    messages=[
11        {"role": "system", "content": "You are a helpful assistant."},
12        {"role": "user", "content": "Hello, how are you?"}
13    ],
14    max_tokens=65536,
15    temperature=0.7
16)
17
18print(response.choices[0].message.content)

Info

Anbieter
Qwen
Quantisierung
-

Unterstützte Funktionalität

Kontextlänge
262144
Maximale Ausgabe
65536
Serverless
Unterstützt
Function Calling
Unterstützt
Structured Output
Unterstützt
Reasoning
Unterstützt
Eingabefähigkeiten
text, image, video
Ausgabefähigkeiten
text

Alles, was Sie brauchen, um produktionsreife AI zu entwickeln.

Über 200 Modelle, GPUs auf Abruf und sichere Agent-Runtimes — vereint unter einer API. Kostenlos zum Einstieg, skaliert mit Ihrem Wachstum.