Model Library/MiniMax M2.5-highspeed
minimax/minimax-m2.5-highspeed

MiniMax M2.5-highspeed

minimax/minimax-m2.5-highspeed
MiniMax M2.5-highspeed is an accelerated SOTA model engineered for scenarios demanding extreme efficiency. It perfectly inherits the core intelligence and robust digital workspace capabilities of the standard M2.5—including its 80.2% score on SWE-Bench Verified, seamless manipulation of Office documents, and versatility in cross-software collaboration. With zero compromise on reasoning precision or logical depth, the Highspeed version delivers ultra-low latency inference through rigorous engineering optimization. This means you get more than just an intelligent assistant capable of planning and self-optimization; you gain a "high-velocity engine" that responds to high-frequency calls and processes complex document streams in near real-time, making it ideal for latency-sensitive interactive applications and large-scale automated pipelines.

Funktionen

Serverless API

Dokumentation

minimax/minimax-m2.5-highspeed is available via Novita's serverless API, where you pay per token. There are several ways to call the API, including OpenAI-compatible endpoints with exceptional reasoning performance.

Verfügbare Serverless

Abfragen sofort ausführen, nur für die Nutzung bezahlen

Eingabe$0.6 / M Tokens
Cache-Lesevorgang$0.03 / M Tokens
Ausgabe$2.4 / M Tokens

Verwenden Sie die folgenden Codebeispiele, um unsere API zu integrieren:

1from openai import OpenAI
2
3client = OpenAI(
4    api_key="<Your API Key>",
5    base_url="https://api.novita.ai/openai"
6)
7
8response = client.chat.completions.create(
9    model="minimax/minimax-m2.5-highspeed",
10    messages=[
11        {"role": "system", "content": "You are a helpful assistant."},
12        {"role": "user", "content": "Hello, how are you?"}
13    ],
14    max_tokens=131100,
15    temperature=0.7
16)
17
18print(response.choices[0].message.content)

Info

Anbieter
MiniMax
Quantisierung
fp8

Unterstützte Funktionalität

Kontextlänge
204800
Maximale Ausgabe
131100
Serverless
Unterstützt
Function Calling
Unterstützt
Structured Output
Unterstützt
Reasoning
Unterstützt
Anthropic API
Unterstützt
Eingabefähigkeiten
text
Ausgabefähigkeiten
text

Alles, was Sie brauchen, um produktionsreife AI zu entwickeln.

Über 200 Modelle, GPUs auf Abruf und sichere Agent-Runtimes — vereint unter einer API. Kostenlos zum Einstieg, skaliert mit Ihrem Wachstum.