Zum Inhalt

Model Routing Strategy

Stand: 2026-05-30

Produktive Defaults

Zweck Modell Status
Standard Operator / OpenCode lanstyle/agent-stable produktiv
Schnellantworten lanstyle/fast produktiv
Planung / Architektur lanstyle/architect produktiv
Embeddings lanstyle/embed produktiv
A3B Reasoning lanstyle/agent experimentell
A3B No-Think entfernt admin/evaluation-only

Qwen Coder Next Tokenlimit

lanstyle/agent-stable und lanstyle/fast nutzen qwen3-coder-next:latest. Die LiteLLM-Konfiguration erlaubt große Output-Budgets, aber OpenCode-Sessions können trotzdem durch lange Toolantworten und große Kontextblöcke in finish_reason=length laufen.

Sichere Maßnahmen:

  • Toolantworten kompakt halten.
  • Operator Summaries priorisieren.
  • Rohdaten nur in Debug/Advanced ausgeben.
  • Für lange Planung lanstyle/architect nutzen.
  • Keine experimentellen Modelle als Default setzen.

OpenWebUI Sichtbarkeit

Normale Benutzer sollten nur Lanstyle-Aliase sehen. Raw Provider-Modelle und experimentelle Aliase gehören in Admin-/Evaluation-Kontext.

Wenn OpenWebUI raw Modelle zeigt, ist die wahrscheinlichste Ursache ein zu breiter LiteLLM Virtual Key oder eine direkte Provider-Verbindung statt Lanstyle-Modellfilter.