Hermes Central Brain¶

Stand: 2026-05-30

Korrektur des Zielbilds¶

Hermes ist nicht primaer Voice oder Teams. Hermes ist die zentrale Context-, Memory-, Retrieval- und Policy-Schicht der Lanstyle AI Suite.

Voice und Teams sind nur zwei Kanaele, die besonders klar ueber den Lanstyle AI Gateway laufen muessen. OpenCode und OpenWebUI sollen langfristig ebenfalls von Hermes-Kontext profitieren, ohne ihre jeweilige Staerke zu verlieren.

Rollen im Central-Brain-Modell¶

Ebene	Aufgabe
Lanstyle AI Gateway	Auth, RBAC, Audit, Policy, Retrieval-Orchestrierung, Channel Adapter
Nous Hermes Core	Agent-Logik, Session Memory, native Memory, Skills, Learning Loop
Obsidian	kuratierte menschenlesbare Wissensbasis
Qdrant	semantischer Retrieval-Index
LiteLLM	Modellrouting und Model Access
MCP / Controlled Execution	read-only, preflight und scoped Infrastrukturaktionen

OpenCode Zielintegration¶

OpenCode ist bei Lanstyle ein Operations-Client fuer SSH, Linux, Proxmox, Aruba, UniFi, PowerShell, Intune, M365, Azure, APIs, Firewalling, Dokumentation, Runbooks, Architektur, Troubleshooting und Change Reviews.

Deshalb braucht OpenCode Zugriff auf:

Session Context
Obsidian Retrieval
Qdrant Retrieval
Projektwissen
Architekturwissen
Runbooks
Change-Historie
Governance- und Policy-Kontext

Bewertete Varianten¶

A: OpenCode -> Hermes -> LiteLLM¶

Vorteile:

zentraler Kontext fuer alle Prompts
einheitliche Audit-/Policy-Schicht
Memory kann automatisch eingebunden werden

Nachteile:

hoehere Latenz
mehr Tokenverbrauch durch Retrieval-Kontext
Risiko fuer Coding-Performance
groesserer Gateway-Betriebsdruck
Tool-/MCP-Streaming komplexer

Bewertung: nicht als Standardpfad fuer alle OpenCode-Sessions geeignet.

B: OpenCode -> LiteLLM direkt plus Hermes Tool¶

Vorteile:

OpenCode bleibt schnell
Coding-/Shell-nahe Arbeit bleibt schlank
Hermes-Kontext wird nur bei Bedarf abgefragt
niedriges Risiko fuer bestehende Operator-Flows
klare Trennung zwischen Model Call und Knowledge/Policy Query

Nachteile:

Agent muss wissen, wann Hermes-Kontext gebraucht wird
kein automatischer globaler Session-Memory-Kontext
UX braucht gute Tool-Beschreibungen

Bewertung: bester kurzfristiger Pfad.

C: Hybrid Routing¶

Vorteile:

Standardarbeit direkt ueber LiteLLM
Ops-/Change-/Troubleshooting-Fragen optional mit Hermes Retrieval
bestimmte Modi koennen bewusst ueber Gateway laufen
gute Balance aus Performance und Governance

Nachteile:

braucht klare Routing-Regeln
braucht Operator UX, damit Benutzer den Modus verstehen
muss Tokenbudget und Kontextumfang begrenzen

Bewertung: Zielarchitektur fuer produktiven Betrieb.

Empfehlung fuer OpenCode¶

Kurzfristig:

OpenCode bleibt direkt an LiteLLM und Remote MCP.
Hermes wird als explizites read-only Kontext-/Policy-/Retrieval-Tool angebunden.
Kein Default-Routing von OpenCode komplett durch Hermes.
OpenCode nutzt Hermes zuerst fuer Operations-Kontext, Change Review, Incident Analyse und Dokumentationssuche, nicht fuer jeden kurzen Prompt.

Mittelfristig:

OpenCode bekommt Modi:
fast/coding: LiteLLM direkt, kein Retrieval
ops-context: Hermes Retrieval Tool
change-review: Hermes + Policy/Risk + Controlled Execution Preview
incident: Hermes + State/Drift + Safe Mode Status

Langfristig:

Hybrid-Routing mit automatisch begrenztem Kontext.
Retrieval nur bei Infrastruktur-, Architektur-, Runbook-, Change- oder Troubleshooting-Signalen.
Keine Rohdatenflut in OpenCode.

Governance¶

Hermes darf OpenCode Kontext liefern, aber keine lokalen bash/edit-Rechte erteilen und keine Controlled Execution umgehen. Echte Infrastrukturaktionen bleiben beim MCP/Controlled Execution Layer.

Details zu OpenCode Usage Profile, Ops-Modi, Obsidian Governance und Token Pressure stehen in OpenCode als AI Operations Console.