Zum Inhalt

AI Operating System v1

Stand: 2026-05-30

1. Komponenten

Komponente Rolle
OpenCode Operations-Client fuer Admins und Operatoren
OpenWebUI Chat-UI und Self-Service Einstieg
Voice / Jarvis Audio-Client mit Hermes Backend
Teams geplanter Chat-Kanal fuer Hermes
Lanstyle Agent Gateway zentrale Context-/Policy-/Routing-Schicht
Nous Hermes Core Agent-Core mit Memory, Skills, Sessions
LiteLLM Modellrouting und Model Access
Qdrant semantischer Retrieval-Index
Obsidian menschenlesbare Knowledge Source
MCPHub / Remote MCP Tool-Zugriff
Controlled Execution sichere Infrastruktur-Aenderungen

2. Datenfluesse

flowchart TD
  OpenCode["OpenCode"] --> LiteLLM
  OpenCode --> MCP["Remote MCP"]
  OpenCode -. "optional context" .-> Gateway["Lanstyle Agent Gateway"]
  OpenWebUI["OpenWebUI"] --> LiteLLM
  Voice["Voice Client"] --> Gateway
  Teams["Teams"] --> Gateway
  Gateway --> Core["Nous Hermes Core"]
  Gateway --> Qdrant["Qdrant"]
  Qdrant --> Obsidian["Obsidian Vault"]
  Core --> LiteLLM
  MCP --> CE["Controlled Execution"]

3. Memory Layer

  • Native Nous Memory fuer Agent-/User-Kontext.
  • Obsidian fuer kuratierte Betriebsfakten.
  • Qdrant fuer semantisches Retrieval.
  • MkDocs fuer veroeffentlichte Betriebsdoku.
  • Vaultwarden fuer Secrets.

4. Governance Layer

Governance besteht aus:

  • RBAC
  • Approval
  • Policy/Risk Engine
  • Dependency Locks
  • Backup Enforcement
  • Audit
  • Verification
  • Rollback/Recovery

5. Modellrouting

Zweck Modell
Schnell lanstyle/fast
Standard lanstyle/agent-stable
Planung lanstyle/architect
Embedding lanstyle/embed
Experiment lanstyle/agent, entfernt

6. Retrieval Layer

Retrieval darf Kontext liefern, aber keine Wahrheit erzwingen. Jede Antwort soll Quelle, Confidence und Unsicherheit sichtbar machen.

Phase-3-Werkzeug:

  • hermes_context_search: read-only Kontextsuche in Obsidian/Qdrant fuer OpenCode und Operator-Flows.
  • Antwort mit trust_summary, Quellen, Confidence und begrenzter Excerpt-Laenge.
  • Keine Infrastrukturwrites und keine Secret-Ausgabe.

7. Tool Layer

Tools sind getrennt:

  • read-only
  • preflight
  • approval preview
  • scoped write
  • recovery
  • destructive nur separat und streng

Writes laufen nur ueber Controlled Execution.

8. User Journey

Normaler Benutzer

  1. Nutzt OpenWebUI oder OpenCode Operator-Profil.
  2. Sieht kuratierte Modelle.
  3. Nutzt read-only oder Self-Service.
  4. Keine Secrets im Chat.

Operator

  1. Startet Preflight oder Change Review.
  2. Bekommt Operator Summary, Risk, Policy, Locks, Backup Readiness.
  3. Bereitet Approval vor.
  4. Fuehrt keine direkten Writes ohne Approval aus.

OpenCode mit Hermes-Kontext

  1. Operator arbeitet weiter direkt in OpenCode mit LiteLLM/MCP.
  2. Bei Infrastruktur-, Runbook-, Architektur- oder Change-Fragen ruft OpenCode hermes_context_search auf.
  3. Das Tool liefert kompakte Quellen aus Obsidian/Qdrant.
  4. Fuer echte Aenderungen folgt danach Preflight/Approval ueber Controlled Execution.

Admin

  1. Verwaltet Tokens, Modelle, Runtime und Recovery.
  2. Darf Evaluation-Modelle sehen.
  3. Muss Secrets ueber Vaultwarden fuehren.

9. Leitsatz

Hermes ist das zentrale Brain fuer Kontext, Memory, Retrieval und Policy. Execution bleibt kontrolliert, scoped und auditierbar.