RAG und Knowledge¶
Stand: 2026-05-20
Zielbild¶
Das Wissen für Codex, Claude Code, OpenCode und Open WebUI soll aus nachvollziehbaren Quellen kommen:
- Gitea als versionierte Quelle.
- MkDocs/Wiki als menschlich lesbares Frontend.
- NetBox als produktives IPAM/DCIM.
- Open WebUI Knowledge für Chat-RAG.
- OpenCode Memory und Skills für Arbeitsregeln.
Projektordner¶
Gescannt wurde:
/Users/vinc32/Library/Mobile Documents/com~apple~CloudDocs/Codex Projekte
Dabei wurden .git, node_modules, virtuelle Umgebungen, __pycache__, Backups, temporäre Ordner und offensichtliche Secret-Dateien ausgeschlossen.
| Projektordner | RAG-relevante Textdateien |
|---|---|
Lanstyle |
805 |
TecMed |
654 |
TecMed_Enterprise Architecture |
20 |
SMS |
1455 |
SGJ |
1682 |
SGO |
71 |
Radius Server Schulen |
2 |
Hauck |
4 |
Metze |
60 |
DRK_MTL |
0 |
Speed |
0 |
Netzwerkdiagram |
238 |
Netzwerktester |
197 |
Lanstyle_Intern_Website |
92 |
Lexware Automation |
14 |
Smarthome_Allerstedt |
187 |
Privat |
35 |
Empfohlene Struktur¶
Pro Kunde sollte ein eigenes Repository entstehen:
dokumentationautomationenconfigs- optional
reports
RAG-tauglich sind vor allem Markdown, YAML, JSON, CSV, PowerShell und Shell-Skripte. Binärdateien, Exporte, Backups und temporäre Artefakte sollten nicht direkt indexiert werden.
Zugriffsmodell¶
- Maximilian Eberhardt darf alle Kundenorganisationen bearbeiten.
- Andere bestehende Benutzer bearbeiten nur eigene Unternehmen.
- Marcel Hampel, René Kulcsar und Max Rothe sollen Zugriff auf Schulorganisationen erhalten.
- Marcel Hampel soll zusätzlich Zugriff auf TecMed erhalten.
Bis E-Mail-Adressen und Gitea-Usernamen der neuen Benutzer feststehen, werden keine Konten erzeugt.
Open WebUI Knowledge¶
Empfohlen:
- pro Kunde eine Knowledge Collection
- keine Secrets, Passwörter, private Keys oder vollständigen Dumps hochladen
- bevorzugt aus Gitea/MkDocs generierte, bereinigte Markdown-Dokumente verwenden
- Embeddings über
nomic-embed-text:latest
OpenCode¶
OpenCode nutzt lokale Memory-Dateien und Skills. Für produktive Kundenarbeit gilt:
- erst Kundenkontext erkennen
- dann Gitea/NetBox/Wiki prüfen
- danach Änderungen mit Backup und Git-Diff durchführen
- keine Kundenkontexte vermischen
Knowledge-Pipeline¶
Vorbereitete maschinenlesbare Konfiguration:
agent-runtime/configs/knowledge-pipeline.yaml
Grundregeln:
- Quelle ist bevorzugt Gitea/MkDocs.
- NetBox wird fuer technische Fakten referenziert, nicht blind in RAG kopiert.
- Vaultwarden-Inhalte werden nie indexiert.
- Kundenkontexte werden getrennt verarbeitet.
- Binarys, Backups, Dumps,
.env, Keys und Token-Dateien werden ausgeschlossen.
Hermes Memory Integration¶
Seit 2026-05-30 gibt es zusätzlich eine kuratierte Obsidian-Quelle:
- Vault:
obsidian/lanstyle-vault - Indexer:
agent-runtime/scripts/ingest-obsidian-to-qdrant.py - Query-Test:
agent-runtime/scripts/query-obsidian-memory.py - Qdrant Collection:
lanstyle_obsidian_memory - Embedding-Modell:
lanstyle/embedüber LiteLLM
Der Lanstyle AI Gateway nutzt diese Collection als Retrieval-Kontext für den Nous Hermes Core. Obsidian bleibt menschlich pflegbar, Qdrant ist nur die semantische Suchschicht. Secrets werden weder in Obsidian noch in Qdrant abgelegt.
Details: Hermes Knowledge und Memory