Zum Inhalt springen
// Context Engineering
Disziplin

Was DevOps für Cloud war,
ist Context Engineering für Agentic AI.

Systematische Steuerung, welcher Kontext wann an welchen Agenten fließt — betreibbar, messbar, kosten-kontrolliert.

// 01 · Das Problem
„Lost in the Middle"

Mehr Kontext ist nicht mehr Qualität.

Auch bei 200.000 Tokens ignorieren LLMs Inhalte in der Mitte langer Prompts. Wer „alles reinkippt", zahlt für 70 % verschwendete Tokens — und bekommt eine unschärfere Antwort.

Kontextfenster · Recall-Wahrscheinlichkeit
Liu et al. 2023 · „Lost in the Middle"

Wie zuverlässig erinnert das LLM, was an welcher Stelle steht?

Anfang und Ende werden fast immer gefunden. In der Mitte sinkt die Wahrscheinlichkeit deutlich — unabhängig von der Kontext-Größe.

AnfangMitteEnde
Position wählen
Position 15 / 28·Erinnerungs-Wahrscheinlichkeit 40%
Nach Context Engineering
~40% kürzer · alles relevant

Dieselbe Aufgabe, aber nur noch kuratierter Kontext. Jede Zelle trägt Signal — nichts verblasst in der Mitte.

AnfangEnde
context_flow.live
token_budget · 128kLIVE
Budget
128.000 Tokens
System-Layerpermanent · rollen-fixTask-Layeron-demand · pro AufgabeRetrieval-LayerRAG · punktuellMemorycurated · StateOutputAgent-Antwort7×7×7×7×1×
Beobachtung

Mehr Budget heißt nicht mehr Signal — es heißt mehr Kanäle pro Tier.

Wirkung

Saubere Tier-Trennung reduziert Token-Verbrauch typischerweise um 80 %.

Regel

Context-Dichte > Context-Länge. Jeder Tier hat ein Budget, keines wird überzogen.

quelle · context hierarchymethode · tier-staffelungstand · 2026-04
0 %
Token-Reduktion

in typischen Context-Hierarchy-Szenarien, bei gleicher Qualität.

0 %
verschwendete Tokens

wenn der Prompt kein Tier-Modell hat — der Default in der Praxis.

0k
Kontext-Fenster

reicht nicht — ohne Hierarchie wird auch Mehr nicht besser.

// 02 · Vier Bausteine
Die Disziplin

Vier Bausteine, die eine Agent-Architektur tragen.

Ob KI zu einer zuverlässigen Infrastruktur wird oder eine Sammlung loser Experimente bleibt, entscheidet das Zusammenspiel dieser vier.

Kontext-Hierarchie

Permanent → Skill → Task → Dynamic. Reduziert Tokens und verbessert Antworten zugleich.

Tool-Scoping

Pro Rolle ein sauberes Tool-Set, standardisiert über MCP. Macht Verhalten vorhersagbar und Audits machbar.

Memory & State

Session-Logs, curated Memory, Shared State. Struktur macht aus Gesprächen eine Wissensbasis.

Delegation

Orchestrator → Worker mit klaren Scopes. Komplexes zerlegen, parallel bearbeiten, konsolidieren.

// 03 · RAG ≠ Strategie
Abgrenzung

RAG ist ein Werkzeug. Context-Hierarchie ist die Strategie.

Retrieval Augmented Generation holt ähnliche Chunks zur Anfrage. Das funktioniert — bis Anfragen strukturell über ein Dokument hinausgehen oder Ähnlichkeit semantisch danebengreift.

paradigm_compare
rag ↔ context
Context-zentrisch

Tier → Skill → Delegation

  • Permanenter Kontext bleibt zusammen
  • Skill-basiertes Loading pro Aufgabe
  • Rollen-Scopes & Rechte explizit
  • RAG punktuell als Lookup-Werkzeug
methode · split-viewregler · drag oder klickstand · 2026-04
// 04 · autoresearch
Modify → Run → Evaluate → Keep

KI, die über Nacht Verbesserungen vorschlägt.

Ein Muster, kein Werkzeug. Der Agent verändert eine Konfiguration, misst gegen eine klare Metrik, behält Verbesserungen, verwirft den Rest.

autoresearch.run
276 experimente · 1 nachtLIVE
0
Experimente

autonom durchlaufen, alle reproduzierbar protokolliert.

0
Übernommene Verbesserungen

mit messbarer Wirkung — z. B. Lighthouse 60 → 95.

0 %
Token-Reduktion

bei gleicher Antwortqualität — typisches Resultat.

Voraussetzung: messbare Metrik, schnelles Feedback, isoliert testbare Änderungen. Nicht für sicherheitskritischen Code.

quelle · eigener pocmetrik · lighthouse 60 → 95stand · 2026-04
// 05 · Agent Harness
Architektur-Pattern 2026

Drei Protokolle — ein sicherer Rahmen,
in dem Ihre Agenten arbeiten.

Runtime-Umgebung mit klaren Rechten, Observability und Revision. Ein Betriebssystem für KI.

MCP

Model Context Protocol

„USB für KI-Tools" — herstellerunabhängiger Standard für CRM-, ERP-, Datenquellen.

ACP

Agent Communication Protocol

Spawn, Pause, Resume, Kontext-Update — alles mit Audit-Log.

A2A

Agent-to-Agent

Kommunikation zwischen Agenten über Systemgrenzen hinweg.

Nächster Schritt

Ein technisches Tiefengespräch
ist der beste Einstieg.

Wir besprechen Ihre Agent-Landschaft und zeigen, welche Context-Architecture-Entscheidungen den größten Effekt haben.