MCP in der Produktion: Integrationsmuster, die skalieren
Die Lücke zwischen Demo und Deployment
MCP-Demos wirken magisch. In den letzten vier Monaten habe ich MCP-basierte Architekturen in drei Unternehmensumgebungen bereitgestellt. Das Protokoll selbst ist elegant. Die Produktionsherausforderungen liegen allesamt drumherum: Transportzuverlässigkeit, Authentifizierung, Observability und die überraschend knifflige Aufgabe, mehrere MCP-Server gleichzeitig zu orchestrieren.
Transportauswahl: stdio vs. SSE vs. WebSocket
stdio ist der Standardtransport und perfekt für lokale Entwicklung. Das Problem: Die Server-Lebensdauer ist an den Client-Prozess gebunden. HTTP mit SSE ist der Produktionsarbeitspferd — bietet Prozessunabhängigkeit und horizontale Skalierung. Wir nutzen SSE für alle Produktionseinsätze, aber SSE-Verbindungen sind langlebig — Load Balancer dürfen keine Idle-Timeouts haben. WebSocket ist nur nötig, wenn Server proaktiv Nachrichten senden müssen.
Authentifizierung und Autorisierung
Wir verwenden ein Drei-Schichten-Modell: Transport-Authentifizierung (mTLS), Sitzungs-Authentifizierung (Session-Token) und Tool-Level-Autorisierung (ACL pro Tool). Alle drei Ebenen zu implementieren kostet etwa 2-3 Tage Entwicklungszeit pro MCP-Server.
Multi-Server-Orchestrierung
Wir lösen das mit einem Router-Proxy-Muster. Der MCP-Router aggregiert Tool-Listen, routet Aufrufe und behandelt Health-Checks. Er pingt jeden Backend-Server alle 30 Sekunden — drei aufeinanderfolgende Fehler führen zur Entfernung aus der Routing-Tabelle.
Fehlerbehandlung im Produktionsmaßstab
Fehlerrate: 3-8 % im Normalbetrieb, 15-20 % bei Vorfällen. Transiente Netzwerkfehler (~40 %) werden automatisch wiederholt. Validierungsfehler (~25 %) nicht — hier wird eine klare Fehlermeldung zurückgegeben. Der KI muss das Warum eines Fehlers mitgeteilt werden, nicht nur das Dass.
Observability
Tool-Aufruf-Latenz (p50/p95/p99), Fehlerraten, Server-Gesundheit verfolgen. Trace-IDs vom Client durch den Router zu Backend-Servern propagieren.
Tool-Schema-Evolution
Tool-Namen mit Versionsnummern versehen (query_customers_v2). Der Router behandelt Version-Routing. Mindestens einen Release-Zyklus Rückwärtskompatibilität halten.
MCP ist die richtige Abstraktion für KI-Tool-Integration, aber Produktionseinsatz erfordert erhebliche Infrastrukturarbeiten.