MCP in der Produktion: Integrationsmuster, die skalieren - Toolsify AI Blog

Die Lücke zwischen Demo und Deployment

MCP-Demos wirken magisch. In den letzten vier Monaten habe ich MCP-basierte Architekturen in drei Unternehmensumgebungen bereitgestellt. Das Protokoll selbst ist elegant. Die Produktionsherausforderungen liegen allesamt drumherum: Transportzuverlässigkeit, Authentifizierung, Observability und die überraschend knifflige Aufgabe, mehrere MCP-Server gleichzeitig zu orchestrieren.

Transportauswahl: stdio vs. SSE vs. WebSocket

stdio ist der Standardtransport und perfekt für lokale Entwicklung. Das Problem: Die Server-Lebensdauer ist an den Client-Prozess gebunden. HTTP mit SSE ist der Produktionsarbeitspferd — bietet Prozessunabhängigkeit und horizontale Skalierung. Wir nutzen SSE für alle Produktionseinsätze, aber SSE-Verbindungen sind langlebig — Load Balancer dürfen keine Idle-Timeouts haben. WebSocket ist nur nötig, wenn Server proaktiv Nachrichten senden müssen.

Authentifizierung und Autorisierung

Wir verwenden ein Drei-Schichten-Modell: Transport-Authentifizierung (mTLS), Sitzungs-Authentifizierung (Session-Token) und Tool-Level-Autorisierung (ACL pro Tool). Alle drei Ebenen zu implementieren kostet etwa 2-3 Tage Entwicklungszeit pro MCP-Server.

Multi-Server-Orchestrierung

Wir lösen das mit einem Router-Proxy-Muster. Der MCP-Router aggregiert Tool-Listen, routet Aufrufe und behandelt Health-Checks. Er pingt jeden Backend-Server alle 30 Sekunden — drei aufeinanderfolgende Fehler führen zur Entfernung aus der Routing-Tabelle.

Fehlerbehandlung im Produktionsmaßstab

Fehlerrate: 3-8 % im Normalbetrieb, 15-20 % bei Vorfällen. Transiente Netzwerkfehler (~40 %) werden automatisch wiederholt. Validierungsfehler (~25 %) nicht — hier wird eine klare Fehlermeldung zurückgegeben. Der KI muss das Warum eines Fehlers mitgeteilt werden, nicht nur das Dass.

Observability

Tool-Aufruf-Latenz (p50/p95/p99), Fehlerraten, Server-Gesundheit verfolgen. Trace-IDs vom Client durch den Router zu Backend-Servern propagieren.

Tool-Schema-Evolution

Tool-Namen mit Versionsnummern versehen (query_customers_v2). Der Router behandelt Version-Routing. Mindestens einen Release-Zyklus Rückwärtskompatibilität halten.

MCP ist die richtige Abstraktion für KI-Tool-Integration, aber Produktionseinsatz erfordert erhebliche Infrastrukturarbeiten.