MCP en production : modèles d'intégration qui passent à l'échelle
L'écart entre la démo et le déploiement
Les démos MCP semblent magiques. Au cours des quatre derniers mois, j'ai déployé des architectures MCP dans trois environnements d'entreprise. Le protocole lui-même est élégant. Les défis de production sont tout autour : fiabilité du transport, authentification, observabilité et le problème étonnement délicat d'orchestrer plusieurs serveurs MCP simultanément.
Sélection du transport : stdio vs. SSE vs. WebSocket
stdio est le transport par défaut, idéal pour le développement local. Le problème : le cycle de vie du serveur est lié au processus client. HTTP avec SSE est le cheval de bataille de production — offre l'indépendance des processus et la mise à l'échelle horizontale. WebSocket n'est nécessaire que lorsque le serveur doit envoyer des messages proactifs.
Authentification et autorisation
Nous utilisons un modèle à trois couches : authentification de transport (mTLS), authentification de session (token de session) et autorisation au niveau des outils (ACL par outil).
Orchestration multi-serveurs
Nous utilisons un modèle de proxy de routage. Le routeur MCP agrège les listes d'outils, route les appels et gère les health checks. Ping de chaque serveur backend toutes les 30 secondes — trois échecs consécutifs entraînent la suppression.
Gestion des erreurs à l'échelle
Taux d'erreur : 3-8 % en fonctionnement normal, 15-20 % pendant les incidents. Les erreurs réseau transitoires (~40 %) sont automatiquement retentées. Les erreurs de validation (~25 %) non — un message clair est renvoyé. L'IA doit comprendre le pourquoi d'un échec, pas seulement le fait.
Observabilité
Suivre la latence d'appel des outils, les taux d'erreur, la santé des serveurs. Propager les trace IDs du client à travers le routeur vers les serveurs backend.
Évolution du schéma des outils
Versionner les noms d'outils (query_customers_v2). Le routeur gère le routage par version. Maintenir la rétrocompatibilité pendant au moins un cycle de release.
MCP est la bonne abstraction pour l'intégration d'outils IA, mais la production nécessite un travail d'infrastructure considérable.