MCP em produção: padrões de integração que escalam
A lacuna entre demo e deploy
Demos de MCP parecem mágicas. Nos últimos quatro meses, implantei arquiteturas baseadas em MCP em três ambientes empresariais. O protocolo em si é elegante. Os desafios de produção estão ao redor: confiabilidade de transporte, autenticação, observabilidade e o problema surpreendentemente complicado de orquestrar múltiplos servidores MCP simultaneamente.
Seleção de transporte: stdio vs. SSE vs. WebSocket
stdio é o transporte padrão, perfeito para desenvolvimento local. O problema: o ciclo de vida do servidor é vinculado ao processo cliente. HTTP com SSE é o cavalo de batalha de produção — oferece independência de processos e escalonamento horizontal. WebSocket só é necessário quando o servidor precisa enviar mensagens proativas.
Autenticação e autorização
Usamos um modelo de três camadas: autenticação de transporte (mTLS), autenticação de sessão (token de sessão) e autorização por ferramenta (ACL por ferramenta). Implementar todas as três camadas adiciona cerca de 2-3 dias de desenvolvimento por servidor MCP.
Orquestração multi-servidor
Usamos um padrão de proxy de roteamento. O router MCP agrega listas de ferramentas, roteia chamadas e trata health checks. Ping a cada servidor backend a cada 30 segundos — três falhas consecutivas resultam em remoção.
Tratamento de erros em escala
Taxa de erro: 3-8% em operação normal, 15-20% durante incidentes. Erros de rede transitórios (~40%) são reintentados automaticamente. Erros de validação (~25%) não — mensagem clara é retornada. A IA precisa entender o porquê de uma falha, não apenas o fato.
Observabilidade
Rastrear latência de chamadas de ferramentas, taxas de erro, saúde dos servidores. Propagar trace IDs do cliente através do router até servidores backend.
Evolução do esquema de ferramentas
Versionar nomes de ferramentas (query_customers_v2). O router trata roteamento por versão. Manter compatibilidade reversa por pelo menos um ciclo de release.
MCP é a abstração correta para integração de ferramentas AI, mas produção exige trabalho de infraestrutura significativo.