Magno Silva CONTATO
Voltar ao Blog
IA 10 Mai 2026 15 min leitura

IA em Produção: 21 Camadas de Guardrails que Salvam seu Negócio

MS

Magno Silva

AI System Architect

Todo mundo quer colocar IA em produção. Poucos entendem o que acontece quando um LLM alucina em um contexto de negócio crítico — como gerar um boleto com valor errado, aprovar um lançamento fiscal incorreto ou expor dados de outro tenant.

Depois de implementar IA em 10 produtos SaaS simultaneamente, desenvolvi uma arquitetura de 21 camadas de guardrails que protegem o negócio sem sacrificar a experiência do usuário.

A Arquitetura de 5 Camadas

Camada 1: Pre-Processamento

Antes do prompt chegar ao LLM, ele passa por guards de input:

  • PromptGuard: detecta injection, jailbreak e manipulação
  • PhishingGuard: identifica tentativas de phishing no input
  • UnicodeGuard: normaliza caracteres suspeitos
  • ConsentGuard: verifica se o usuário autorizou processamento IA

Camada 2: Context Building

O contexto e construído com PII scrubbing automático. Nomes, CPFs, emails e dados sensíveis são mascarados antes de serem enviados ao LLM. O ContextScrubber garante que nenhuma PII vaze para modelos externos.

Camada 3: LLM Routing

O LLMRouter usa Thompson Sampling 4D para escolher o melhor modelo para cada request. A reward function combina: speed (30%), reliability (20%), quality (20%) e cost-efficiency (30%). Fallback automático: Ollama local → OpenAI → Anthropic → RAG-only.

Camada 4: Pós-Geração

Após o LLM gerar a resposta:

  • PostGenValidator: verifica factualidade contra dados reais
  • GroundingValidator: garante que URLs e paths mencionados existem
  • ToxicityGuard: filtra conteúdo inapropriado
  • OutputScrubber: remove nomes de classes e models do output

Camada 5: Monitoramento

Toda interação é logada com métricas de qualidade, tempo de resposta, modelo usado, tokens consumidos e custo. Circuit breaker desativa modelos com taxa de erro alta. Drift detection identifica degradação de qualidade ao longo do tempo.

ISO 42001 na Prática

Cada decisão de IA gera um AIDecisionLog com os fatores e pesos que levaram aquela decisão. Isso garante explainability e permite auditoria retroativa. Human oversight e mandatório para ações críticas como cobrança, bloqueio de tenant ou emissão fiscal.

Resultado

Com essa arquitetura, conseguimos manter taxa de alucinação abaixo de 2% em produção, com zero incidentes de data leak via IA em mais de 6 meses de operação. O custo de não implementar guardrails é sempre maior que o de implementar.

Se você está colocando IA em produção sem guardrails, você está jogando roleta russa com os dados dos seus clientes.