De 45 Minutos de Búsqueda a 4 Minutos de Causa Raíz: OpenTelemetry en una Plataforma de Pagos
Ocho microservicios en EKS, logs en CloudWatch sin trace IDs, y un MTTD de 45 minutos en cada incidente de pagos. Instrumentamos el stack completo con OpenTelemetry Collector, Grafana Tempo y auto-instrumentación — y encontramos una consulta N+1 que venía sumando 200ms a cada pago durante meses.