Model Retraining Triggers

When to retrain:

1. Performance-based:

if current_f1 < baseline_f1 * 0.95:  # 5% degradation
    trigger_retraining()

2. Drift-based:

if psi_score > 0.2:  # Significant drift
    trigger_retraining()

3. Time-based:

if days_since_last_training > 30:
    trigger_retraining()

4. Data-based:

if num_new_labeled_samples > 10000:
    trigger_retraining()

Best practice: Combine multiple triggers with OR logic.

Model Monitoring & Observability

Week 14 · CS 203: Software Tools and Techniques for AI

The "Silent Failure" Problem

Real-World Monitoring Failures

Why ML Models Degrade

The World Doesn't Stand Still

The ML Monitoring Stack

Types of Drift: Deep Dive

Types of Drift (continued)

Drift Detection: Statistical Tests

Drift Detection: Statistical Tests (2)

Drift Detection Example

Monitoring Tools Ecosystem

Evidently AI: Quick Start

Evidently AI: Test Suites

Alibi Detect: Advanced Drift Detection

Model Performance Monitoring

Model Performance Monitoring (2)

Prediction Distribution Monitoring

Delayed Labels Problem

The Feedback Loop Time Machine

Logging Architecture

Logging Best Practices

Monitoring Architecture

Prometheus Integration

Prometheus Integration (2)

Grafana Dashboards

Alerting Rules

Alerting Integration

A/B Testing for Models

Model Retraining Triggers

Continuous Training Pipeline

Model Versioning and Rollback

Feature Store Monitoring

Bias and Fairness Monitoring

Explainability Monitoring

Monitoring Dashboard Design

Monitoring Dashboard Design (2)

Incident Response Playbook

Best Practices Summary

Common Pitfalls

Lab Preview

Key Takeaways

Interview Questions

Additional Resources

Questions?