Questions?

Notebooks (in lecture-demos/week05/):

Interactive App: python augmentation_demo_app.py

Data Augmentation

Week 5 · CS 203: Software Tools and Techniques for AI

Part 1: The Data Hunger Problem

Previously on CS 203...

The Problem & Solution

What is Data Augmentation?

The Invariance Problem

You Already Use Augmentation Daily!

MNIST: 1 Digit → 10 Training Examples

Published Results: Augmentation Works!

Why Augmentation Reduces Overfitting

Part 2: Image Augmentation

Image Augmentation: The Big Picture

Geometric Transforms

Color/Intensity Transforms

Elastic Deformation

Weather Augmentation

The "b vs d" Problem

Good vs Bad Augmentation

Noise Augmentation

Blur Augmentation

Advanced: Cutout

Advanced: Mixup

Advanced: CutMix

Mixup vs CutMix

Task-Specific Augmentation

Augmentation by Task: Overview

Object Detection: Transform BBoxes Too!

Object Detection: Albumentations Code

Segmentation: Transform Masks Too!

Segmentation: Albumentations Code

NER: Protect Entity Tokens!

NER Augmentation: Code Example

Pose Estimation: Transform Keypoints

Pose Estimation: Albumentations Code

OCR/Document: Be Conservative!

Albumentations: The Go-To Library

The Augmentation Pipeline

Medical Imaging: Be VERY Careful!

Domain-Specific Rules

Exercise 1: Good or Bad?

Exercise 1: Answers

Part 3: Text Augmentation

Text vs Image: Different Challenges

Text Augmentation Examples

Easy Data Augmentation (EDA)

Back-Translation

LLM Paraphrasing

Text Augmentation Pitfalls

Exercise 2: Sentiment Preservation

Exercise 2: Answers

Part 4: Audio Augmentation

Audio Augmentation Overview

Audio Representations: Waveform vs Spectrogram

Listen & See: Audio Augmentation

What is SpecAugment?

Why SpecAugment Works

Audio Augmentation with audiomentations

Audio Augmentation Safety Rules

Part 5: Practical Guidelines

The Golden Rule

Start Simple, Measure Impact

Hyperparameters to Tune

RandAugment: Automatic Selection

Test-Time Augmentation (TTA)

TTA: Code Example

Don't Augment Validation During Training!

When to Use Each Augmentation

Part 6: Tools & Libraries

Libraries by Modality

Demo Notebooks

Interactive Demo

Quick Start: Image Classification

Quick Start: Text & Audio

Resources

Final Exercise: Design Your Pipeline

Key Takeaways

Questions?