vision-foundation-mae

Production-minded, config-driven Vision Transformer + Masked Autoencoder pipeline for self-supervised pretraining and downstream transfer.

Features

MAE pretraining on open datasets (CIFAR-10 default; STL-10 optional)
Linear probe and full finetuning on CIFAR-10
Encoder export and folder inference CLI
Hydra config system with CLI overrides
JSONL + TensorBoard logging, optional W&B
Reproducibility manifest (resolved config, env, git hash)
Pytest coverage for key invariants

Quickstart

pip install -e .
python scripts/train_mae.py
python scripts/eval_linear_probe.py pretrained_ckpt=outputs/latest/checkpoints/last.pt
python scripts/train_finetune.py pretrained_ckpt=outputs/latest/checkpoints/last.pt
python scripts/export_encoder.py pretrained_ckpt=outputs/latest/checkpoints/last.pt
python scripts/infer.py classifier_ckpt=outputs/latest/checkpoints/best.pt image_dir=./some_images

Structure

See configs/, src/minimae_vit/, scripts/, and tests/.

Notes

Default image size is 64x64 (CIFAR-10 upsampled from 32x32).
MAE reconstruction visualization uses pixel-space unnormalization from stored per-patch statistics.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
configs		configs
notebooks		notebooks
scripts		scripts
src/minimae_vit		src/minimae_vit
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

vision-foundation-mae

Features

Quickstart

Structure

Notes

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

vision-foundation-mae

Features

Quickstart

Structure

Notes

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages