LatinitasCards

A CLI toolkit for building Latin Anki flashcards. Inspect and restructure Anki exports, annotate grammar with CLTK, and generate corpus-based cloze-deletion cards from USFX, plain-text, or parallel CSV corpora — designed for learners studying Latin through spaced repetition.

Features

Inspect Anki deck structure, field names, and sample notes
Split multi-form cards into one-row-per-form records
Annotate grammar (lemma, POS, morphology) via CLTK with optional LLM disambiguation
Generate cloze cards from Latin corpora (USFX XML, plain text, CSV)
Parallel corpus support — include EN/DE translations alongside Latin clozes
Difficulty filtering — control cloze complexity (easy / medium / hard)
APKG rewrite — update Anki packages in place while preserving originals

Installation

Prerequisites: Python 3.10–3.12 and Poetry.

git clone https://github.com/fmueller/latinitas-cards.git
cd latinitas-cards
poetry install

Verify the installation:

poetry run latinitas-cards --help

Quick Start

# 1. Inspect your Anki deck
poetry run latinitas-cards inspect --input data/latin_university.apkg --head 5

# 2. Split multi-form entries into individual rows
poetry run latinitas-cards split \
  --input data/latin_university.apkg \
  --output split.csv \
  --source-field Konstruktion_Hinweise \
  --split-mode auto

# 3. Annotate grammar and generate cloze cards
poetry run latinitas-cards annotate --input split.csv --output annotated.csv --form-column form
poetry run latinitas-cards cloze \
  --input annotated.csv \
  --output cloze.csv \
  --corpus data/lat-clementine.usfx.xml \
  --corpus-format auto \
  --difficulty medium

CLI Reference

Command	Description
`inspect`	Inspect deck schema and show a head-like sample preview
`split`	Split multi-form cards into one-row-per-form records
`annotate`	Annotate CSV forms with CLTK lemma/POS/morphology metadata
`cloze`	Generate corpus-based cloze cards for each form in a CSV input
`validate`	Validate USFX parsing integrity and required input columns
`preview`	Show a sample of generated clozes without writing output
`generate`	Update an Anki CSV or APKG file with cloze examples from a Latin USFX corpus

inspect

poetry run latinitas-cards inspect --input data/latin_university.apkg --head 5

split

poetry run latinitas-cards split \
  --input input.apkg \
  --output split.csv \
  --source-field Konstruktion_Hinweise \
  --split-mode auto

Optional APKG rewrite (keeps originals and adds split cards):

poetry run latinitas-cards split \
  --input input.apkg \
  --output output.apkg \
  --source-field Konstruktion_Hinweise \
  --split-mode auto \
  --output-format apkg

annotate

poetry run latinitas-cards annotate \
  --input split.csv \
  --output annotated.csv \
  --form-column form

With optional Ollama LLM disambiguation:

poetry run latinitas-cards annotate \
  --input split.csv \
  --output annotated_llm.csv \
  --form-column form \
  --use-llm \
  --llm-provider ollama \
  --llm-model ministral-3:8b \
  --llm-endpoint http://localhost:11434

cloze

poetry run latinitas-cards cloze \
  --input annotated.csv \
  --output cloze.csv \
  --corpus data/lat-clementine.usfx.xml \
  --corpus-format auto \
  --difficulty medium

With a parallel corpus (including EN/DE translations):

poetry run latinitas-cards cloze \
  --input annotated.csv \
  --output cloze_parallel.csv \
  --corpus opus_subset.csv \
  --corpus-format csv \
  --latin-column la \
  --translation-lang en \
  --translation-lang de \
  --parallel-mode include

When parallel columns are detected and behavior is unspecified:

Interactive terminal: latinitas-cards prompts you
Non-interactive execution: translations are ignored with a warning

validate

poetry run latinitas-cards validate \
  --input data/latin_university.apkg \
  --usfx data/lat-clementine.usfx.xml

preview

poetry run latinitas-cards preview \
  --input data/latin_university.apkg \
  --usfx data/lat-clementine.usfx.xml

generate

poetry run latinitas-cards generate \
  --input data/latin_university.apkg \
  --output updated.csv \
  --usfx data/lat-clementine.usfx.xml

Corpora

The bundled corpus data/lat-clementine.usfx.xml is a Latin Vulgate (Clementine) Bible in USFX format.

Good public sources for additional Latin corpora (including EN/DE parallel data):

OPUS (recommended starting point)
- bible-uedin (strong verse-aligned biblical corpus)
- Tatoeba (sentence-level data)
- WikiMatrix / CCMatrix (broader but noisier)
For direct corpus pair discovery via API:
- https://opus.nlpl.eu/opusapi/?corpora=True&source=la&target=en
- https://opus.nlpl.eu/opusapi/?corpora=True&source=la&target=de

Contributing

See AGENTS.md for coding style, project structure, and commit conventions.

Before submitting changes, run the validation chain:

poetry run ruff check
poetry run mypy
poetry run pytest -v

License

GPL-3.0-or-later

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
.github		.github
data		data
docs		docs
src/latinitas_cards		src/latinitas_cards
tests		tests
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.python-version		.python-version
AGENTS.md		AGENTS.md
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
README.md		README.md
THIRD_PARTY_NOTICES.md		THIRD_PARTY_NOTICES.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LatinitasCards

Features

Installation

Quick Start

CLI Reference

inspect

split

annotate

cloze

validate

preview

generate

Corpora

Contributing

License

About

Uh oh!

Releases

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LatinitasCards

Features

Installation

Quick Start

CLI Reference

inspect

split

annotate

cloze

validate

preview

generate

Corpora

Contributing

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Uh oh!

Contributors

Uh oh!

Languages