EmbedLM

Optimized inference engine for running quantized GPTNeo models directly on ESP32 microcontrollers. It features INT8 quantization and memory-mapped flash execution to enable LLMs on embedded hardware.

Quick Start

# Create venv
python -m venv .venv

# Activate venv
source .venv/bin/activate

# Install dependencies
pip install -r requirements.txt

# Prepare and quantize the model
python pack.py

# Flash the firmware
pio run -t upload

# Upload binary using crappy way
python ~/.platformio/packages/tool-esptoolpy/esptool.py --chip esp32s3 --port /dev/ttyACM1 --baud 115200 write_flash 0x400000 emlm.bin

# Monitor output
pio device monitor

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.vscode		.vscode
src		src
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
LICENSE.md		LICENSE.md
README.md		README.md
merges.txt		merges.txt
pack.py		pack.py
partitions.csv		partitions.csv
platformio.ini		platformio.ini
qa_finetune.ipynb		qa_finetune.ipynb
requirements.txt		requirements.txt
sdkconfig.rymcu-esp32-s3-devkitc-1		sdkconfig.rymcu-esp32-s3-devkitc-1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EmbedLM

Quick Start

About

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

EmbedLM

Quick Start

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages