make decoder and sorted_token_bytes re-use existing memory by tmm1 · Pull Request #352 · openai/tiktoken

tmm1 · 2024-10-17T00:45:40Z

uses unsafe + std::mem::transmute to re-use encoder keys as decoder values and in the sorted_token_bytes list

this should be safe because all these objects share a lifetime inside CoreBPE

results in memory savings, and performance improvements in some scenarios

make decoder and sorted_token_bytes re-use existing memory

a51d40e

CodeBeaverAI mentioned this pull request Feb 19, 2025

Make decoder and sorted_token_bytes re-use existing memory - Unit Tests #384

Open

Provide feedback