Qwen image with magcache by quic-amitraj · Pull Request #998 · quic/efficient-transformers

quic-amitraj · 2026-05-20T04:29:50Z

Summary

This PR adds runtime MagCache support for Qwen-Image in QEfficient and demonstrates a strong latency reduction on AI100 while preserving visual quality.

Why This Matters

Qwen-Image denoising is transformer-heavy. By reducing expensive transformer executions in later denoise phases, this PR delivers a meaningful inference-time win with minimal image drift.

Benchmark:

Without MagCache:

With MagCache:

magcache_thresh=0.06
magcache_K=2
magcache_retention_ratio=0.2

Common setup for both runs:

Config: examples/diffusers/qwen_image/qwen_config.json
Resolution: 1664 x 928
Steps: 50
true_cfg_scale=4.0
max_sequence_length=128
seed=42

Metric	Without MagCache	With MagCache	Improvement
Transformer total time	236.9427 s	174.9652 s	1.35x faster
VAE decode time	0.3301 s	0.3342 s	~same
End-to-end time	237.2729 s	175.2993 s	1.35x faster
Transformer executed steps	50	37	1.35x fewer executed calls

Observed differences are minor generation-level variations, while the large latency reduction is retained.

Compile Configuration Used:

aic_num_cores=16
mdp_ts_num_devices=4
mos=1, mdts_mos=1
convert_to_fp16=true

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

- Refactor to inline with Diffusers design - Adding npi, scale factor changes Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Support for Wan Image to video model Model card: "Wan-AI/Wan2.2-I2V-A14B-Diffusers" --------- Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

- Refactor to inline with Diffusers design - Adding npi, scale factor changes Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

- Updated text encoder to return padded, fixed shaped embeddings - Refactored modeling changes, onnx params, qwen pipeline - Added pytest with dummy config Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

- Clean and refactor most of the Qwen image files Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Signed-off-by: Amit Raj <amitraj@qti.qualcomm.com>

qcdipankar and others added 24 commits April 21, 2026 05:14

Onboarding Qwen Image

3f9968d

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Cleaning Done 1

c306c3d

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Comments added

03d6973

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Fixing QwenProcessor issue in diffuser pipeline

393751f

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Minor Fixes

b97788a

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Repointer Issue fixed

7ead3f7

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Ruff check fixed

e502f7b

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

DCO fix

a2a072e

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Cleaning Done

6f2f7eb

Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

[WIP] Updating Qwen image with scaling changes

4b747e8

- Refactor to inline with Diffusers design - Adding npi, scale factor changes Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Enabling Vae on Qaic, DIT rope out

32559ef

Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Wan I2V support (quic#788)

37e25ed

Support for Wan Image to video model Model card: "Wan-AI/Wan2.2-I2V-A14B-Diffusers" --------- Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Onboarding Qwen Image

e0eca20

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

Fixing QwenProcessor issue in diffuser pipeline

f961134

Signed-off-by: Dipankar Sarkar <quic_dipankar@quicinc.com> Signed-off-by: Dipankar Sarkar <dipankar@qti.qualcomm.com>

[WIP] Updating Qwen image with scaling changes

119a352

- Refactor to inline with Diffusers design - Adding npi, scale factor changes Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Enabling Vae on Qaic, DIT rope out

b68de4e

Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Updated Qwen Image, resolved issue wrt static shapes

b2c7315

- Updated text encoder to return padded, fixed shaped embeddings - Refactored modeling changes, onnx params, qwen pipeline - Added pytest with dummy config Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Merge branch 'quic:main' into qwen_image_pipeline

4c04368

Refactored Qwen images scripts

164ce79

- Clean and refactor most of the Qwen image files Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Added Readme for Qwen Image

751455e

Signed-off-by: vtirumal <vtirumal@qti.qualcomm.com>

Merge branch 'main' into qwen_image_pipeline

bb2af6b

Merge branch 'main' into qwen_image_pipeline

ae409f0

added suport of magcache for qwen_image

f6777c9

Signed-off-by: Amit Raj <amitraj@qti.qualcomm.com>

Updated example script and pipeline

25b15e0

Signed-off-by: Amit Raj <amitraj@qti.qualcomm.com>

quic-amitraj self-assigned this May 20, 2026

quic-amitraj added Diffusers Use for PR related to diffusers in efficient-transformers. performance labels May 20, 2026

quic-amitraj requested a review from vbaddi May 20, 2026 18:08

quic-amitraj marked this pull request as ready for review May 20, 2026 18:08

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Qwen image with magcache#998

Qwen image with magcache#998
quic-amitraj wants to merge 24 commits into
quic:mainfrom
quic-amitraj:qwen_image_with_magcache

quic-amitraj commented May 20, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

quic-amitraj commented May 20, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Summary

Why This Matters

Benchmark:

Compile Configuration Used:

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

quic-amitraj commented May 20, 2026 •

edited

Loading