wan2.2-14b 如何用多卡推理？

2张H20，单卡可以跑推理，但用`accelerate launch --multi_gpu --num_processes 2 examples/wanvideo/model_inference/Wan2.2-I2V-A14B.py` 跑推理会oom，且`nvidia-smi`第二张卡一直没看到占用，这个是正确的启动单卡推理的方式吗？