使用fastchat框架推理,模型回答完问题之后,还会继续输出与问题无关的文字或者续写直到max length
使用fastchat框架推理,模型回答完问题之后,还会继续输出与问题无关的文字或者续写直到max length