ShadowPower 不好意思直接发出去了…我在官网下单的配置是 翻新 Mac Studio Apple M1 Ultra 芯片 (配备 20 核中央处理器和 48 核图形处理器) 64GB 统一内存,我在 Sakura 的 GitHub 上看到有多种不同的量化模型,我应该使用什么模型能在我的这台机器上获得最快的速度呢? 我询问了 ChatGPT ,他告诉我直接使用 fp16 的速度可以最快,但是这个模型应该是最大的那个,为什么反而最快呢?还是说 ChatGPT 回答错了呢?希望能得到您的指导,非常感谢