Flash Attention
-
RTX3070 成功跑 Qwen3.6-35B 多模态AI大模型!部署教程(优化脚本)
估计很多人不相信这是真的,一个非常大的误解,大多数人都会认为:35B 大模型 = 必须 24G 显存才能跑,但最近我实测发现,即使只有一张 RTX 3070 8G 显卡,只要搭配足…
估计很多人不相信这是真的,一个非常大的误解,大多数人都会认为:35B 大模型 = 必须 24G 显存才能跑,但最近我实测发现,即使只有一张 RTX 3070 8G 显卡,只要搭配足…