这里推荐一个本地微调大模型的框架。
ZO2,一个仅用18G显存就能全参微调175B大模型的框架(当然也支持微调小一些的模型)。
更新:现在ZO2支持Qwen3啦,全参微调32B的版本只需要6GB显存。
Code: ***s://github***/liangyuwang/zo2 Paper: ***s://arxiv.org/abs/2503.12668。
代码:
为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
怎么向老婆简单解释nas的用途?
为什么中国很少有人使用linux?
大家有没有「大众认为是烂片但个人却喜欢看」的影片?
怎么才能有尤雨溪一半强,该怎么学习?
用紫砂壶泡茶真的比别的茶具泡出来的茶更有味道吗?
两个问题:女足工资为什么比男足低?如果中国女足和中国男足打一场谁会赢?
golang和rust你选择哪个?
为什么小公司留不住人?
2025年,为什么很多程序员都扔掉了Mac和Linux,开始拥抱Win11了?
为什么似乎更多人都在默默支持吴柳芳?管晨辰是否做错了?
小米 AI 眼镜发布,售价 1999 元起,有哪些功能亮点?你看好其市场前景吗?
我国有能力发现B2并摧毁吗?
怎么评价fastjson2?
为什么日本人越来越土了?
用go做写后台接口的公司多吗?
为什么泰州发展不起来?
程序员看剧的时候,如果看到有敲代码页面,会暂停看代码吗?
***拍大尺度片子时摄影师不会看光吗?
目前react的生态系统是什么情况,有没有比较公认的成熟的开发技术栈?
为什么美军B2实战以后4v认为一部分网友又没信心了?
消息称苹果 macOS 26 将不再支持部分旧款英特尔 CPU 机型,这背后原因有哪些?
你卡过最厉害的bug是什么?
Rust开发Web后端效率如何?
网红都那么美,为什么当不了明星?
字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平?