观澜Media

AI技术 · 深度资讯 · 前沿观察

参数计数是在 8GB VRAM 上选择模型的最差方法

参数计数是在 8GB VRAM 上选择模型的最差方..

作者

1 分

阅读时间

参数计数是在 8GB VRAM 上选择模型的最差方法。

我已经在 RTX 4060 8GB 上运行本地法学硕士六个月了。

5-9B/27B/35B-A3B、BGE-M3 — 全部通过 Q4_K_M 量化进行填充。

在线比较按尺寸对模型进行排名——“32B 具有这种品质”，“7B 具有这种品质”。

MMLU 和 HumanEval 等基准测试按参数计数发布排名。

本文涵盖了我根据实际测量得出的三个规则，以及 8GB VRAM 型号选择的决策框架。

来源：Dev.to

关于作者

See author's post

上一篇

下一篇

发表回复取消回复

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

最新资讯

科技

三星 Galaxy A27 手机跑分曝光：骁龙 6 Gen 3 芯片、6GB 内存

2026-04-02
体育

《NBA 2K26》游戏明起入库微软 XGP，覆盖 Ultimate、Premium、PC 档位

2026-04-02
科技

米哈游《星布谷地》「星旅测试」定档 4 月 21 日，测试招募开启

2026-04-02
互联网

拼多多登陆小米澎湃 OS 超级岛，支持实时查看包裹状态

2026-04-02
科技

谷歌 Pixel 11 Pro 手机被曝砍掉温度传感器，网友反馈太鸡肋

2026-04-02

关注我们

分类

标签

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

科技

曝骁龙 8 Elite Gen6 Pro（SM8975）芯片疑似共享 16MB L2，规格“很激进”

观澜Media

2026-04-02
科技

江淮汽车在上海成立尊界智行公司，注册资本 3000 万人民币

观澜Media

2026-04-02
互联网

五菱全新大六座 SUV 车型星光 L 官宣，4 月 10 日正式亮相

观澜Media

2026-04-02
互联网

小米开启 2026 年米粉节活动，云服务会员 5 折包年 36 元起（加赠 3 个月）

观澜Media

2026-04-02
AI

Lemokey 推出 39g 碳纤维“洞洞鼠”LM7 Air，搭载 54L15 主控

观澜Media

2026-04-02
互联网

五部门规范网络平台招聘信息发布，要求智联招聘、BOSS 直聘等进一步压实信息内容管理主体责任

观澜Media

2026-04-02