Mac 跑大模型提速：本地 AI 工具 Ollama 接入苹果 MLX 框架

IT之家 4 月 1 日消息，科技媒体 Ars T..

作者

观澜Media

2026-04-01

无评论

2 分

阅读时间

IT之家 4 月 1 日消息，科技媒体 Ars Technica 昨日（3 月 31 日）发布博文，报道称本地 AI 工具 Ollama 发布 0。

19 预览版，全面接入苹果 MLX 机器学习框架，提升苹果 Mac 运行本地大模型速度。

本次更新深度优化统一内存的使用效率，改进缓存性能，并新增支持 NVFP4 模型压缩格式，并针对部分模型专项优化，大幅降低其在 Mac 运行时的内存占用。

对于最新搭载 M5 芯片的 Mac 设备，Ollama 还可以直接调用神经网络加速器，进一步提升每秒生成词元（token）数与首词响应速度。

该功能目前仅在 Ollama 预览版中提供，模型方面，首批仅支持阿里巴巴开源的 350 亿参数 Qwen3。

IT之家注：MLX 是专为 Apple 芯片打造的开源阵列框架，能够高效地执行机器学习任务，并支持用户使用 Python 和 Swift 直接在设备上运行大型语言模型。

来源：IT之家

关于作者

观澜Media

See author's post

2026-04-01

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

关注我们

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

查看全部

科技

将（绝对）元素居中的另一种方法

观澜Media

2026-04-01
技术

弹出框 API 或对话框 API：选择哪一个？

观澜Media

2026-04-01
技术

在 CSS 中选择的不同方法

观澜Media

2026-04-01
技术

The Value of z-index

观澜Media

2026-04-01
AI

Tailwind 非常适合建筑布局的 4 个原因

观澜Media

2026-04-01
技术

JavaScript 适合所有人：解构

观澜Media

2026-04-01

观澜Media