Ollama 现已由 Apple Silicon 上的 MLX 提供支持,预览版将于 2026 年 3 月 30 日推出 今天,我们将预览在 Apple Silicon 上运行 Ollama 的最快方式,该方式由 Apple 的机器学习框架 MLX 提供支持。
这释放了新的性能,可加速您在 macOS 上最苛刻的工作: OpenClaw 等个人助理 Claude Code、OpenCode 或 Codex 等编码代理 加速 Pi 或 Claude Code 等编码代理 OpenClaw 现在响应速度更快 Apple 芯片上最快的性能,由 MLX 提供支持 Apple 芯片上的 Ollama 现在构建在 Apple 机器学习框架 MLX 之上,以利用其统一内存架构。
这会导致 Ollama 在所有 Apple Silicon 设备上大幅加速。
在 Apple 的 M5、M5 Pro 和 M5 Max 芯片上,Ollama 利用新的 GPU 神经加速器来加速第一个令牌的时间 (TTFT) 和生成速度(每秒令牌)。
预填充性能 0 500 1000 1500 2000 个令牌/秒 1810 Ollama 0。
18 测试于 2026 年 3 月 29 日进行,使用阿里巴巴的 Qwen3。
来源:HackerNews Best

