我关注 Andrej Karpathy 已有近十年了。
首先是斯坦福大学的讲座,然后是 YouTube 系列。
一直喜欢阅读他的帖子和观看他的视频,既因为他是一个脚踏实地的人,也因为他具有无与伦比的能力,可以将复杂的系统分解为基本原理,并以点击的方式交付它们。
micrograd 表明反向传播——地球上每个神经网络的动力——是 94 行 Python 代码。
nanoGPT显示GPT-2训练是两个文件。
它周围的系统很大,因为它们解决了实际问题——身份验证、沙箱、多租户、地理分布、可观察性、速率限制——但这些问题与算法本身不同。
来源:Dev.to












