我只是想向从事旗舰机型的前沿建设者和开发者询问几个问题。
当较小的、专门的模型就足够了时,继续制作巨大的语言模型是否仍然具有成本效益且值得。
这意味着,当用户在具有特定框架的代码库中工作时,代理/模型是否还应该知道元素的完整化学成分、世界历史和其他随机事实。
或者它应该只知道相关的和需要的东西。
例如,在 MERN 堆栈中工作的代理实际上应该只知道:- 语言文档。
在工程中,通常的步骤不是:- 需要什么。
来源:HackerNews New
我只是想向从事旗舰机型的前沿建设者和开发者询问几个问题。
当较小的、专门的模型就足够了时,继续制作巨大的语言模型是否仍然具有成本效益且值得。
这意味着,当用户在具有特定框架的代码库中工作时,代理/模型是否还应该知道元素的完整化学成分、世界历史和其他随机事实。
或者它应该只知道相关的和需要的东西。
例如,在 MERN 堆栈中工作的代理实际上应该只知道:- 语言文档。
在工程中,通常的步骤不是:- 需要什么。
来源:HackerNews New
上一篇
下一篇
AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。