我经常使用法学硕士来自动化不同的工作流程,其中一些包括浏览网页和收集数据。
在某些时候,我开始注意到一些让我困扰的事情:浏览器交互很笨拙,就好像代理正在努力“查看”和理解页面,结果,许多令牌被浪费了。
同样,我也开始深入挖掘,在某个时候,我只是在 Cursor 聊天中直率地问了以下问题:“我问你,作为使用这些无头浏览器的法学硕士,你希望人们构建什么来让你的工作更轻松。
”它起作用了,因为我扩展了“思考”部分,我看到:“用户正在问我一个非常有趣的元问题。
”之后,它只是列出了与所以我开始构建一个浏览器 API,它返回 LLM 实际需要的内容,而不是浏览器返回的内容。
适用于 Python、TypeScript、Ruby 的官方 SDK。
来源:HackerNews New











