观澜Media

AI技术 · 深度资讯 · 前沿观察

万字拆解 LLM 运行机制：Token、上下文与采样参数 – JavaGuide

【摘要】在探讨 RAG、Agent 工作流、MCP..

作者

1 分

阅读时间

【摘要】在探讨 RAG、Agent 工作流、MCP 协议等复杂架构的过程中，我发现一个非常普遍的现象：很多开发者在构建 Agent 工作流或调优 RAG 检索时，往往会在最底层的 LLM 参数上踩坑。

比如，为什么明明设置了温度为 0，结构化输出还是偶尔崩溃。

为什么往模型里塞了长文档后，它好像失忆了，忽略了阅读全文。

来源：博客园

关于作者

See author's post

上一篇

下一篇

发表回复取消回复

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

最新资讯

关注我们

分类

标签

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

技术

使用隐形代码的供应链攻击攻击 GitHub 和其他存储库

观澜Media

2026-03-30
国际

云服务提供商要求欧盟监管机构恢复 VMware 合作伙伴计划

观澜Media

2026-03-30
技术

广泛使用的 Trivy 扫描仪在持续的供应链攻击中受到损害

观澜Media

2026-03-30
互联网

自我传播的恶意软件毒害开源软件并擦除位于伊朗的机器

观澜Media

2026-03-30
互联网

谷歌将 Q Day 截止日期推迟至 2029 年，比之前想象的要早得多

观澜Media

2026-03-30
科技

Minisforum AI X1 Pro 470 评测：时尚迷你 PC 台式机中的 AMD Gorgon Point

观澜Media

2026-03-30