我两次注意到相同的故障模式:提取结果“错误”,但实际上没有任何损坏。
这种错误会让你不信任一切——你的缓存、你的提示,甚至你自己的记忆——因为系统看起来是不确定的,而实际上它只是未被观察到。
因此,我构建了一个跟踪器,将每次提取运行变成一个分类账:每个决策都成为一个节点,每次重试都成为一条边,每个“我们选择了变体 B”都成为我可以指出的事实。
关键见解:将提取视为可追踪的工作流程,而不是单个调用。
这一不明显的举措是停止将“电子邮件提取”视为一项操作。
当您有如此多的移动部件时,一种简单的方法(记录“开始”和“完成”以及一堆输出)会因以下三个原因而失败:。
来源:HackerNoon











