时间切片水库采样:Itamar Turner-Trauring 用于分析器的新(。
)算法 最后更新于 2026 年 4 月 1 日,最初创建于 2026 年 4 月 1 日 假设您正在处理长度未知的事件流。
因此,将整个流存储在内存中甚至磁盘上是不可接受的,但您仍然需要提取相关信息。
根据您需要的信息,选择流的随机样本将为您提供几乎与存储所有数据一样好的信息。
例如,考虑一个性能分析器,用于查找运行代码的哪些部分最慢。
缓慢的代码将导致重复相同的调用堆栈。
来源:HackerNews New
时间切片水库采样:Itamar Turner-Trauring 用于分析器的新(。
)算法 最后更新于 2026 年 4 月 1 日,最初创建于 2026 年 4 月 1 日 假设您正在处理长度未知的事件流。
因此,将整个流存储在内存中甚至磁盘上是不可接受的,但您仍然需要提取相关信息。
根据您需要的信息,选择流的随机样本将为您提供几乎与存储所有数据一样好的信息。
例如,考虑一个性能分析器,用于查找运行代码的哪些部分最慢。
缓慢的代码将导致重复相同的调用堆栈。
来源:HackerNews New
上一篇
下一篇
AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。
Access over the years of investigative journalism and breaking reports