观澜Media

AI技术 · 深度资讯 · 前沿观察

让 HNSW 在 DuckDB 上使用 JOIN 和 WHERE 子句

让 HNSW 实际上与 WHERE 子句一起使用 ..

让 HNSW 实际上与 WHERE 子句一起使用 DuckDB 中的透明过滤矢量搜索,或者:为什么后过滤被破坏以及如何处理。

tl;dr :DuckDB 的内置向量搜索扩展在索引返回结果后应用 WHERE 子句,这意味着过滤查询会默默地返回比请求的结果少的结果(通常为零)。

hnsw_acorn 通过使用 ACORN-1 将谓词推入图遍历来修复此问题,添加 RaBitQ 量化以减少 21-30 倍内存,并通过优化器重写处理元数据连接和分组 top-K。

从社区安装 hnsw_acorn。

问题 DuckDB 附带了一个名为 duckdb-vss 的矢量搜索扩展。

如果全球前 10 名中没有一个是韩国人,则您将获得 0 行。

来源:HackerNews New

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

搜索归档

Access over the years of investigative journalism and breaking reports