LLMinate – LLM 验证码系统 2026 年 4 月 1 日 用单词子串检测法学硕士:验证码的新颖方法 简单的语言洞察力如何帮助区分人类与 AI 洞察力 这里有一个观察结果:当被要求生成随机无意义单词时,人类和 AI 的行为完全不同。
人类混搭键盘: ksdjsdksdk 、 eokdfweinfhfejla 、 owiewewlkdfk 大型语言模型会生成听起来合理的废话: Vesperthrum 、 Nebulithic 、 Zorathium 为什么。
因为法学硕士接受过人类语言的培训。
即使在生成“随机”单词时,他们也会无意识地遵循他们所学到的模式,结合真实的语素,尊重英语语音策略,并创造出感觉上可能存在的单词。
算法 这种见解导致了一个简单的检测算法: 要求用户生成 3 个无意义的单词 对于每个单词,提取所有可能的子字符串 检查是否有任何子字符串出现在真实英语单词的字典中 如果多个单词包含真实单词子字符串 → 可能是 LLM 如果所有单词都不包含真实子字符串 → 可能是人类 概念证明代码可在此处获得 为什么这有效 人类优势 人类产生真正的随机性。
即使在尝试发挥创意时,他们也会: 结合真实的语素:Vesper(晚上)+ thrum(哼唱) 遵循从数十亿文本中学到的统计模式 创建具有真实字符转换的单词 这些不可避免地包含字典查找可以检测到的真实单词片段。
来源:HackerNews New











