我曾经在会议中使用格兰诺拉麦片,但它不能做的一件事就是告诉我谁说了什么。
因此,我构建了 Migas,它可以在设备上进行语音指纹识别,以提供实时说话者标签。
因为它知道谁在实时讲话,所以人工智能可以完成仅转录工具无法完成的事情:“Sarah 承诺了什么。
”,或者“根据您在我们最近的三次会议中对 CTO 的了解,我现在应该问什么问题。
”它在会议中构建发言者档案,因此上下文会随着时间的推移而复合。
本机应用程序使用 Rust/Tauri,UI 使用 React,ML 管道使用 Python sidecar。
来源:HackerNews New











