Cohere 宣布推出 Transcribe,这是一种最先进的自动语音识别 (ASR) 模型,该模型是开源的,现已可供下载。
语音正在迅速成为人工智能支持的工作负载和自动化的核心模式——从会议转录和语音分析到实时客户支持代理。
我们的目标很简单:在实际条件下推动专用 ASR 模型准确性的前沿。
该模型从头开始训练,重点关注最小化单词错误率 (WER),同时将生产准备就绪放在首位。
换句话说,它不仅仅是一个研究制品,而且是一个为日常使用而设计的系统。
Cohere Transcribe 目前在 HuggingFace 的开放 ASR 排行榜上排名第一,为现实世界的转录性能树立了新的基准。
来源:HackerNews

