改进的 Gemini 音频模型可提供强大的语音体验

改进的 Gemini 音频模型可实现强大的语音交互 分享 x。

com Facebook LinkedIn LinkedIn 邮件 复制链接 Bibo Xu 产品管理总监 Tara Sainath 杰出研究科学家 阅读 AI 生成的摘要 一般摘要 Google 增强了 Gemini 2。

5 Flash Native Audio,以提供更好的实时语音代理。

期待更清晰的函数调用、强大的指令遵循和更流畅的对话。

尝试在 Google 翻译应用测试版中尝试实时语音翻译,该应用现已在美国、墨西哥和印度的 Android 上推出。

5 Flash Native Audio 现在具有更清晰的函数调用和更好的指令遵循。

来源:DeepMind