改进的 Gemini 音频模型可实现强大的语音交互 分享 x。
com Facebook LinkedIn LinkedIn 邮件 复制链接 Bibo Xu 产品管理总监 Tara Sainath 杰出研究科学家 阅读 AI 生成的摘要 一般摘要 Google 增强了 Gemini 2。
5 Flash Native Audio,以提供更好的实时语音代理。
期待更清晰的函数调用、强大的指令遵循和更流畅的对话。
尝试在 Google 翻译应用测试版中尝试实时语音翻译,该应用现已在美国、墨西哥和印度的 Android 上推出。
5 Flash Native Audio 现在具有更清晰的函数调用和更好的指令遵循。
来源:DeepMind









