改进的 Gemini 音频模型可提供强大的语音体验

改进的 Gemini 音频模型可实现强大的语音交互..

观澜Media 的头像

作者

1 分

阅读时间

改进的 Gemini 音频模型可实现强大的语音交互 分享 x。

com Facebook LinkedIn LinkedIn 邮件 复制链接 Bibo Xu 产品管理总监 Tara Sainath 杰出研究科学家 阅读 AI 生成的摘要 一般摘要 Google 增强了 Gemini 2。

5 Flash Native Audio,以提供更好的实时语音代理。

期待更清晰的函数调用、强大的指令遵循和更流畅的对话。

尝试在 Google 翻译应用测试版中尝试实时语音翻译,该应用现已在美国、墨西哥和印度的 Android 上推出。

5 Flash Native Audio 现在具有更清晰的函数调用和更好的指令遵循。

来源:DeepMind

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

搜索归档

Access over the years of investigative journalism and breaking reports