观澜Media

AI技术 · 深度资讯 · 前沿观察

改进的 Gemini 音频模型可提供强大的语音体验

改进的 Gemini 音频模型可实现强大的语音交互..

改进的 Gemini 音频模型可实现强大的语音交互 分享 x。

com Facebook LinkedIn LinkedIn 邮件 复制链接 Bibo Xu 产品管理总监 Tara Sainath 杰出研究科学家 阅读 AI 生成的摘要 一般摘要 Google 增强了 Gemini 2。

5 Flash Native Audio,以提供更好的实时语音代理。

期待更清晰的函数调用、强大的指令遵循和更流畅的对话。

尝试在 Google 翻译应用测试版中尝试实时语音翻译,该应用现已在美国、墨西哥和印度的 Android 上推出。

5 Flash Native Audio 现在具有更清晰的函数调用和更好的指令遵循。

来源:DeepMind

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

搜索归档

Access over the years of investigative journalism and breaking reports