改进的 Gemini 音频模型可提供强大的语音体验

改进的 Gemini 音频模型可实现强大的语音交互..

作者

观澜Media

2026-04-01

1 分

阅读时间

改进的 Gemini 音频模型可实现强大的语音交互分享 x。

com Facebook LinkedIn LinkedIn 邮件复制链接 Bibo Xu 产品管理总监 Tara Sainath 杰出研究科学家阅读 AI 生成的摘要一般摘要 Google 增强了 Gemini 2。

5 Flash Native Audio，以提供更好的实时语音代理。

期待更清晰的函数调用、强大的指令遵循和更流畅的对话。

尝试在 Google 翻译应用测试版中尝试实时语音翻译，该应用现已在美国、墨西哥和印度的 Android 上推出。

5 Flash Native Audio 现在具有更清晰的函数调用和更好的指令遵循。

来源：DeepMind

关于作者

观澜Media

See author's post

2026-04-08

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

关注我们

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

查看全部

技术

IEEE 与学术界合作创建微证书项目

观澜Media

2026-04-02
AI

人工智能旨在实现轮椅自主导航

观澜Media

2026-04-02
AI

为什么热计量学必须发展以适应下一代半导体

观澜Media

2026-04-02
AI

利用 NVIDIA RTX PRO 6000 Blackwell 工作站版改变数据科学

观澜Media

2026-04-02
技术

缅怀 IEEE 电力与能源协会领袖 Mel Olken

观澜Media

2026-04-02
国际

乌克兰即将到来的无人机战争转折

观澜Media

2026-04-02

观澜Media

改进的 Gemini 音频模型可提供强大的语音体验

关于作者

关于我们

观澜Media

最新资讯

建造世界上最大的数据中心需要什么？

数据中心正在从交流过渡到直流

是美国工程博士吗？项目失去学生？

IEEE 8021.1bn 如何为 Wi-Fi 8 提供超高可靠性

30 年前，机器人学会走路而不会摔倒

关注我们

分类

标签

搜索归档

你可能错过了

IEEE 与学术界合作创建微证书项目

人工智能旨在实现轮椅自主导航

为什么热计量学必须发展以适应下一代半导体

利用 NVIDIA RTX PRO 6000 Blackwell 工作站版改变数据科学

缅怀 IEEE 电力与能源协会领袖 Mel Olken

乌克兰即将到来的无人机战争转折

关于观澜Media

分类

快速链接