观澜Media

AI技术 · 深度资讯 · 前沿观察

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入

IT之家 3 月 30 日消息，阿里千问今晚发布全..

作者

1 分

阅读时间

IT之家 3 月 30 日消息，阿里千问今晚发布全模态大模型 Qwen3。

无缝理解文本、图片、音频及音视频输入，支持细粒度、带时间戳的音视频 Caption 生成。

215 项 SOTA 霸榜，在音频及音视频分析、推理、对话、翻译等任务超过 Gemini3。

自然涌现的 Audio-Visual Vibe Coding 能力。

支持语义打断、音色克隆及语音控制，让对话体验更自然。

5-Omni-Plus 能够遵循指令生成细粒度，结构化，带时间戳的准确 Caption：画面里是谁、说了什么话、背景音乐从哪一秒开始变化、镜头切了几次、每一帧发生了什么。

来源：IT之家

关于作者

See author's post

上一篇

下一篇

发表回复取消回复

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

最新资讯

科技

方向盘设计的看似棘手的艺术

2026-03-31
科技

您的照片可能会泄露您的位置。这是阻止这种情况的方法

2026-03-31
科技

经过测试和评测的 2026 年 9 款最佳 Android 手机

2026-03-31
国际

美国国税局希望进行更智能的审计。 Palantir 可以帮助确定谁会被标记

2026-03-31
国际

这就是特朗普已经威胁中期选举的方式

2026-03-31

关注我们

分类

标签

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

科技

最佳 360 度相机（2026 年）：DJI、Insta360、GoPro

观澜Media

2026-03-31
娱乐

三星 Frame Pro 评测：一款适合漂亮客厅的好电视

观澜Media

2026-03-31
科技

经过测试和评测的 2026 年最佳三星手机

观澜Media

2026-03-31
科技

最佳 Pixel 10 保护壳和配件（2026 年）：我们测试了数十款

观澜Media

2026-03-31
科技

目前最好的 Garmin 手表是什么？ (2026)

观澜Media

2026-03-31
薅羊毛

这 40 项亚马逊春季特卖技术优惠实际上很不错。我们检查了价格历史记录（2026）

观澜Media

2026-03-31