Google DeepMind 发布Lyria 3 Pro:AI首次实现3分钟结构化全曲生成
- 分享
- 收藏
- 点赞
Lyria 3 Pro 是 Google(联合 Google DeepMind)在 2026年3月底 最新推出的高级 AI 音乐生成模型。它标志着 AI 音乐从实验性玩具向专业级创作工具的转变,可提供录音室级别的高保真音乐。
具体来说,Lyria 3 Pro 能做以下几件核心事情:
1. 生成长达 3 分钟的完整结构歌曲
在此前的模型(如 Lyria 3 Clip)主要生成 30 秒片段的基础上,Lyria 3 Pro 可以直接生成长达 3 分钟 的高质量音乐。显然,已经具备更为深刻的“音乐意识”,试图保持从第一个音符到最后一个音符的连贯性。
2. 精确控制歌曲的段落与结构
Lyria 3 Pro高度理解音乐的构图逻辑,用户可以通过提示词(Prompt)专门指定歌曲的特定部分,比如要求它生成前奏(intros)、主歌(verses)、副歌(choruses)和桥段(bridges),并能处理复杂的音乐过渡。
3. 提供精细化与多模态的控制选项
除了简单的文本到音乐(Text-to-Music),它还为创作者提供了更具颗粒度的控制能力:
歌词时间对齐(Time-aligned lyrics): 用户可以规划整首歌曲的走向,并精确控制歌词在音轨中开始和结束的时间;
节拍控制(Tempo conditioning): 可以极高精度地设定特定节拍或节奏(例如快或慢),确保音乐完全契合你的视频或应用场景;
图片生成音乐(多模态输入): 除了文本,Lyria 3 Pro 还支持通过输入图片来影响和启发音乐风格的生成。
4. 逼真的人声与多语言、多曲风支持
模型支持生成带有情感表现力与清晰度的逼真人声。它不仅涵盖流行(Pop)、放克(Funk)、摩城(Motown)等多种音乐流派,还支持包括英语、日语、韩语、印地语、西班牙语、葡萄牙语、德语和法语在内的全球多种语言。
5. 深度融入专业和日常工作流
Lyria 3 Pro 已经被集成到了多种 Google 及第三方生态中:
Gemini App:高级订阅用户(AI Plus/Pro/Ultra)可直接在 Gemini 中通过对话生成歌曲(支持每日一定额度);
Google Vids:允许 Workspace 用户为营销视频、演示文稿或播客快速生成定制化背景音;
开发者与企业端:可通过 Google AI Studio 和 Vertex AI 向开发者和企业开放,适用于需要大规模生成高质量音频的场景(如游戏动态配乐或自建 App);
ProducerAI:面向专业歌手、制作人和词曲作家的专业协作音乐创作工具。
***最重要的是,出于版权保护和透明度考虑,Lyria 3 Pro 不会直接模仿现有真实歌手的声音,并且其生成的所有音频都会自动嵌入 Google 的 SynthID 水印,以便于被识别为 AI 生成内容。
总结
- 谷歌DeepMind于2026年3月25日正式发布Lyria 3 Pro音乐生成模型。Google将该模型称为“最先进的音乐声成模型,进入3分钟时长完整音乐时代”,具备前奏、主歌、副歌、桥段等结构化编排能力。突破以往AI仅能输出30秒片段的局限的同时,音质达24-bit高保真标准,支持多模态文本提示(如风格、情绪、节奏),并采用SynthID数字水印技术。在版权保护方面,Lyria 3 pro不直接模仿特定艺术家,仅将艺人名称作为灵感参考。
- ——AI音乐创作从碎片化生成迈向专业化全曲生产,当AI开始理解副歌的张力与桥段的呼吸,人类音乐人的不可替代性,正从‘写得出’升维至‘为何而写’。
- 分享
- 收藏
- 点赞
下一篇
OpenAI 生日献出GPT-5.2:为专业知识而生。

