Google DeepMind 发布Lyria 3 Pro：AI首次实现3分钟结构化全曲生成

XNEWTHINGS

2026年03月26日 15:13

Lyria 3 Pro 是 Google（联合 Google DeepMind）在 2026年3月底最新推出的高级 AI 音乐生成模型。它标志着 AI 音乐从实验性玩具向专业级创作工具的转变，可提供录音室级别的高保真音乐。

具体来说，Lyria 3 Pro 能做以下几件核心事情：

1. 生成长达 3 分钟的完整结构歌曲

在此前的模型（如 Lyria 3 Clip）主要生成 30 秒片段的基础上，Lyria 3 Pro 可以直接生成长达 3 分钟的高质量音乐。显然，已经具备更为深刻的“音乐意识”，试图保持从第一个音符到最后一个音符的连贯性。

2. 精确控制歌曲的段落与结构

Lyria 3 Pro高度理解音乐的构图逻辑，用户可以通过提示词（Prompt）专门指定歌曲的特定部分，比如要求它生成前奏（intros）、主歌（verses）、副歌（choruses）和桥段（bridges），并能处理复杂的音乐过渡。

除了简单的文本到音乐（Text-to-Music），它还为创作者提供了更具颗粒度的控制能力：

歌词时间对齐（Time-aligned lyrics）：用户可以规划整首歌曲的走向，并精确控制歌词在音轨中开始和结束的时间；

节拍控制（Tempo conditioning）：可以极高精度地设定特定节拍或节奏（例如快或慢），确保音乐完全契合你的视频或应用场景；

图片生成音乐（多模态输入）：除了文本，Lyria 3 Pro 还支持通过输入图片来影响和启发音乐风格的生成。

模型支持生成带有情感表现力与清晰度的逼真人声。它不仅涵盖流行（Pop）、放克（Funk）、摩城（Motown）等多种音乐流派，还支持包括英语、日语、韩语、印地语、西班牙语、葡萄牙语、德语和法语在内的全球多种语言。

Lyria 3 Pro 已经被集成到了多种 Google 及第三方生态中：

Gemini App：高级订阅用户（AI Plus/Pro/Ultra）可直接在 Gemini 中通过对话生成歌曲（支持每日一定额度）；

Google Vids：允许 Workspace 用户为营销视频、演示文稿或播客快速生成定制化背景音；

开发者与企业端：可通过 Google AI Studio 和 Vertex AI 向开发者和企业开放，适用于需要大规模生成高质量音频的场景（如游戏动态配乐或自建 App）;

ProducerAI：面向专业歌手、制作人和词曲作家的专业协作音乐创作工具。

***最重要的是，出于版权保护和透明度考虑，Lyria 3 Pro 不会直接模仿现有真实歌手的声音，并且其生成的所有音频都会自动嵌入 Google 的 SynthID 水印，以便于被识别为 AI 生成内容。

总结

谷歌DeepMind于2026年3月25日正式发布Lyria 3 Pro音乐生成模型。Google将该模型称为“最先进的音乐声成模型，进入3分钟时长完整音乐时代”，具备前奏、主歌、副歌、桥段等结构化编排能力。突破以往AI仅能输出30秒片段的局限的同时，音质达24-bit高保真标准，支持多模态文本提示（如风格、情绪、节奏），并采用SynthID数字水印技术。在版权保护方面，Lyria 3 pro不直接模仿特定艺术家，仅将艺人名称作为灵感参考。
——AI音乐创作从碎片化生成迈向专业化全曲生产，当AI开始理解副歌的张力与桥段的呼吸，人类音乐人的不可替代性，正从‘写得出’升维至‘为何而写’。

OpenAI 生日献出GPT-5.2：为专业知识而生。