Skip to main content

歌曲创作与AI音乐

歌曲写作技巧与 Suno AI 音乐提示词。

技能元数据

来源内置(默认安装)
路径skills/creative/songwriting-and-ai-music
平台linux, macos, windows

参考:完整 SKILL.md

info

以下是在此技能被触发时 Hermes 加载的完整技能定义。当技能激活时,这是 Agent 看到的指令。

歌曲创作与AI音乐生成

这里的一切都是指南,不是规则。艺术本来就会刻意打破规则。 用对歌曲有用的部分,忽略没用的部分。


1. 歌曲结构(选一个或自己发明)

常见的骨架——可根据需要混合、修改或丢弃:

ABABCB  主歌/副歌/主歌/副歌/桥段/副歌    (大多数流行/摇滚)
AABA 主歌/主歌/桥段/主歌(带副歌形式) (爵士标准曲、民谣)
ABAB 主歌/副歌交替 (简单直接)
AAA 主歌/主歌/主歌(无副歌的叙事形式)(民谣、讲故事)

六个组成部分:

  • 前奏 — 营造氛围,吸引听众
  • 主歌 — 故事、细节、世界构建
  • 预副歌 — 在爆发前可选地增加张力
  • 副歌 — 情感核心,人们记住的部分
  • 桥段 — 一次转场,视角或调式的转换
  • 尾奏 — 告别,可以呼应或颠覆前面的部分

你不需要全部都有。有些好歌曲就只有一个段落,不断演变。 结构服务于情感,而不是反过来。


2. 韵脚、节奏和音色

韵脚类型(从严谨到宽松):

  • 完美韵:lean/mean
  • 家族韵:crate/braid
  • 元音协韵:had/glass(相同元音,不同结尾)
  • 辅音协韵:scene/when(不同元音,相似结尾)
  • 近似韵/半韵:足以暗示联系,但不锁死

混合使用。全是完美韵听起来会像儿歌。 全是半韵听起来会显得懒惰。混合才是精髓。

内韵:在一行内押韵,而不只是在行尾。 "We pruned the lies from bleeding trees / Distilled the storm from entropy" — "lies/flies," "trees/entropy" 创造了内部呼应。

节奏:重读音节与非重读音节的节律。

  • 平行行之间的音节数匹配有助于演唱性
  • 重读音节比总音节数更重要
  • 大声读出来。如果卡住了,说明节奏需要调整。
  • 刻意打破节奏可以创造强调或惊喜效果

3. 情感弧线与动态变化

把歌曲想象成一段旅程,而不是笔直的路。

能量映射(大致想法,不是规定): 前奏: 2-3 | 主歌: 5-6 | 预副歌: 7 副歌: 8-9 | 桥段: 不等 | 终副歌: 9-10

最强大的动态技巧:对比

  • 尖叫前的细语比直接尖叫更有冲击力
  • 稀疏之后密集,慢之后快,低之后高
  • 跌落效果只在有积累时才成立
  • 沉默也是一种乐器 "从低语到高亢再到低语"——从私密开始,逐步推向最强音,再回归脆弱。适用于抒情歌、史诗曲、颂歌类作品。

4. 写出能打动人的歌词

展示,而非直接陈述(通常如此):

  • "我很难过" = 平淡
  • "你的卫衣还挂在门边的钩子上" = 生动
  • 但有时简单直白地说出"我献出生命",本身就充满力量

副歌/记忆点:

  • 让人记住、哼唱、反复回味的句子
  • 通常是歌名或核心短语
  • 当旋律、歌词、情感三者统一时效果最佳
  • 放在最有力的位置(通常是副歌的第一句或最后一句)

韵律配合——歌词与旋律相互支撑:

  • 稳定情绪(释然、平静)对应平稳的旋律、完美押韵、解决和弦
  • 不稳定情绪(渴望、怀疑)对应飘忽的旋律、近似押韵、未解决和弦
  • 主歌旋律通常偏低,副歌走高
  • 但如果对歌曲有利,也可反过来

避免(除非你是有意为之):

  • 不经思考的套话("金子般的心"——如果没铺垫好)
  • 为了押韵强行改变语序("尤达式语序")
  • 每个段落都用同样的能量(缺乏动态变化)
  • 把初稿当作圣旨——修改本身就是创作

5. 改编与戏仿

用新歌词重写已有歌曲时:

骨头框架:先画出原曲的结构。

  • 统计每行的音节数
  • 标记押韵格式(ABAB、AABB等)
  • 找出重读的音节
  • 注意长音/保持音落在何处

填入新词:

  • 让重读音节与原曲的重拍对齐
  • 总音节数可以灵活增减1-2个非重读音节
  • 在长音上,尽量匹配原词的元音 (如果原曲在"LOOOVE"上保持"oo"元音,那么"FOOOD"比"LIFE"更合适)
  • 关键位置使用单音节替换,保持节奏不变 (Crime → Code, Snake → Noose)
  • 用原曲旋律试唱你的新词——如果卡顿就修改

概念:

  • 选一个足以支撑整首歌的强概念
  • 从歌名/记忆点出发,向外扩展
  • 先大量积累原始素材(双关、短语、意象),再把最好的塞进结构里
  • 如果你在某个位置需要特定一句歌词,就逆向推导押韵格式,预先埋下伏笔

保留一些原词:保留几句原词或结构,能增加辨识度,让听众感受到与原曲的联系。


6. Suno AI 提示词工程

风格/类型描述字段

公式(按需调整): 类型 + 情绪 + 年代 + 乐器 + 人声风格 + 制作 + 动态

差:"悲伤的摇滚歌曲"
好:"电影感的管弦乐间谍惊悚,1960年代冷战时期,烟熏嗓性感女歌手,大乐队爵士,铜管组有小号与圆号,铺陈的弦乐,小调,模拟温暖的年代感"

描述的是旅程,而不仅仅是类型:

"以幽灵般的低语开始,只有稀疏的钢琴伴奏。逐渐加入低声的铜管。副歌时以完整管弦乐推进。第二段主歌爆发成质朴的嘶吼。结尾回到孤零零的钢琴,脆弱低语渐渐消失于寂静。"

TIPS:

  • V4.5+ 支持 Style 字段最多 1000 字符——请充分利用
  • 不要使用艺术家名字或商标。改用描述声音的方式。 "1960年代冷战谍战铜管" 而非 "詹姆斯·邦德风格" "90年代垃圾摇滚" 而非 "涅槃风格"
  • 如果你有偏好,请指定 BPM 和调性
  • 用 Exclude Styles 字段排除你不想要的风格
  • 意想不到的风格组合可能是宝藏:"bossa nova trap", "Appalachian gothic", "chiptune jazz"
  • 构建一个人声角色,而不仅仅是性别: "一位饱经风霜的烟嗓歌手,带着沙哑的中音,略带嘶哑, 开始时脆弱,最后爆发成摧枯拉朽的力量"

元标签(放在歌词字段的 [方括号] 内)

结构: [Intro] [Verse] [Verse 1] [Pre-Chorus] [Chorus] [Post-Chorus] [Hook] [Bridge] [Interlude] [Instrumental] [Instrumental Break] [Guitar Solo] [Breakdown] [Build-up] [Outro] [Silence] [End]

人声表演: [Whispered] [Spoken Word] [Belted] [Falsetto] [Powerful] [Soulful] [Raspy] [Breathy] [Smooth] [Gritty] [Staccato] [Legato] [Vibrato] [Melismatic] [Harmonies] [Choir] [Harmonized Chorus]

动态: [High Energy] [Low Energy] [Building Energy] [Explosive] [Emotional Climax] [Gradual swell] [Orchestral swell] [Quiet arrangement] [Falling tension] [Slow Down]

性别: [Female Vocals] [Male Vocals]

氛围: [Melancholic] [Euphoric] [Nostalgic] [Aggressive] [Dreamy] [Intimate] [Dark Atmosphere]

音效: [Vinyl Crackle] [Rain] [Applause] [Static] [Thunder]

将标签同时放在 style 字段和歌词字段中,以加强效果。 每段最多 5-8 个标签——太多会混淆 AI。 不要自相矛盾(同一段中不要同时出现 [Calm] 和 [Aggressive])。

自定义模式

  • 认真创作时始终使用自定义模式(分开 Style + Lyrics)
  • 歌词字段限制:约 3,000 字符(约 40-60 行)
  • 始终添加结构标签——否则 Suno 默认会生成平铺直叙的主歌/副歌/主歌,没有情感起伏

7. AI 歌手的发音技巧

AI 声乐不会阅读——它们会发音。帮助它们:

音标转写:

  • 按单词的发音拼写:"through" -> "thru"
  • 专有名词的失败率最高——尽早测试
  • "Nous" -> "Noose"(强制正确发音)
  • 用连字符引导音节:"Re-search", "bio-engineering"

表现控制:

  • 全大写 = 更响亮、更强烈
  • 元音延长:"lo-o-o-ove" = 持续/花腔
  • 省略号:"I... need... you" = 戏剧性停顿
  • 连字符拉长:"ne-e-ed" = 情感拉伸

务必:

  • 拼出数字:"24/7" -> "twenty four seven"
  • 间隔缩写:"AI" -> "A I" 或 "A-I"
  • 先在一段 30 秒的短片段中测试专有名词/生僻词
  • 一旦生成,发音就固定了——在生成前通过歌词修正

8. 工作流程

  1. 先写概念/钩子——情感核心是什么?
  2. 如果是改编,先映射原始结构(音节、押韵、重音)
  3. 生成原始素材——在结构化之前自由头脑风暴
  4. 将歌词草稿填入结构
  5. 大声朗读/唱出来——发现卡顿,修正节奏
  6. 构建 Suno 风格描述——描绘动态旅程
  7. 在歌词中添加元标签以指导表演方向
  8. 至少生成 3-5 个变体——把它们当作录音片段
  9. 选择最好的,使用 Extend/Continue 在有潜力的段落上继续构建
  10. 如果偶然出现很棒的东西,保留它 预期:每生成3-5次才得到1次好结果。反复修改是正常的。 扩展时风格可能会偏移——在扩展时重新注明流派/情绪。

9. 经验教训

  • 在风格字段中描述动态ARC(动态艺术创作曲线)远比只列出流派更重要。"低语到高潮再回到低语"为Suno提供了表演路线图。
  • 在仿作中保留部分原歌词,能增加辨识度和情感分量——让听众感受到原作的影子。
  • 歌曲的桥段部分是你转换意象的地方。用你主题的隐喻替换原作的特定指代,同时保持其情感功能(反思、转折、揭示)。
  • 在副歌/标签中使用单音节词替换,是保持节奏的同时改变含义最干净的方式。
  • 风格字段中强有力的声线描述比任何单个元标签都更有效。
  • 不要过于拘泥规则。如果某句歌词破坏了节拍但更有冲击力,那就留着它。感受才是最重要的。技巧服务于艺术,而不是反过来。