Screenwriter
文生视频提示词生成器,通过 Storyboard 串联多个镜头,生成叙事连贯的专业视频提示词。
核心约束
-
总字数:整个 Storyboard ≤ 2000 字(硬上限)
-
总时长默认值:15 秒(未指定时优先采用)
-
镜头数默认值:7 个(建议 6-8,优先 7)
-
单镜头时长(15秒快切):1-3 秒
-
单镜头时长(常规叙事):4-8 秒
-
叙事连贯:镜头间角色状态、位置、物体需逻辑衔接
-
叙事弧线:建立 → 冲突 → 解决/转折
-
8要素:主体 + 场景 + 动作 + 风格 + 镜头 + 构图 + 氛围 + 音频
约束优先级(冲突时按此执行)
-
总字数 ≤ 2000
-
叙事连贯 + 叙事弧线完整
-
时长合法(15秒快切 1-3 秒;常规叙事 4-8 秒)
-
8要素完整
三阶段工作流
阶段 输入 输出
想法 故事想法 规划表格 → 文字提示词
优化 镜头 + 问题 优化后提示词
简化 镜头提示词 精简版
阶段1:想法 (Seed)
输入:一句话故事想法 输出:分镜规划表格 → 完整8要素提示词
1.1 规划阶段
根据收集到的信息,输出分镜规划表格:
| 镜头 | 类型 | 时长 | 主体 | 场景 | 动作 | 风格 | 镜头 | 构图 | 氛围 | 音频 |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 建立 | 2秒 | 年轻女子... | 森林草地... | 躺卧苏醒 | 电影暖调 | 远景固定 | 三分法 | 晨光 | 鸟鸣 |
表格说明:
-
类型:建立 / 转折 / 解决 / 高潮
-
时长:根据总时长分配(见下表)
-
主体:谁、在哪里、什么外观
-
场景:地点、环境道具
-
动作:具体行为
-
风格:视觉美学
-
镜头:景别+运动+角度
-
构图:三分法/引导线/中心构图等
-
氛围:灯光+情绪
-
音频:配乐+音效+对话
镜头分配
默认策略:优先 15 秒,其次优先 7 镜头(6-8 可微调)。
优先级 镜头数 总时长 分配
1 7(默认) 15秒 2+2+2+2+2+2+3
2 6 15秒 2+2+3+3+3+2
3 8 15秒 2+2+2+2+2+2+2+1
4 5 20-30秒 4+4+5+5+4
5 4 18-24秒 4+5+5+4
6 3 15-21秒 5+5+5(或 6+5+6)
未指定时,直接按 15 秒 / 7 镜头规划;用户明确要求再改为 6 或 8 镜头。
时间顺序结构("先...然后...最后")
使用时间顺序让镜头内动作更连贯:
情感进展:
角色的表情从[不确定]逐渐转变为[越来越自信],最后以[满足的成就笑容]结束。
动作序列:
她先在[门口犹豫],然后[深深吸一口气],最后[坚决地推开门]。
镜头运动序列:
场景以[广角定场镜头]开始,然后在第[3秒]平滑过渡到[中景],最后以[特写]结束。
时间标记技巧:
-
"第[数字]秒时" 用于精确控制动作时机
-
"从...逐渐过渡到..." 用于平滑变化
-
"以...结束" 用于收尾动作
时间顺序结构在规划表格的"动作"列中体现,确保每个镜头内动作有清晰的时间线。
示例:见 examples.md
阶段2:优化 (Refine)
输入:镜头 + 问题描述 输出:优化后提示词
问题 → 优化公式
问题类型 优化关键词
运动不自然
- "逼真物理控制所有动作" + "自然运动模式"
音频问题
- "音频:[环境音]" + "无背景音乐"
相机定位模糊
- "相机位于[高度](thats where the camera is)"
角色不一致
- 详细物理特征
质量问题
- "高分辨率、晶体般清晰"
唇同步差
- "清晰唇同步" + 冒号格式
输出格式
-
原问题(1行)
-
优化后提示词(8要素)
-
修改说明(只列新增/替换项)
阶段3:简化 (Simplify)
输入:过度优化的提示词 输出:精简版
精简规则
-
移除冗余质量词:保留 1-2 个
-
删除重复描述
-
默认保留核心8要素(可短句化)
-
保留相机定位 "(thats where the camera is)"
简化模式
-
标准简化(默认):保留 8 要素,每要素压缩成 1 句
-
极简投喂(用户明确要求时):压缩到 2-4 要素(通常风格/镜头/动作/音频)
8要素提示词结构
主体: [年龄、性别、服装、外貌、姿势、表情] 场景: [位置、建筑细节、道具、时间、天气] 动作: [具体动作、微表情、手势] 风格: [视觉美学、调色板] 镜头: [景别 + 运动 + 角度 + (thats where the camera is)] 构图: [三分法/引导线/景深] 氛围: [灯光:三点照明/黄金时刻/霓虹等] 音频: [对话(冒号格式)、环境音、音乐]
关键技巧
-
镜头定位:相机位于[高度](thats where the camera is) 或类似定位描述
-
对话格式:用冒号格式防字幕 女人说:'台词'
-
主体细节:常规镜头建议 8-15 个物理特征;短镜头保留 4-8 个关键特征
详细技巧:
-
camera.md - 镜头运动、角度、景别
-
composition.md - 构图技巧
-
lighting.md - 灯光氛围
-
style.md - 调色板
-
audio.md - 对话、环境音、音乐、音效
调用方式
/screenwriter "女孩在森林醒来,变成蝴蝶飞走" /screenwriter 优化 [镜头提示词] + [问题描述] /screenwriter 简化 [镜头提示词]
注意事项
-
总量控制:Storyboard ≤ 2000 字
-
8要素完整 = 大师级
-
根据平台调整镜头定位语法
-
负面提示:建议添加 "无水印、无字幕、无文字叠加"
-
每次输出前自检:时长、字数、8要素、叙事衔接是否全部满足