写AI短剧(尤其是AI绘画+视频生成类短剧)的剧本,与传统真人影视剧本最大的区别在于:你需要为AI的“视觉生成逻辑”服务,而不是为“演员表演逻辑”服务。
AI短剧的剧本核心是“指令化”(把情绪、动作、场景翻译成AI能理解的画面描述)和“强视觉锚点”(用连续、可复制、风格统一的关键词驱动)。
以下是一套经过验证的 “AI短剧实操剧本写作四步法”,附万能模板和避坑指南。
第一步:选题与结构——比传统短剧更“短”
AI短剧目前的技术瓶颈在于角色一致性(同一张脸在不同镜头保持稳定)和连贯动作(连续帧逻辑),剧本结构建议:
- 时长: 15-45秒(3-5个镜头,非常快节奏)
- 套路: 高概念强反转(消除复杂的情感铺垫)
- 推荐题材:
- 视觉奇观流: 史诗感场景、风格化美学(如赛博朋克、水墨风、黏土定格)
- 强转折故事: 最后三秒反转、身份反差、冷知识科普
- 无脸人故事: 看不清人脸的主角(侧面、后背、戴面具、远景),规避AI控制难点
- 核心公式: 悬念开头(1秒) + 极致场景推进(2-3秒) + 颠覆结局(1秒)
实操案例(修改前后对比):
- ❌ 传统剧本(难实现): “男主深情看着女主,眼眶泛红,一滴泪滑落。”(AI生成泪滴和微表情极难稳定)
- ✅ AI友好剧本(易实现): “一名古代将军,披着破碎的军旗,独自伫立在满是废墟的沙场上,他缓缓拔出断剑,镜头拉远,远处有一头由白骨组成的巨龙。”(强调整体氛围和动作,忽略面部微表情)
第二步:脚本撰写——用“分镜指令卡”替代“台词本”
不要写大段对话,AI生成的嘴型同步和长对话效果很差,核心内容是视觉描述和转场逻辑。
推荐格式:三列表格(画面描述 / 提示词核心/ 参考风格)
| 镜头序号 | 画面描述(中文) | AI提示词核心(英文或中文关键词) | 备注建议 |
|---|---|---|---|
| 01 | 广角,穿着黑色雨衣的人站在霓虹灯闪烁的拥挤街道中央,四周是模糊的机器人,只有他是清晰的。 | Cinemematic, volumetric lighting, cyberpunk, Hong Kong alley, black raincoat, man in center, focus on him, blurry androids, 8k highly detailed | 可以使用midjourney或者SD |
| 02 | 快速推近,他掀开雨衣兜帽,露出一张机械般光滑的银色面具,全脸无任何五官。 | Extreme close-up, silver mask, smooth, faceless, skin texture of metal, raindrops on mask, cinematic | 主体无表情,AI成功率提升90% |
| 03 | 第一人称视角,从他眼中看向荧光色天空,一个巨大的全息广告中,有一个和他长得一样的人脸在微笑。 | First-person view, looking up, giant holographic billboard, same silver mask smiling blue sky, glitch effect | 经典反差点题 |
第三步:加入“AI叙事小技巧”——规避常见Bug
因为AI目前最难处理的是连续动作和标准人脸,所以剧本里应该明确写出:
-
避免“说话”: 用“身体语言”+“音效”代替对话。
- 原稿: “老板,我要辞职。”(需要控制嘴型)
- 改稿: “主角对着镜头慢慢把手里的工牌放在桌上,特写工牌,背景音传来一声巨大电子音:'辞职申请已通过。'”(全程无嘴型需求)
-
利用“蒙太奇”: 不拍连贯动作,拍结果画面。
- 动作: 切开一个苹果。
- 蒙太奇: 镜头1:刀举起的画面,镜头2:切好的两半苹果掉在桌上。(中间砍断的过程AI生成成功率高,再拼接即可)
-
强制规定动作指令: 使用AI视频工具(如Pika、Runway、Sora)时,需在提示词里写清晰的动作词汇。“慢动作爆炸”、“衣服随风飞扬”、“光线流动”。
第四步:文转视频辅助脚本(可选进阶版)
如果你使用的是Pika/可灵/清影这类视频工具,脚本后面要加一个动作轴。
- 提示: [静止]->[开始动作]
- 示例:
- 0-1秒: 固定机位,特写,雨滴落在石像上。
- 1-3秒: 石像的眼球突然转动一下,然后镜头眩晕式模糊(快速转场)。
避坑指南(AI短剧剧本里的“绝对不要”)
- 不要写复杂的多人互动: 两个以上的人在同一个场景里说话,AI容易产生鬼影、身体融合。
- 解决方案: 写独角戏,或者一个人偶、玩偶(非人类面部)双人对话。
- 不要写“写实风”长镜头: 连续数秒不变视角。
- 解决方案: 每个镜头必须剪辑,且镜头间风格/机位变化要大(例如中景切特写切航拍)。
- 不要期待AI理解因果逻辑: AI不懂“因为A所以B”。
- 解决方案: 剧本结构要单向时间顺序(A -> B),无倒叙复杂时间线。
最后一步:AI短剧爆款实战模板
模板名称: 《都市怪谈:最后三秒高能》
- 剧本正文:
- (镜头1 - 0-3秒) 夜间写字楼22层,透过窗户只有一间办公室亮着灯,特写:电脑监控画面。
- (镜头2 - 3-7秒) 一个女人背对着键盘在疯狂打字,伴随着激烈的打字音效。
- (镜头3 - 7-9秒) 她突然停下来了,身体一动不动,缓缓把头向摄像头转过来——
- (镜头4 - 9-12秒) 转过来时,她没有脸,脸上是一张正在刷新的显示屏,上面写着 404 Not Found。 巨大音效:BGM骤停 -> 机械硬盘指示灯亮起。
- 生成视频注意: 镜头4要确保AI只生成“没有脸的女生+脸部显示屏幕”,关键词:Faceless woman, digital screen for face, CRT screen static blue, horror.
总结一句话:
AI短剧脚本 = 指令清晰的视觉要素表(表格式) + 彻底放弃微表情和复杂对话 + 分段式的转场和蒙太奇。

