这是一个非常专业且具有时效性的问题,短剧(特别是小程序剧、竖屏剧)的工业化生产需求催生了AI分镜的落地。
传统分镜是“手绘/软件画出来的图纸”,而AI分镜是“通过文字指令生成的影像化方案”,两者的核心区别在于生产效率、修改成本、视觉风格统一性以及与最终成片的关系。
以下是详细的对比分析,涵盖制作流程、核心差异以及各自的优劣势。
核心区别总览
| 维度 | 传统分镜 (手绘/PS/CSP/Toon Boom) | AI分镜 (Midjourney/DALL-E 3/Stable Diffusion + ComfyUI) |
|---|---|---|
| 制作主体 | 资深分镜师、导演 | 有美术审美的AI操作员、提示词工程师 |
| 产出物 | 连续性手绘草图或赛璐珞风格稿 | 高质量、光影逼真的摄影级概念图/电影级静帧 |
| 速度 | 慢,30秒短剧可能需2-3天 | 极快,30秒短剧(约15-20张图)可30分钟-2小时完成 |
| 修改成本 | 高,修改一个镜头角度需重画 | 低,只需修改文字描述或ControlNet参数,重新生成 |
| 视觉一致性 | 高,同一位画师画风统一 | 低(初版),需要Lora微调、图生图、Seed控制等技术手段 |
| 镜头语言 | 稳定且符合电影语法 | 依赖提示词描述,可能产生穿帮或不符合物理规律 |
| 载体适配 | 通常为横屏(16:9)或电影宽屏 | 可定制(竖屏9:16为短剧特效优化) |
传统分镜制作流程(以短剧为例)
- 剧本拆解:导演或执行导演将剧本拆解成一个个镜头,列出景别(远全中近特)、运镜(推拉摇移跟)、机位(正反打、俯仰拍)、演员走位、关键道具。
- 文字分镜:写出分镜表(场号、镜头号、画面描述、台词、音效、时长)。
- 手绘/数字绘画:分镜师根据表画草图。
- 特点:关键帧(Key Frame)通常画得很精细,过渡帧(In-between)可能只是火柴人或简笔。
- 工具:纸笔、数位板 + Photoshop / Clip Studio Paint / Procreate。
- 拼接与动画演示(可选):将手绘稿导入剪辑软件,配合Demo音效和粗剪对白,做成动态分镜(Animatic)来预演节奏。
- 现场执行:导演拿着分镜板(Storyboard)去拍摄现场,演员和摄影机照着摆。
传统分镜的优势:
- 导演意志的精确表达:分镜师能画出编剧/导演脑中超越现实的镜头(如《黑客帝国》的子弹时间)。
- 镜头语言准确性:不会出现AI常见的“人物多一只手”或“透视错乱”导致的误解。
- 艺术风格统一:若有特定美术要求(如《哪吒》那种二维水墨),传统手绘更可控。
传统分镜的劣势:
- 耗时耗力:1分钟短剧可能需要30-50张草图,画师成本高。
- 沟通成本高:非专业人士(投资人、金主、甲方)很难通过火柴人草图想象最终画面效果。
AI 分镜制作流程(以短剧为例)
使用工具链:ChatGPT / Claude(生成文案)→ Midjourney / Stable Diffusion(生成图像)→ Runway Gen-2 / Pika(生成动态视频片段)或 Luma Dream Machine / Kling(生成动态镜头)
流程如下:
- 剧本结构化:将短剧剧本(3集/每集2分钟为例)输入AI,要求它拆解出场景序号、角色出场状态、关键情节点。
- 生成Prompt(提示词):AI自动生成每个镜头的描述。
- 例子:
[景别:中景] [内容:男主怒摔手机] [情绪:极度愤怒] [风格:赛博朋克霓虹灯,电影感光晕,佳能R3,35mm镜头,竖屏9:16]
- 例子:
- 批量化生成:使用AI绘画工具批量生成。
- 关键步骤:Seed控制,使用相同Seed+图生图(Image-to-Image)来保证男主、女主的外观一致。
- 动态化(短剧特有):将生成的静态图转为动态视频。
- 工具:Runway Gen-2(支持Camera Control,如拉远、推进);Pika(支持局部动画,如眨眼睛)。
- 产出物:生成30秒左右的动态预览视频。
- 人工修图:修正AI出现的硬伤(如手指数量、背景文字乱码、光影不一致),常用工具:Photoshop + AI插件(如StartAI)。
- 输出分镜包:按场次、镜头号导出高清图或短动画,制作成PDF或剪辑成演示视频。
AI分镜的优势:
- 极致的视觉冲击力:生成的照片级画面,能让投资方第一眼就产生“这是大片”的感觉,对于需要快速拉投资的短剧项目尤为有效。
- 快速试错:导演可以说“我不喜欢这个构图,换成在酒吧吧台,逆光”,AI秒出结果,现实世界摆灯位可能需要2小时。
- 降本:无需雇佣高水平分镜师,网文写手或助理导演熟练使用AI后即可完成。
AI分镜的劣势:
- 角色面容不统一:这是目前最大的硬伤,需要花大量时间训练角色Lora模型,否则短剧里男主的脸每集都会变(俗称“AI换脸综合征”)。
- 逻辑穿帮:AI不理解物理逻辑,前一帧男主在接电话,下一帧他手里可能拿着枪;或者一个杯子在桌上反复变幻位置。
- 构图缺乏“呼吸感”:AI生成的构图往往太“满”,充满细节,缺乏电影中构图上的留白和引导线的运用。
短剧场景下的决定性差异
短剧(特别是收费小程序剧)对转化率有极高要求,所以两者差异在以下三点尤为明显:
-
勾引度(Thumbnail Factor):
- 传统分镜:为了便于导演理解,通常颜色简单,构图清晰但不够吸引人。
- AI分镜:天然生成高饱和、高对比、高光影的“网络小说封面级”图像,AI分镜更适合拿来直接当作付费推广的“钩子图”,比如生成“男主暴打渣男”的激烈动作瞬间,光影质感比真实拍摄还猛烈。
-
镜头与道具的续接性(Continuity):
- 传统分镜:分镜师会精确画出镜头从1到2的衔接,男主从口袋拿手机”——手在口袋——手离口袋0.5米——手有手机。严丝合缝。
- AI分镜:目前生成的多为静态图或2秒动图,很难做到同机位、同光位、同人物姿态的精确续接。这是AI分镜目前最大的短板,剧组拍摄时,还得靠导演和摄影师重新调AI图里的穿帮。
-
拍摄指导性(On-set Production):
- 传统分镜:摄影师可以直接翻到某一页,说“看,这里给了一个特写,在那里放一个C型臂”。执行精度极高。
- AI分镜:更多是一种 “视觉概念参考” ,导演只能告诉灯光师“我们要这个AI图的氛围感,红色为主,但人脸上不要有AI那种平光,加一点电影面光”。AI图难以直接转化为布光图纸。
结论与趋势
| 场景 | 推荐使用 |
|---|---|
| 短剧2.0项目(竖屏/小程序剧) | AI分镜主导,投资方看重速度,AI能一周出100集分镜,够快。 |
| 精品定制剧(长剧/横屏) | 传统分镜为主,AI辅助,导演用AI寻找灵感(比如发色、特殊光源),但分镜图仍由专业画师完成以保证连续性。 |
| 非真实感类型(玄幻/游戏改编) | AI分镜。 传统画师很难凭空画出一个充满粒子特效的魔法场景,而AI对此游刃有余。 |
未来预测:3-5年内,AI分镜将完全取代90%的低端分镜工作(给网剧、短剧做快速预览),但高端的、需要灵魂和镜头节奏的电影级分镜,短期内仍需人类艺术家主导,因为只有人类才理解“为什么要在这个时刻切一个特写”。

