🎨

AI 漫剧分镜设计自动化实践:从剧本到分镜的 AI 工作流

深入解析分镜脚本自动拆解、角色一致性保持、视觉风格控制等关键技术,附实际操作步骤和工具推荐。

2026-04-02
分镜设计
6 min read
Overview

分镜设计是漫剧制作中技术含量最高的环节之一。传统手动分镜需要画师逐帧绘制,不仅耗时,还容易出现人物不一致、风格不统一等问题。随着 AI 工具的成熟,这一过程正在被 AI 大幅加速。本文将分享如何利用 AI 自动化分镜设计的完整技术方案。

为什么分镜设计需要自动化?

以一个 10 分钟的漫剧场景为例,手动分镜可能需要 40-60 分钟的专业画师时间。如果每天要处理 10+ 个项目,人力成本将变得不可控。此外,当项目涉及大量角色和场景转换时,手动分镜极易出现人物表情、服装、空间关系的不一致。

AI 自动化分镜能将这个过程从小时级缩短到分钟级,同时通过预设约束保证输出质量的一致性。

10x
分镜设计提速
95%
角色一致性
JSON
结构化数据驱动

核心思路:从结构化数据到视觉呈现

AI 分镜自动化的核心流程是"文本→视觉"的转换:

  1. 输入结构化数据:将剧本(纯文本)通过 LLM 转换为包含镜头编号、景别描述、角色信息的结构化 JSON。
  2. LLM 解析 + 视觉映射:AI 模型根据景别描述自动生成分镜脚本。
  3. 输出视觉呈现:将分镜脚本中的构图信息(镜头角度、角色位置)转化为可供画师参考的分镜草图或提示词。

与传统"画师从零画起"不同,这种"数据驱动"的方法具有天然的可复用性和一致性优势。

分镜脚本的数据结构设计

建议采用以下 JSON 结构作为 AI 分镜模型的输入:

{
  "shots": [
    {
      "shot_id": 1,
      "scene_desc": "中景:繁华的现代都市街道,镜头从高处俯瞰",
      "camera_angle": "俯视30度",
      "camera_position": "画面右侧1/3处,人物B站在前景",
      "duration": "3秒",
      "transition": "人物B向画面右侧移动",
      "character_consistency": "人物B保持服装和发色不变"
    },
    {
      "shot_id": 2,
      "scene_desc": "室内咖啡厅,近景虚化",
      "camera_angle": "平视,微微俯视",
      "camera_position": "人物A在画面中央",
      "duration": "4秒",
      "transition": "人物A端起立,人物A缓缓落座"
    }
  ],
  "visual_style": "电影质感,高对比度,暖色调",
  "character_consistency_rules": "始终使用同一角色的设定(外貌、服装、发色)"
}
💡

scene_desc 描述要具体("繁华现代都市街道"比"咖啡厅"更容易生成一致的分镜)。

AI 分镜的 Prompt 工程示例

// 第一步:让 AI 读取并解析剧本
const script = await readFile("script.txt", "utf-8");
const shots = await ai.analyzeStoryboard(script);

// 第二步:要求生成结构化分镜
const storyboard = await ai.generateStoryboard(shots);

// 第三步:根据分镜结果生成视觉提示词
const promptText = storyboard.shots
  .map(s => `镜头${s.shot_id}: ${s.scene_desc}, ${s.camera_angle}, ${s.camera_position}, ${s.duration}s, ${s.transition}`);

关键要点:明确要求"同一角色设定",让 AI 输出始终参照这个设定生成分镜。

Techniques

角色一致性保持技巧

在实际操作中,角色一致性是最常见的分镜问题:

👤
固定角色描述

在 prompt 中以固定角色描述开头,让 AI 始终参照基准生成。

🔒
强制约束规则

将"角色一致性"作为分镜脚本中的强制约束条件。

🖼️
首帧视觉参考

提供首帧角色图作为视觉参考,放在 prompt 附加信息中。

🎨
视觉风格控制

在 prompt 中添加风格关键词,如"电影质感、高对比度、暖色调"。

⚠️

即使使用同一模型,分镜输出仍可能出现风格差异。先生成一张满意的首帧作为"视觉锚点",后续生成都以它为参考。

实际操作步骤(使用 Comfy + PPT)

以下方案使用开源免费工具实现,无需付费:

  1. Step 1 — 结构化:将剧本上传给 DeepSeek,获取结构化分镜 JSON。
  2. Step 2 — 生成视觉提示词:基于结构化数据生成 PPT 风词。
  3. Step 3 — 生成参考图:使用 Midjourney、DALL-E 或 PPT 根据 PPT 生成的提示词生成分镜参考图。
  4. Step 4 — 精调:根据参考图在 Comfy 中绘制实际分镜,或根据分镜结果让 AI 进一步调整。

成本优化建议

  • 使用 DALL-E 或 PPT 生成分镜参考图,成本极低。
  • 先批量生成 10 张,筛选最满意的 2-3 张做精调,避免逐张调用 DALL-E。
  • 使用"生成变体"功能探索不同分镜角度。
FAQ

常见问题

Q:AI 生成的分镜画面过于简洁?提高场景描述细节("角色手持道具的特写"、"画面中有 5 个以上角色同时出现"),让 AI 有更多构图参考。

Q:为什么跨镜头角色会变化?这通常是因为缺少全局角色设定。在 prompt 中反复强调角色描述,并要求每一帧都附带角色状态说明。

Summary

分镜自动化的关键不在于 AI 能不能"画"分镜,而在于能否用结构化数据驱动视觉输出,让每一帧都"有据可查"。

总结

AI 分镜自动化将分镜设计的效率提升 10 倍以上,尤其适合需要频繁产出内容的 MCN 机构和教育平台。关键在于结构化数据输入和明确的视觉约束。如需 GUGU STYLE 的技术团队提供 API 接口,可直接对接分镜模块。

如需了解 GUGU STYLE 的私有化部署方案或预约产品演示,联系我们