一个人做漫剧，已经从想法变成现实

2026-03-22 4 纸飞机账号购买

750 亿播放之后，漫剧已经进入主流内容赛道

过往的一年当中，漫剧并非仅仅局限于成为某一个特定垂类圈层里的热闹景象，而是实实在在地正式踏入到大众内容生产所涵盖的视野范围之内了。

据公开数据表明，在2025年时，抖音平台之上，漫剧的累计播放量已然达到了757亿次，并且全年上线的作品数量超过了3.7万部，日均上新数量超过300部。个别作品所获得的商业回报也已然开始持续不断地刷新外界的认知。举例来说，AI漫剧《斩仙台下，我震惊了诸神！》其制作成本大约为15万，然而却收获了超过20亿的播放量以及千万级别的利润。直至2026年春节档的时候，《西游，错把玉帝当亲爹》上线仅仅35小时播放量便突破了1亿，这再次证明了这个品类已然具备了能够持续爆发的能力。

倘若仅瞧流量，此件事情已然够热乎。不过更需留意的是，市场、平台以及政策正于同一方向汇聚拢来。艾媒咨询所展示的数据表明，在2025年的时候，AI漫剧市场规模会达至189.8亿元，与之对照同比增速为276%；预估在2026年，用户规模会从1.2亿提升至2.8亿。于此同时，字节、腾讯、百度均已投身其中，头部内容厂商也在迅速跑通生产模型。

2025年起，广电总局不断推进“微短剧 +”相关行动，鼓励微短剧与文旅方向结合，鼓励微短剧与品牌方向结合，鼓励微短剧与科普方向结合，鼓励微短剧与非遗方向结合，鼓励微短剧与经典传播方向结合。另一层更进一步的变化源自政策环境。深圳推出扶持措施，其支持从创作延伸到拍摄、发行、研发、人才和产业园区等多个环节。河南推出扶持措施，其支持从创作延伸到拍摄、发行、研发、人才和产业园区等多个环节。郑州推出扶持措施，其支持从创作延伸到拍摄、发行、研发、人才和产业园区等多个环节。

也就是说，漫剧并非是那种转瞬即逝、稍纵即逝的短暂流量，而是正处于一种被按照系统的方式、有条理地朝着产业化阶段大力推进的状态。

它不是一个“会不会来”的趋势，而是一件已经落地的事。

随即便生出了这样的疑问：那些普通的个人创作者，到底可不可以实实在在地参与到其中呢？

一个人做漫剧，真正难的是什么？

有不少人会讲，AI已将制作门槛给拉低了。这个判定是正确的，然而仅仅说对了其中的一半。AI的确压缩了传统的制作成本，可是在实际进行操作的时候，创作者所面对的问题并未消失，而是从设备、团队以及资金这几个方面，转移到了流程控制以及稳定产出上面。

痛点一：同一个角色，镜头一多就不像同一个人

这种问题，几乎是所有从事AI漫剧创作的人都会碰到的。第一张图里，角色的形象塑造成功了，然而到了后续的镜头当中，却开始出现失真的状况：脸型有了变化，五官发生了漂移，发色变得不一致，服装的细节也走样了。镜头数量越多，这样的问题就越发地明显。

业内通常把它称为“角色一致性失控”。

当前存在的方案不是一点儿都没有，然而，要么它依赖LoRA训练，其带来的学习成本以及制作成本都不是很低；要么是借助参考图功能，可这种情况下稳定性存在局限，在许多时候仅仅是勉强能够保证面部相似得以存在，但是身体部分、服装部分以及整体所呈现出的气质依旧是容易出现偏差，出现偏离。对于漫剧这一需要大量镜头进行连续输出的内容形式而言，这就表明每一个帧画面都存在着可能会再次出现失误的情况。

痛点二：工具很多，但流程是断的

漫剧，时长仅几分钟，看似不长，然而实际所涉及的链路却极为完整，通常起码涵盖了选题之举，剧本拆解之项，角色设定之措，画面生成之法，图生视频之术，配音字幕之工，剪辑包装之程等等步骤。

实际情形是，创作者常常得于多个平台之间来回地切换，写剧本需用一种工具，出图要用一种工具，做视频又得是另一种工具，最终再返回至剪辑软件里进行收尾，在这个过程当中，不但要频繁地导入导出文件，而且还要反复地修正风格、尺寸、格式以及上下文衔接。

知晓的人都清楚，实际上耗费时间的，通常并非创作自身，而是不同工具间的搬运、对齐以及补救。就算是熟练的使用者，完成一集时长为5分钟的漫剧，往往也需要2至3个小时，其中有相当大一部分时间都用在了串流程方面。

痛点三：视频生成不稳定，像反复抽卡

很多图像模型已经足够惊艳，但一到视频，问题就出来了。

在你期望角色实现一种动作状态为缓慢转身的时候，与此同时镜头靠近如此展开，然而模型所给予你的结果，极有可能是动作出现失真的状况，并且节奏也处于混乱之中，甚至画面还有抽搐的现象发生。Text-to-Video最为突出的问题，并非是不能进行生成，而是在精确控制方面存在困难。你没办法清晰明确地规定镜头自何处起始，又到何处终结，只能一次又一次地去尝试，一直到碰到一个勉强能够使用的版本为止。

做单个的短视频之际，这般试错说不定尚且能够被接纳；然而要是存在完整叙事的漫剧，每一个镜头均凭着运气，生产效率基本上就根本没办法构建起来。

它并非仅仅是生成工具，要知道，比起工具，它更为像一套导演的工作台，这是BigBanana AI Director所呈现的特点。

BigBanana AI Director（AI漫剧工场），其定位并非是去做一个“会绘制图像的AI工具”，而是尝试着将漫剧创作最为核心的好几个断点衔接起来，变为一条完整的生产链路。

它的重点并非帮你单独生成一张图，而是将从故事输入开始，历经角色定妆，再到镜头拆解，接着把控画面直至视频输出，这一整套流程纳入一个系统进行管理。创作者所面对的并非相互割裂的功能点，而是一套围绕“成片”构建起来的工作台。

倘若是要用一句话去概括它的价值，那么能够理解为，它是从一句故事想法起始，进而把剧本到成片的流程尽量去实现自动化以及连续化。

它具体解决了哪些关键问题？1. 角色一致性：先定妆，再生产

BigBanana的处理办法，是于正式生成镜头之前，先构建角色的标准定妆照，即Reference Image。后续的镜头并非将其视作一个无关紧要的参考，而是当作角色形象的约束条件加以运用。

在此基础阶段之上，系统另外设计了衣橱方面的能力，同一角色可以预先设置多套不同造型，像是日常穿着的服装，用于战斗时的服饰装扮，以及呈现受伤状态下的模样等，在进行服装切换操作期间，要尽力保证人物脸部以及整体特征处于稳定状态。

这件事的价值十分直接，那就是当你连续生成十几个镜头，甚至是几十个镜头的时候，角色依旧能够被识别为同一个人，而并非每个镜头都好像新建了一位演员一样。

2. 全链路连通：从剧本到成片在一个系统内完成

BigBanana 把漫剧制作拆成了四个连续阶段：

这套流程最为关键的意义所在，便是那角色设定，以及场景信息，还有镜头描述另外视频生成，它们不再于诸多不同平台之中分散开来。数据于系统内部持续不断地流转，从而减少重复输入，并且也减少风格以及上下文的丢失。

3. 关键帧驱动：把“碰运气”改成“先定义画面”

这部分是它比较有价值的设计。

处于传统文本生成视频范畴之内的问题，是创作者仅能够凭借一句描述来“猜”模型是不是理解了镜头，BigBanana相对而言更贴近于动画制作当中的关键帧思路。

要先去确定一下镜头开始之时所呈现的、那具体的画面，然后再去定义镜头结束之际所呈现的、那特定的状态，接着由人工智能在这两者之间去补齐那过渡性的运动。

这表明，创作者并非仅仅依靠语言去描绘“人物缓缓转身”，而是能够确切地告知系统“转身之前呈现出怎样的模样”，“转身之后呈现出怎样的样子”。中间的运动交由 AI 去处理，然而镜头的边界以及结果是由人来把控的。

系统具备九宫格预览的能力，能使同一个镜头先产生多种构图方案，之后从中甄别出合适版本。相较于一次次地进行重生成，此种方式更适合用来提升有效产出率。

4. 本地数据存储：创意和素材不外流

浏览器的本地IndexedDB里保存着项目数据，它不依靠服务端存储，不管是剧本，还是设定，又或许是生成出来的画面，数据都优先留在本地设备当中。

对于那些团队而言，这些团队是需要处理原创内容的团队，这些团队也可是处理商业选题的团队，这些团队还能够是处理未公开IP的团队，这一点，它比“能不能多快生成”，同样是重要的。

5. 更接近生产系统，而不是一次性玩具

当下从事漫剧工作，目标并非 merely 做出一条视频，而是需考量这套内容能不能持续更新，能不能实现标准化，能不能达成复用，最终能不能造成系列化输出。

比如BigBanana这类全链路工具，其意义在于，它能使得单次创作效率，进一步朝着可复制的生产能力推进。其中，角色资产能够复用，镜头逻辑可以回溯，输出格式更为规范，整个流程对于长期从事内容创作的人而言更适配，而并非仅仅适用于偶尔尝试一次的人。

技术架构可以怎么理解？

BigBanana 的整体数据流大致可以分成三层：

输入层：故事文本 / 创意描述
    ↓
处理层：GPT-5.1 剧本分析 → Gemini 图像生成 → Veo / Sora 视频合成
    ↓
输出层：关键帧序列 + MP4 视频片段 → 导入剪辑软件继续制作

从实现上看，有几个设计点比较关键：

现在入场，另一个重要原因是政策窗口确实打开了

要是直至今日，依旧将微短剧视作早期那种野蛮生长的流量玩法，如此判断已然有些滞后了。过去一年所释放出的信号极为分明，监管方面以及行业并非只是在单纯地进行收紧，而是在规范得以确立的基础之上，促使优质内容以及完整的产业能力能够加速发展起来。

1. 国家层面：微短剧被放进更大的内容应用框架里

国家广播电视总局办公厅，于2025年1月，发布了“微短剧+”行动计划，其中做出提出了这样一些方向，有“跟着微短剧去旅行”，还有“跟着微短剧来学法”，以及“跟着微短剧来科普”，另外还有“跟着微短剧学经典”，甚至有“微短剧里看品牌”，更有“微短剧里看非遗”。

这说明几件事：

2. AIGC 层面：允许提效，但强调人主导和可审查

2025年，围绕AIGC参与影视创作展开公开讨论的时候，监管思路已然清晰。技术能够进入策划环节，技术能够进入制作环节，技术能够进入运营环节，技术能够进入推荐环节，并且的确可以提升效率。然而，创作主体依旧必定得是人，关于内容安全方面不能缺位，关于价值导向方面不能缺位，关于标识可审查能力方面不能缺位。

相反地，对于未来而言，真正具备竞争力的并非是那些能够更频繁制作出图片的，而是那些可以将工具，流程，审美以及合规能力相互结合起来的，并且能够稳定地产出内容的主体。

3. 地方层面：支持已经细化到制作链条各环节

从地方政策看，微短剧正在被当成新型数字内容产业来布局。

这背后所表明的并非是“政府帮你去做内容”，而是此赛道已然开始具备更为完备的资源配置现象。对于个人以及小团队来讲，未来从事漫剧创作将不再全然依靠独自拼搏。

4. 机会在扩大，要求也在抬高

因之，此间这个处于进行时态的阶段，最为贴近事实的行业变换情形并非“人人尽皆具备能够轻易成就爆款的能力”，却是：

正是由于这样的情况，存在着一套将剧本、角色、镜头、视频以及导出来展开串联的工作台，它比单个生成形式的模型，更具有所形成的价值。

三步开启第一部漫剧创作

第 1 步：在线访问

如果倾向本地部署，也可以通过 Docker 启动：

# 1. 克隆项目
git clone https://github.com/shuyu-labs/BigBanana-AI-Director.git
cd BigBanana-AI-Director
# 2. 启动服务
docker-compose up -d
# 3. 浏览器访问
# http://localhost:3005
# 查看日志
docker-compose logs -f
# 停止服务
docker-compose down

第 2 步：配置 API Key

启动之后，于引导页面当中填写AntSK API Key。要是还没有申请的话，能够前往https://api.antsk.cn/进行注册并且领取免费额度。

第 3 步：输入故事并生成分镜

进到“剧本与故事”的阶段，把你的创意或者故事内容输进去，再去点击生成分镜脚本。随后这个系统会接着完成角色生成，接着完成分镜绘制，接着完成视频合成。

哪些人会更适合使用它？身份可获得的价值

短视频创作者

更快做出连续剧情类漫剧，提升内容上新效率

一个人做漫剧，已经从想法变成现实