750 亿播放之后,漫剧已经进入主流内容赛道
过往的一年当中,漫剧并非仅仅局限于成为某一个特定垂类圈层里的热闹景象,而是实实在在地正式踏入到大众内容生产所涵盖的视野范围之内了。
据公开数据表明,在2025年时,抖音平台之上,漫剧的累计播放量已然达到了757亿次,并且全年上线的作品数量超过了3.7万部,日均上新数量超过300部。个别作品所获得的商业回报也已然开始持续不断地刷新外界的认知。举例来说,AI漫剧《斩仙台下,我震惊了诸神!》其制作成本大约为15万,然而却收获了超过20亿的播放量以及千万级别的利润。直至2026年春节档的时候,《西游,错把玉帝当亲爹》上线仅仅35小时播放量便突破了1亿,这再次证明了这个品类已然具备了能够持续爆发的能力。
倘若仅瞧流量,此件事情已然够热乎。不过更需留意的是,市场、平台以及政策正于同一方向汇聚拢来。艾媒咨询所展示的数据表明,在2025年的时候,AI漫剧市场规模会达至189.8亿元,与之对照同比增速为276%;预估在2026年,用户规模会从1.2亿提升至2.8亿。于此同时,字节、腾讯、百度均已投身其中,头部内容厂商也在迅速跑通生产模型。
2025年起,广电总局不断推进“微短剧 +”相关行动,鼓励微短剧与文旅方向结合,鼓励微短剧与品牌方向结合,鼓励微短剧与科普方向结合,鼓励微短剧与非遗方向结合,鼓励微短剧与经典传播方向结合。另一层更进一步的变化源自政策环境。深圳推出扶持措施,其支持从创作延伸到拍摄、发行、研发、人才和产业园区等多个环节。河南推出扶持措施,其支持从创作延伸到拍摄、发行、研发、人才和产业园区等多个环节。郑州推出扶持措施,其支持从创作延伸到拍摄、发行、研发、人才和产业园区等多个环节。
也就是说,漫剧并非是那种转瞬即逝、稍纵即逝的短暂流量,而是正处于一种被按照系统的方式、有条理地朝着产业化阶段大力推进的状态。
它不是一个“会不会来”的趋势,而是一件已经落地的事。
随即便生出了这样的疑问:那些普通的个人创作者,到底可不可以实实在在地参与到其中呢?
一个人做漫剧,真正难的是什么?
有不少人会讲,AI已将制作门槛给拉低了。这个判定是正确的,然而仅仅说对了其中的一半。AI的确压缩了传统的制作成本,可是在实际进行操作的时候,创作者所面对的问题并未消失,而是从设备、团队以及资金这几个方面,转移到了流程控制以及稳定产出上面。
痛点一:同一个角色,镜头一多就不像同一个人
这种问题,几乎是所有从事AI漫剧创作的人都会碰到的。第一张图里,角色的形象塑造成功了,然而到了后续的镜头当中,却开始出现失真的状况:脸型有了变化,五官发生了漂移,发色变得不一致,服装的细节也走样了。镜头数量越多,这样的问题就越发地明显。
业内通常把它称为“角色一致性失控”。
当前存在的方案不是一点儿都没有,然而,要么它依赖LoRA训练,其带来的学习成本以及制作成本都不是很低;要么是借助参考图功能,可这种情况下稳定性存在局限,在许多时候仅仅是勉强能够保证面部相似得以存在,但是身体部分、服装部分以及整体所呈现出的气质依旧是容易出现偏差,出现偏离。对于漫剧这一需要大量镜头进行连续输出的内容形式而言,这就表明每一个帧画面都存在着可能会再次出现失误的情况。
痛点二:工具很多,但流程是断的
漫剧,时长仅几分钟,看似不长,然而实际所涉及的链路却极为完整,通常起码涵盖了选题之举,剧本拆解之项,角色设定之措,画面生成之法,图生视频之术,配音字幕之工,剪辑包装之程等等步骤。
实际情形是,创作者常常得于多个平台之间来回地切换,写剧本需用一种工具,出图要用一种工具,做视频又得是另一种工具,最终再返回至剪辑软件里进行收尾,在这个过程当中,不但要频繁地导入导出文件,而且还要反复地修正风格、尺寸、格式以及上下文衔接。
知晓的人都清楚,实际上耗费时间的,通常并非创作自身,而是不同工具间的搬运、对齐以及补救。就算是熟练的使用者,完成一集时长为5分钟的漫剧,往往也需要2至3个小时,其中有相当大一部分时间都用在了串流程方面。
痛点三:视频生成不稳定,像反复抽卡
很多图像模型已经足够惊艳,但一到视频,问题就出来了。
在你期望角色实现一种动作状态为缓慢转身的时候,与此同时镜头靠近如此展开,然而模型所给予你的结果,极有可能是动作出现失真的状况,并且节奏也处于混乱之中,甚至画面还有抽搐的现象发生。Text-to-Video最为突出的问题,并非是不能进行生成,而是在精确控制方面存在困难。你没办法清晰明确地规定镜头自何处起始,又到何处终结,只能一次又一次地去尝试,一直到碰到一个勉强能够使用的版本为止。
做单个的短视频之际,这般试错说不定尚且能够被接纳;然而要是存在完整叙事的漫剧,每一个镜头均凭着运气,生产效率基本上就根本没办法构建起来。
它并非仅仅是生成工具,要知道,比起工具,它更为像一套导演的工作台,这是BigBanana AI Director所呈现的特点。
BigBanana AI Director(AI漫剧工场),其定位并非是去做一个“会绘制图像的AI工具”,而是尝试着将漫剧创作最为核心的好几个断点衔接起来,变为一条完整的生产链路。
它的重点并非帮你单独生成一张图,而是将从故事输入开始,历经角色定妆,再到镜头拆解,接着把控画面直至视频输出,这一整套流程纳入一个系统进行管理。创作者所面对的并非相互割裂的功能点,而是一套围绕“成片”构建起来的工作台。
倘若是要用一句话去概括它的价值,那么能够理解为,它是从一句故事想法起始,进而把剧本到成片的流程尽量去实现自动化以及连续化。
它具体解决了哪些关键问题?1. 角色一致性:先定妆,再生产
BigBanana的处理办法,是于正式生成镜头之前,先构建角色的标准定妆照,即Reference Image。后续的镜头并非将其视作一个无关紧要的参考,而是当作角色形象的约束条件加以运用。
在此基础阶段之上,系统另外设计了衣橱方面的能力,同一角色可以预先设置多套不同造型,像是日常穿着的服装,用于战斗时的服饰装扮,以及呈现受伤状态下的模样等,在进行服装切换操作期间,要尽力保证人物脸部以及整体特征处于稳定状态。
这件事的价值十分直接,那就是当你连续生成十几个镜头,甚至是几十个镜头的时候,角色依旧能够被识别为同一个人,而并非每个镜头都好像新建了一位演员一样。
2. 全链路连通:从剧本到成片在一个系统内完成
BigBanana 把漫剧制作拆成了四个连续阶段:
这套流程最为关键的意义所在,便是那角色设定,以及场景信息,还有镜头描述另外视频生成,它们不再于诸多不同平台之中分散开来。数据于系统内部持续不断地流转,从而减少重复输入,并且也减少风格以及上下文的丢失。
3. 关键帧驱动:把“碰运气”改成“先定义画面”
这部分是它比较有价值的设计。
处于传统文本生成视频范畴之内的问题,是创作者仅能够凭借一句描述来“猜”模型是不是理解了镜头,BigBanana相对而言更贴近于动画制作当中的关键帧思路。
要先去确定一下镜头开始之时所呈现的、那具体的画面,然后再去定义镜头结束之际所呈现的、那特定的状态,接着由人工智能在这两者之间去补齐那过渡性的运动。
这表明,创作者并非仅仅依靠语言去描绘“人物缓缓转身”, 而是能够确切地告知系统“转身之前呈现出怎样的模样”,“转身之后呈现出怎样的样子”。 中间的运动交由 AI 去处理, 然而镜头的边界以及结果是由人来把控的。
系统具备九宫格预览的能力,能使同一个镜头先产生多种构图方案,之后从中甄别出合适版本。相较于一次次地进行重生成,此种方式更适合用来提升有效产出率。
4. 本地数据存储:创意和素材不外流
浏览器的本地IndexedDB里保存着项目数据,它不依靠服务端存储,不管是剧本,还是设定,又或许是生成出来的画面,数据都优先留在本地设备当中。
对于那些团队而言,这些团队是需要处理原创内容的团队,这些团队也可是处理商业选题的团队,这些团队还能够是处理未公开IP的团队,这一点,它比“能不能多快生成”,同样是重要的。
5. 更接近生产系统,而不是一次性玩具
当下从事漫剧工作,目标并非 merely 做出一条视频,而是需考量这套内容能不能持续更新,能不能实现标准化,能不能达成复用,最终能不能造成系列化输出。
比如BigBanana这类全链路工具,其意义在于,它能使得单次创作效率,进一步朝着可复制的生产能力推进。其中,角色资产能够复用,镜头逻辑可以回溯,输出格式更为规范,整个流程对于长期从事内容创作的人而言更适配,而并非仅仅适用于偶尔尝试一次的人。
技术架构可以怎么理解?
BigBanana 的整体数据流大致可以分成三层:
输入层:故事文本 / 创意描述
↓
处理层:GPT-5.1 剧本分析 → Gemini 图像生成 → Veo / Sora 视频合成
↓
输出层:关键帧序列 + MP4 视频片段 → 导入剪辑软件继续制作
从实现上看,有几个设计点比较关键:
现在入场,另一个重要原因是政策窗口确实打开了
要是直至今日,依旧将微短剧视作早期那种野蛮生长的流量玩法,如此判断已然有些滞后了。过去一年所释放出的信号极为分明,监管方面以及行业并非只是在单纯地进行收紧,而是在规范得以确立的基础之上,促使优质内容以及完整的产业能力能够加速发展起来。
1. 国家层面:微短剧被放进更大的内容应用框架里
国家广播电视总局办公厅,于2025年1月,发布了“微短剧+”行动计划,其中做出提出了这样一些方向,有“跟着微短剧去旅行”,还有“跟着微短剧来学法”,以及“跟着微短剧来科普”,另外还有“跟着微短剧学经典”,甚至有“微短剧里看品牌”,更有“微短剧里看非遗”。
这说明几件事:
2. AIGC 层面:允许提效,但强调人主导和可审查
2025年,围绕AIGC参与影视创作展开公开讨论的时候,监管思路已然清晰。技术能够进入策划环节,技术能够进入制作环节,技术能够进入运营环节,技术能够进入推荐环节,并且的确可以提升效率。然而,创作主体依旧必定得是人,关于内容安全方面不能缺位,关于价值导向方面不能缺位,关于标识可审查能力方面不能缺位。
相反地,对于未来而言,真正具备竞争力的并非是那些能够更频繁制作出图片的,而是那些可以将工具,流程,审美以及合规能力相互结合起来的,并且能够稳定地产出内容的主体。
3. 地方层面:支持已经细化到制作链条各环节
从地方政策看,微短剧正在被当成新型数字内容产业来布局。
这背后所表明的并非是“政府帮你去做内容”,而是此赛道已然开始具备更为完备的资源配置现象。对于个人以及小团队来讲,未来从事漫剧创作将不再全然依靠独自拼搏。
4. 机会在扩大,要求也在抬高
因之,此间这个处于进行时态的阶段,最为贴近事实的行业变换情形并非“人人尽皆具备能够轻易成就爆款的能力”,却是:
正是由于这样的情况,存在着一套将剧本、角色、镜头、视频以及导出来展开串联的工作台,它比单个生成形式的模型,更具有所形成的价值。
三步开启第一部漫剧创作
第 1 步:在线访问
如果倾向本地部署,也可以通过 Docker 启动:
# 1. 克隆项目
git clone https://github.com/shuyu-labs/BigBanana-AI-Director.git
cd BigBanana-AI-Director
# 2. 启动服务
docker-compose up -d
# 3. 浏览器访问
# http://localhost:3005
# 查看日志
docker-compose logs -f
# 停止服务
docker-compose down
第 2 步:配置 API Key
启动之后,于引导页面当中填写AntSK API Key。要是还没有申请的话,能够前往https://api.antsk.cn/进行注册并且领取免费额度。
第 3 步:输入故事并生成分镜
进到“剧本与故事”的阶段,把你的创意或者故事内容输进去,再去点击生成分镜脚本。随后这个系统会接着完成角色生成,接着完成分镜绘制,接着完成视频合成。
哪些人会更适合使用它?身份可获得的价值
短视频创作者
更快做出连续剧情类漫剧,提升内容上新效率
