AI做片子真的不用抽卡了:北京卫视贺岁片动画幕后全公开

Konten Video AsliPerluas Video
  • 欢迎来到三不五时!
  • 让我们一起探索AI创作的无限可能。
  • 灵活的选择让每位创作者都能拍出作品。
  • 这次的京城寻宝记充满了挑战与创意。
  • 期待未来AI与年轻创作者的更多合作。

Hello大家好,欢迎来到三不五时,我是傅博。今天丢一句狠的:

AI作片的真的可以不抽卡!

我们这次更像是在拍电影,先选机身再选镜头,还能换焦段,画面先变成可控。而这件事可能就是0后05后这代创作者最爽的一次上车机会,门槛从设备变成审美。谁会做选择,谁就能拍出作品。

我再给你两个片场级的外挂,直接把AI从碰运气变成能交付,从抽奖机变成摄影机。第一个是魔法棒,就我们看到画面的局部不对,别推翻重抽,圈一下就能改。

第二个是角度控制,像三维一样调机位调视角,让构图关系真的可控。

过去半年,其实我们偷偷干了这件事情,陪我们自己的AI agent一起看电影。我们投入了大量变形快幕的镜头样片,包括我们之前我做过的视频阐述,找过的影调参考,以及我们找到的许多镜头的测试素材,目的就只有一个:

别让AI就默认走这个球面镜头大光圈极浅景深的糖水路,而是生成有特质有风格的电影感。

这只本喵的京城寻宝记是我们继抖音奇妙业之后第三次和北京卫视一起做AIGC的探索,也是今年北京跨年晚会上的一个压轴传播物料。

这支片子真正的难点不是做一只猫,而是怎么把北京的真实空间拍好看。天气、时间、光、镜头,远一样都不能学远,这跟实拍一模一样。你不是在求AI给你一张图,而是你在布置一个空间,构建一个世界观,然后让它在这个空间里发生。

那先说一个前提,今年AI作品里猫很多,但我们又不想做一只就是又是一只可爱猫。我们想做是一只有性格、有任务、有表达欲的角色,它不是单一的吉祥物,它是精诚探索官

在AI里生成一只猫并不难,难的是生成一只有戏的猫。前提我们设了很多尝试,偏写实毛发真实,但容易像纪录片没性格;偏卡通有表情,但容易低优,可能压不住北京的厚重。

所以我们内部又用了一个特别朴素但极有效的方法,赛马机制,同一段设定,同一段情绪跑出一堆版本,让同事、朋友甚至是路人审美一起投票,就定下这次山花,保留了真实的毛发,但神态做了提炼。你也可以读到他的得意、惭愧、认真,他更像是一位三维动画片里的角色,能撑住叙事。

那为什么不数量?就很多人问,就你们的AI画面为什么没有那么AI?那我给最实在的答案是:

摄影机加镜头,相当于画面气质的底盘。

也像真实拍摄一样,先锁定摄影机的色彩倾向,锁定镜头的性格,它是变形宽焰幕,有椭圆光斑,有瀑布的焦外,可能边缘轻微的失真。特别关键的是,**TAPENOW这次更新了CameraControl,**它等于就我们过去写在提示词里的这个摄影机镜头数据库,直接做了更可视的选择器。

就你想要更硬朗锐利,那也许RAID,我们说8K超高分辨率超彩是你的更优选择;那你想要就是更接近胶片感,我们日常看到阿莱信以及直出的这种色彩,或者说它这样的一个影雕关系,你直接选。以前要写很长的提示词,那现在就像是选菜单一样点击。

那除了CameraControl,这次有两个工具也直接决定了我们效率的一个提升。第一是线稿规划,它在前期方便我们去完成脑包分镜,以前AI容易跑偏,本身是大家脑子里的画面,从文字发散到视觉,大家想象的画面并不一样。

那现在我们先用线稿把镜头骨架搭出来,就机会到底是辐射还是屏射,构图的主次在哪,猫虫哪进化,道具怎么摆。

我们其实是通过让AI发扇,先把镜头语言和场面调度锁死,再让AI往里填光影和材质,那出来的东西就并不是随机拼凑,而是被导演调度过。第二是这个smalledit AI的最痛,我觉得不是出不出图,而是差一点点就对了。

例如说猫的表情,它眼神差一点点,或者说它的爪子接触悬空,或者说它的伸长比例比较怪。以前只能废掉整张图重抽,还容易把好不容易抽到的电影氛围,或者说我们抽到这个镜头影雕的感受弄丢。那现在我们只要选中问题区,就局部重绘,把氛围保住,然后像修表一样,就可以把这个瑕疵一点点快速磨掉。这一步做到位,那AI就真正从这个创作玩具变成了一道工业流程。

那这条片子当中还有一个难点,就北京的真实空间,一开始跑出来非常的实,甚至有点像旅游照。那摄影指导在AI里的工作,我觉得是换了个打法,更靠审美去建立一套可持续的影调系统,一主光方向、统一空气密度、统一镜头语言,把照片提炼成影像。

举几个你能感受到的例子,就开场冬日清晨的北京,我们要的不是漂亮,是那口气冷清,但太阳一出来就有希望。那互动段落要轻快,但画面要刻字,杂志要像杂志海报,哑端留白,那些选择其实是在实拍里,摄影指导在做。

那美术也一样,其实真实北京非常容易翻车。就把真实的场景,我们要太实,它就很普通;太假,它就像旅游宣传片。所以前期我们做大量实物照片资产,有些实地拍,有些极准确的打卡照做参考。

你会发现一个很神奇的点,参考越准确,AI的还原一致性越高。

在静态过关以后,我们也分享大量没有用上的关键证,尤其像是这个猫的朋友圈这个主题,我个人还是蛮喜欢的,大家也可以弹幕来说说你最喜欢哪个猫。

静态过关以后,动态才是大考。像是雍和宫猫猫拜拜,猫猫喝茶,被烫到脏的表演。我们说图文去生视频,抽卡失败率会非常高,所以我们做了两件事情:

typenow它上线了这个动作迁移,我们通过真人先演一遍,把动作复制给猫,让表演成立。同时我们去实现一个模型赛马,同一个镜头或者同一类型镜头,我们通过不同模型,包括不同模型的这个大小版本都跑一遍。

这里必须点名CDash1.5Pro的强大,倒不是我们做了他的宣传片,而是更新速度快到离谱。我们在完成这次片子的几天里面,我们能感受到他每天更新或每半天更新。当我们早上试不出来,可能试了十几条的画面,下午再丢进去,你能够感受到在复测当中他的进化之快。

那其他的可能像是我们说动片静态画面,我们想要去完成这个画面里的更多细节,可能我们会使用到CDANCE,包括说可能像是猫希望说发挥一组动作,CDANCE表现也相当之不错。我们也期待着CDANCE 2.0,也许在动态自信动作控制,以及中间真的质量上,有机会把目前很多需要补丁解决的问题直接抹平。

当然就现实问题也要说回来,就不同模型的色彩科学和影调倾向不一样。

即便说我们用首尾真的方式去控制,即便说我们进到达芬奇里努力的去做色彩的匹配,但其实我们建议是,就同一段戏尽量还是用同一个引擎。我们说主镜头接特别近的时候,先统一底色,然后再去完成风格化。

那回到开头那句话,AI真的是0后05后的最大机会。因为这条片子很多主创年轻人,从导演组到美术的单身的伙伴,再到我们动态生成的伙伴,有两位都是05后。

我们可以看到说他们不怕,是更敢怪脑洞更猛,像猫和冰箱街互动,去完成这种微缩景观的方寸颠地。我觉得这是他们天然兴奋的东西,欧洲老人可能擅长的是把它拉回可控影调,头节镜奏,像片场一样去统一语言可能我们的主光在哪,空气多厚,镜头怎么切,情绪该收还是放。

可能这是我更擅长的一个位置。调片的导演Jerry,这也是一个零年的年轻人。于是我们形成一个新的分工模式。年轻创作者负责想象力与迭代速度,书方案、跑版本、不断迭代。美术负责空间资产和道具逻辑,让真实北京成立,让老朋友更动人。

那我们实拍团队里出来的导演、摄影,就负责镜头语言和气质统一,就是光影的气质,以及说整体的一个节奏的判断和把控。技术同学负责模型与流程的稳定性,去完成赛码和版本管理动态策略。

这不是AI替代学,而是AI帮助我们把每个人自己最值钱的那部分放大。那协助上我们这次也使用到TEPNO的协助画板,我们团队共用一个画板上进行协作,把定调图、这个猫的人物资产,以及说我们的参考照片、我们的提示词资产,包括说版本对比同步放在这样一个画板里,大家在同一套光影景深色彩元下推进,效率会高非常多。

那AI最花时间,我觉得从来不是生成,而是较劲。我们去磨细节,调角度、调关系,调一次性工具实施,帮助我们把较劲变成工业化流程,才能跑得更快。

收个尾,这条片子做完我最大的感受,包括说我们从之前的抖音创作的小助手到西淡1.5Pro的宣传片,我感觉就图像引擎其实已经非常接近可交付级别。就也在分享一些没有使用到的关键证,我们放大给大家看到其中的一个细节。

那接下来我就最值得期待的是动态视频大模型的一个再进化。**就分辨率、动作稳定性,以及说我们更细的表演控制上,**是这个动作迁移过来以后,视频画质其实他跟我们说首尾真纯图生做动态编辑以后他的画质,其实我觉得还是有可提高的空间。

但好消息是工具在进化,年轻人的创造力也在爆发。我觉得206年会更有意思,因为你会发现AI就更像是我们在片场里一样,去完成创作,选机、选镜头,不光做美术、控表演,只不过摄影机变成了AI引擎。

那如果你也在用AI做内容,我希望你记住一句话,也是我们探索下来的一个小心得:

不要让AI替你什么,你要替AI做选择!

这就是本喵的京城寻宝记的幕后分享。如果本期节目对你有所帮助,请一定一键三连,我们下期再见。