开云kaiyun
距离 OpenAI 亮出 Sora 这张王牌,一经快一个月了。
东西么,是一直没大范围洞开使用,但热度,却从来不缺。
归正光是靠着在 TikTok 上更新 Sora 的视频, OpenAI 的官方账号就一经涨了数十万粉。
像什么搞房屋蓄意。
外星东谈主在纽约化身 gai 溜子。
博物馆一镜到底。
还有一男一女在铁磁流体餐厅里赛博约聚。
望望这丝滑进程,比拟之下,蓝本那些被吹上天的 “AI 视频老网红们 ” ,若干有点汗流夹背了。
有网友锐评:xx 刚出来的时候很感动,当今怎么不敢动了?
其实吧, Sora 的那些友商们,并没大伙儿想得这样怂包,他们的更新频率未必还更快了。
世超致使合计,经由 Sora 这样一番轰炸, AI 视频生成的战场,才果然热了起来。
先是 Stability AI 带头发起冲锋,把 Stable Video 拿出来公测,接着包括 Pika 、谷歌还有阿里在内的好几家公司,也都坐不住了。
咱也先讲讲剑走偏锋的两位,阿里 EMO 和 Pika 。
他们没剿袭和 Sora 硬刚,而主打对口型,基本等于明牌示意各人: “ 你们以后用 Sora 生成的视频,不错用我来配音对口型噢 ~~ 。
就拿 EMO 为例,上传一张相片和一段音频,就能让相片里的东谈主启齿唱歌、言语。像什么小李子唱 Rap ,还有蒙娜丽莎启齿言语都不在话下。
望望这个 Sora 皮衣女士,一启齿便是乐坛老炮儿了。
另外,跟 EMO 发布差未几时候,国内的 Pika 也小小更新了一波。
新上了个 Lip Sync 功能,说白了便是给视频配音对口型。
当今分币不花就能用,但揣度太多东谈主把就业器给干崩了,世超每次都卡在了终末一步。。。
但通常都是对口型, EMO 的效果昭彰要比 Pika 强不少。Pika 的口型固然是对上了,但左证创作家 @ 数字生命卡兹克的测试,言语的时候嘴照旧没关节幸免乱动的纰缪。
寻找配音、对口型这种 AI 视频生成范围的小切口,确乎是一种念念路。
通常,为了和 Sora 打出各异化,以色列有家公司,就在内测一个叫作念 LTX Studio 的 AI 电影制作平台。
而他的念念路则是:大而全。
左证官方的说法,它能生成跳跃 25 秒的视频,但最蹙迫的,它把视频生成、裁剪、旁白配音一条龙全给包了。
就比如生成个画面你不是很舒心,那你不错切个机位或者换个晴明,或者把画面里的东西给换掉。
格外是,官方宣称能保证扮装的一致性。
以往的文生视频,保不都上一帧照旧吴彦祖,下一帧可能就酿成宋小宝了。
要是 LTX Studio 真能把扮装一致性给处理,那世超是真 respect 。
而谷歌就更夸张了,堪称是搞了个寰球模子 Genie ,这玩意儿能左证一张相片或者几句粗造的描述就生成一个 2D 游戏出来。。。
固然画质有点耳不忍闻,但光凭一张图片就能系数这个词凭空寰球出来。
尽然对谷歌照旧激将法更管用。
不外,上头提到的这几个诓骗世超险些都没法上手,独一便捷躬行体验的,唯独 Stability AI 他们家藏了四个多月的 Stable Video ( 下称 SV )。
而也和上头几个避 Sora 矛头、主打多样各异化的老哥不同,Stable Video 是完饱和全正面受敌。。
先给大伙儿回忆回忆,其时的 demo 是这样的。
模子才调评估,还跳跃了 Runway 和 Pika 。
是以此次在 Sora 的节骨眼上发布公测,大伙儿还挺期待 SV 能狠狠将 Sora 一军。
但当世超上手试了试之后发现,是我不懂事了。。。
在 SV 官网,有图像生成和翰墨生成两个剿袭,我平直把跟 Sora 阿谁火出圈的视频教导词喂给了 AI 。
它先是左证教导词,生成了四张图像让我选。
接着,再手动把镜头通达的形貌也建立下,等个额外钟,就能生成一条 4 秒的视频。
但不知谈模子抽哪门子的风,配景全是乱的。
世超换了种镜头通达形貌又试了一次,脸部、配景变形愣是一样没落下。。。
难谈是因为教导词太难了?
不信邪的我又换了几组绵薄的,倒是也有像样的。
但十个里起码七个都翻车了,致使还有在图像生建树运行发癫的,我说城门楼子,他生成胯骨肘子。。。
这样说吧,SV 给我的嗅觉便是能跟 Runway 和 Pika 打个平手,但 Sora ,照旧算了吧。
不外测试看多了之后,世超发现 Sora 其实也并莫得各人伙儿传得那么不行额外。
有外媒记者在拿到内测履历浅试一波之后,挑升发了篇著述吐槽, Sora 生成的视频让山公长出了鹦鹉的尾巴,
还有海外 up 主,拿 Sora 生成了有六根手指头的东谈主。。。
一句话追念便是,Sora 对物理寰球的好多东西还清醒不了,何况生成速率慢得离谱。
何况经 Sora 这样一搅合,系数这个词 AI 视频圈子是愈加活跃了,保不都下次谁家更新又来了波大的。
世超也合计,搞不都会和大语言模子圈儿一个样, OpenAI 抛玉引玉, AI 视频生成范围的效能大爆发就在咫尺。
对了,世超终末还想问一嘴开云kaiyun, Sora 到底什么时候才能上手啊?