145
0转自 CCTV对话近日,OpenAI发布首个视频生成模型Sora,震惊全球。只需要输入一段文字,就可以生成效果炸裂的60秒视频。Sora生成的视频截图,图片来源:OpenAI官网OpenAI推出ChatGPT才过去一年多,就再度扔出一枚重磅 ...
|
转自 CCTV对话 近日,OpenAI发布首个视频生成模型Sora,震惊全球。只需要输入一段文字,就可以生成效果炸裂的60秒视频。
Sora生成的视频截图,图片来源:OpenAI官网 OpenAI推出ChatGPT才过去一年多,就再度扔出一枚重磅炸弹。 《对话》第一时间采访了大模型的开发者们及利用AI进行创作的创作者们,不仅有我们的老朋友360公司创始人周鸿祎、晶泰科技董事长温书豪,还有一些新朋友们,他们分别是“2023最火90后创始人”月之暗面创始人杨植麟、全网首档由AI生成的对话类短剧AI Talk主理人汗青、Stable Diffusion视觉模型师麦橘MERJIC,听听他们如何评价Sora?在短视频流行的今天,Sora的出现意味着什么?又将带来哪些影响? 1. 以什么心态面对Sora? 周鸿祎:我的心情是非常复杂的。我们在通向AGI的道路上,又达到了一个里程碑,应该感到高兴。但另外一方面,我有一种度日如年的感觉,人工智能现在到了一个寒武纪,生物大爆发的阶段。我也会非常地焦虑。AI上确实感觉又被美国同行拉开了之间的距离,我们国家大家怎么样能够发挥我们的新型举国体制(的优势),国家组织一些互联网巨头,大型平台互联网公司,聚集算力、聚集人才、聚集数据,揭榜挂帅,聚焦攻坚,争取未来花两三年的时间,在大模型核心技术上能够达到和超过OpenAI的水平。 杨植麟:Sora的出现速度比预想的快些。但出现这种级别的模型某种程度上是有预期的,所以更多的是让人兴奋。可以想象更强的模型也不会远,未来更精彩。 麦橘:惊喜两个字,突然间炸出来,当时看到确实非常震撼。对于我们创作者来说,其实它是一个能够降低门槛,能够让我们直接用创意去生成内容的一种技术,全新的一个技术革命。 温书豪:有人担心,有人焦虑,我非常的兴奋。Sora本身是对于物理世界的理解。我做的是通过人工智能做药物和材料的研发,就是要理解物理规律,它跟人之间的蛋白怎么相互发生作用,理解这些原子、电子基本的因果关系,我就可以设计新的分子,最终能够设计出完美的药物,我对此充满了期待。 汗青:与其被这些贩卖焦虑的流量所裹胁,不如做两件事情,踏踏实实冷静看一下,目前AI到底到了一个什么程度,想一想在这个年代,怎么能尽早用AI去做一些自我的表达。AI这一波的生产力工具的革新,特别容易让我想到很长时间以前,照相机刚出现的时候,画家开始也很焦虑,他们觉得有照相机了,就不需要我再给你画一张肖像了。几百年过去了,影响一个摄影作品的关键点是什么,还是你的审美。你想通过一个摄影作品表达出来内容的独特性,这件事情依然因为用相机的人不一样,造成了千差万别的区别。 前AI到底到了一个什么程度,想一想在这个年代,怎么能尽早用AI去做一些自我的表达。AI这一波的生产力工具的革新,特别容易让我想到很长时间以前,照相机刚出现的时候,画家开始也很焦虑,他们觉得有照相机了,就不需要我再给你画一张肖像了。几百年过去了,影响一个摄影作品的关键点是什么,还是你的审美。你想通过一个摄影作品表达出来内容的独特性,这件事情依然因为用相机的人不一样,造成了千差万别的区别。 2. Sora将颠覆的十大行业? 周鸿祎:Sora能做一分钟的模型,就能够去做60分钟的电影,会颠覆比如说影视业,游戏工业,短视频行业,电商行业,包括所有公司的传播。 杨植麟:Sora作为一个通用模型势必会改变和渗透到很多行业。目前来说像内容产业相关的短视频、广告视频、动画短片、特效影视、数字人、AR/VR和游戏行业等都会波及。某些行业里这类模型可能会很大程度上替代传统技术栈。后续也不排除在机器人和自动驾驶等特殊领域,它可以作为“世界模型”变成数据引擎的一环。 温书豪:如果把Sora,把脑机接口,以及把元宇宙联想到一起,可能颠覆的不只是几种或者几个产业,可能颠覆的是整个人类进入到一个新的阶段,到底什么是真实的世界,到底是什么构建的虚拟世界,人的思想怎么跟真正的AI产生的世界连接,这可能是未来生存发展的一个颠覆。 3. OpenAI会“杀死”创作者吗? 汗青:我觉得不会,人在思想方面,它的价值是不会被替代的,Sora这样的技术出来之后,其实是我们经常说的给创作者带来一种平权。AI的年代很可能是个体的内容创作者或者是小团队的个人创作者最好的黄金年代。在今天只要你有一个好的想法,你就能通过一些AI的技术,不再局限于一些专业的门槛或者费用的限制,能去做一个比较好的完整的内容出来。 麦橘:Sora完全不会颠覆我的事业,事实上我的事业就是因为有了AI以后,它才有的。自从AI出来以后,其实越来越多像我这样的人,我们没有技术背景,但是我们加入了进来,仅凭着我们的创意,我们的想法,我们的审美,就可以去做一些创意性的工作。我相信人还会继续扮演创意思考、文化洞察和情绪表达的关键角色。 画外音(记者):你会担心自己的赛道被巨头堵上吗? 麦橘:虽然担心竞争是自然的,但是我也更倾向于去看到这种变化带来的一种机会。因为其实巨头加入的越多,也是在进一步验证AI这个赛道是正确的,关键是我们怎么在这么庞大的一个全新的产业赛道上站稳自己的脚跟,找到自己的位置。 汗青:AI本身是一个生产力工具,提高的是生产效率,但是目前来说并没有影响内容的分发渠道。我举个例子,我们都认为《大话西游》是好电影,它最早在香港上映的时候,年度票房两部加起来就4000多万,这个体量应该连前五都排不进去。后来流行是因为过了几年之后,DVD作为一种新的载体跟渠道打入到内地大学生群体,大家重新发现,原来有一部很好的电影我们都不知道,叫《大话西游》。中间一些无厘头的梗才会流行、传播起来。你的内容好,不等于你的内容被更多人看到,在内容行业上酒香未必不怕巷子深。AI只是创作工具,接下来渠道上的变化会非常关键,这也是为什么国内外的AI从业者都非常关心像苹果的Vision Pro这样新的硬件产品。如果真能配合AI的这一波浪潮,带来一些流量跟渠道上的变化,才会真正改变用户跟内容之间的供给关系。 麦橘:我的理念是AI可以实现创作上的普惠+共创。普惠很好了解,让越来越多人去接触新的技术。我觉得一个人+一个AI,它是一个超级个体,这是一个新的概念。那么共创的意思就是,很多个超级个体一起去完成同一个事情,这肯定比以前一群人没有AI去完成同一个事情,能创作出更新、更好玩的东西。所以我很期待看到越来越多的人加入AI创作阵营,也期待看到越来越多的超级个体出现。 4. 半年后Sora能进化成什么样? 周鸿祎:Sora相当于是给人工智能加上了一双慧眼。自动驾驶,人形机器人,科学研究,在科学物理实验、化学实验、数学可视化方面会成为有利的工具。我觉得以后每个人都可以在自己的电脑上、在自己的网联车上、在自己的手机上,都可以用起一个小规模的大模型,成为我们个人的私人助理,帮助我们个人进行更好的知识管理、信息采集、信息获取。 杨植麟:Sora虽然效果领先,但也存在演进空间。比如从1分钟拓展到更长时间、增加声音模态来完成完备的多媒体、增加更多交互方式。Sora的终极目标是模拟世界,应该会持续提升对各种真实物理动态的建模能力。 温书豪:Sora本身它不是一个AI视频生成的一个工具,它是一个世界模拟器,我希望半年以后,它对这个世界的理解,它的逻辑关系,因果关系会变得更加完美。 5. 预测OpenAI还有哪些大杀器? 周鸿祎:Sora绝不是只做了一年的东西。OpenAI公布的工作原理实际上是揣着明白装糊涂,不可能让我们通过看它的工作原理去猜测出它的技术路线。我觉得它表面上看起来是一个文生视频更有力的工具,但它实际上更像一个物理世界的模拟器,它的地位不亚于GPT-3。GPT-3解决了机器对人的语言和知识的理解,Sora主要是让机器和世界之间,能够让机器对世界进行观察、进行感知,对世界的很多规律和常识进行总结、进行把握,才能模拟出这种真实的视频。我觉得Open AI手里应该有一个秘密武器没有披露出来,比如说GPT-5可能早就蓄势待发。上一次Open AI宫斗的时候,就无意中透露了他们在AGI就是通用人工智能方面有了一些突破,所以我也有时候感慨奥特曼是个营销大师,很懂得带节奏。谷歌每次想发一个新东西的时候,Open AI就扔出一个更有爆炸性的东西。 汗青:Open AI这家公司是定位了非常高的目标。这个目标其实Sam Altman自己说过,他们是在想象一个反对全视角的,甚至是有这种上帝思维视角的一个产品应该怎么样运作,然后这个过程间再去找各种各样应用的场景。所以我觉得OpenAI这家公司,和目前的这些,至少我们说视频领域同行对标的时候,已经完全不在一个层面了。我们有时候都会开玩笑说,会不会它本身不是想去做AI的视频生成,只是想做通用模型的路上突然看到有这么一个窗口,就出去按照它的逻辑把整个赛道卷了一遍,这是完全有可能的。因为今天我们看到它发布这些Sora视频测试的Demo里,我们惊讶的发现了很多东西,不光是稳定性时长,甚至发现它能够理解物理世界。它的技术文档里提到另外一个词,就是相对终极的理想,就是所谓的世界模型。很可能Open AI这家公司它的终极目标是用AI真的去模拟和再现一个平行的世界。 麦橘:它可能会以视频语义和三维世界的理解作为一个起点,回归到了深度学习,学习本质的探索中,以实现更加全面的知识体系。那么通过已有的这些多模态的工具,他们可能在未来会输出更加真实,更加强大,更加令人震撼、惊叹的一个人工智能成果。 【免责声明】本公众号发布的内容仅供学习交流使用,内容版权归原作者所有。如有侵犯您的权益,请及时与我们联系,我们将于第一时间删除内容。内容为作者个人观点,不代表本公众号立场和对其真实性负责。 |