设为首页 | 加入收藏 |
咨询热线:52452488
产品列表
联系我们
电话:

手机:

传真:
邮箱:
地址:
Sora不止生成视频而是模拟世界

Sora不止生成视频而是模拟世界

[来源:未知]  [作者admin] [日期:2024-02-21 03:14] [热度:]

  近日,OpenAI正式发布文本生成视频AI模型Sora,着实给了打工人一个巨大的开年惊喜,生成视频的效果很“炸裂”尊龙人生就是博d88,不仅画质清晰、细节到位尊龙人生就是博d88,人物表情和视角也无限逼近于专业水准。不管是不是视频相关从业者尊龙人生就是博d88,看到Sora的强大,也不得不惊叹一句恐怖如斯尊龙人生就是博d88!

  据官网介绍尊龙人生就是博d88,Sora可以通过文本指令直接生成60秒以内的视频,在此之前的视频生成模型一般只能生成15秒以内的视频。在官网给出的示例中尊龙人生就是博d88,人物的瞳孔、睫毛、皮肤纹理,都逼真到看不出一丝破绽。

  “文生视频”并不是Sora的首创,在此前也有Fliki、Runaway、Pika等数个文生视频模型,CGTN把Sora官网提供的提示词,输进了另外几款“文生视频”模型中,对比分析发现尊龙人生就是博d88,Sora生成画面的真实度、空间感和细节呈现等方面明显强于其他模型。

  目前市面上文生视频模型的主流技术路线主要有两种:一种基于Transformer模型的技术路线尊龙人生就是博d88,即从文本及图像中生成,另一种则是基于扩散模型(Diffusion model),如 Runway尊龙人生就是博d88尊龙人生就是博d88。Sora则结合了Diffusion和Transformer模型,通过扩散模型(DALL-E3)和转换器架构(ChatGPT)组合尊龙人生就是博d88,Sora不用预测序列中的下一个文本,而是预测序列中的下一个“Patch”。

  这意味着Sora是基于patch而非整个视频进行训练尊龙人生就是博d88,类似ChatGPT用Token处理文本一样处理视频尊龙人生就是博d88,因此,Sora可以高效处理更多的数据,输出质量也会更高,较于Runaway和Pike等模型可以更逼真地模拟物理世界。

  在OpenAI官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示尊龙人生就是博d88、静止图像甚至填补现有视频中的缺失帧来生成视频,多视角的视频自然也不在话下尊龙人生就是博d88。

  OpenAI在官网中介绍,Sora不是一个单纯的视频生成模型,而是能够理解和模拟现实世界的模型的基础,称之为world simulators(世界模拟器),将视频生成作为帮助 AI 理解真实世界的工具。训练 AI 理解和生成一个真实的场景或者世界,视频只是从某一个视角观察这个场景的一段时空尊龙人生就是博d88,建立起AI对世界的认知。

  或许我们可以理解为尊龙人生就是博d88,AI吸收数据,通过Sora生成物理世界的影像,并逐渐理解物理世界,最终准确、真实地对物理世界进行反馈和互动尊龙人生就是博d88尊龙人生就是博d88。终极目标应该是具身智能体尊龙人生就是博d88,而视频生成只是过程中的一部分尊龙人生就是博d88。这也是Sora与其他文生视频大模型的本质区别之一尊龙人生就是博d88。

  在Sora技术报告中尊龙人生就是博d88,展示了Sora的多项能力,例如Sora可以在语言建模尊龙人生就是博d88尊龙人生就是博d88、计算机视觉和图像生成等多个领域展现了显著的扩展属性尊龙人生就是博d88。以下图像分别是在1倍训练量尊龙人生就是博d88、4倍训练量、16倍训练量的情况下所输出的视频质量尊龙人生就是博d88。

  另外,Sora具有较强的语言理解能力,通过标注模型和ChatGPT对文字处理后尊龙人生就是博d88尊龙人生就是博d88,Sora能够更准确遵循用户的指示,尽可能减少错误和误差尊龙人生就是博d88。

  Sora也能够将视频向前或向后延长时间。下面数个视频都是从生成的视频片段开始向后延长的尊龙人生就是博d88。虽然这几个视频的开头各不相同,但最终都会达到相同的结局。

  Sora技术报告最后总结道,当在大规模上训练时尊龙人生就是博d88,视频模型展现出许多有趣的新兴能力尊龙人生就是博d88。这些能力使得Sora能够模拟现实世界中人类、动物和环境的某些方面。这些属性并没有任何针对3D尊龙人生就是博d88、物体等的明确归纳偏见——它们纯粹是规模效应的现象。例如3D一致性、长距离一致性和物体恒存性,甚至模拟数字世界等能力。

  这些能力表明,持续扩展视频模型是朝着开发高度能够模拟物理和数字世界及其内部的物体、动物和人类的有希望的道路。

  如果说Sora的能力能够让普通人感到惊奇,业内人士受到的冲击则会更加震惊尊龙人生就是博d88。AI的进化速度远超预期,AIGC极具破坏性创新的潜力,现有的产业格局如短视频、广告尊龙人生就是博d88、游戏、影视行业等产业格局一定会被重塑尊龙人生就是博d88,给行业带来巨大的改变。

  就像360董事长周鸿祎所说:“Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。”周鸿祎甚至预言AGI实现将从10年缩短到1年,这也是业内人士对Sora感到震撼的缩影之一尊龙人生就是博d88。

  诚然,Sora本身还并不完美,无法将现实世界中的所有信息都精确掌握,在展示视频中也经常出现违背物理规则的内容,例如玻璃碎裂的因果过程尊龙人生就是博d88、四条腿的蚂蚁等等。

  但Sora所展现的技术里程碑具有更重要的意义。对内容创作来说,降低了视频创作的成本尊龙人生就是博d88,可以通过对Sora的提示和编辑为广大短视频用户提供更具视觉冲击力的画面。

  对于广告公司尊龙人生就是博d88、视频制作公司等视频行业从业者来说尊龙人生就是博d88尊龙人生就是博d88,Sora探索了生成视频的高质量路径,今后的从业模式将会有较大的改变和优胜劣汰。

  对AI行业的公司来说,Sora则是帮助他们节约了巨大的探索成本和指明了前进方向,就像ChatGPT爆火之后国内外涌现的众多AI创业团队尊龙人生就是博d88,Sora也为AI的发展提供了新的挑战和机会尊龙人生就是博d88。

  Altman在推文中表示:“我们认为,世界对AI基础设施的需求尊龙人生就是博d88,包括芯片制造能力、能源供给、数据中心等,已经远远超过了目前的建设计划。”

  OpenAI的野心尊龙人生就是博d88尊龙人生就是博d88,超过了当前世界大多数人的想象边界,Sora固然神奇,但和ChatGPT一样,仅仅只是个开始。

  「数字经济先锋号」是成都数联产服科技有限公司旗下数字经济研究交流平台。围绕数字产业、数字基建、数字治理、数字生态等数字应用领域,揭示与记录数字经济发展点滴与脉络。

  数联产服是一家数字经济行业智库、产业大数据服务商,具备全流程大数据治理-分析-决策支撑服务能力,面向各级政府和产业运营机构提供基于大数据的产业经济发展解决方案和综合服务。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

关键字:防海生物装置