专题

sora到底懂不懂物理世界

当前，《sora到底懂不懂物理世界》专题栏目正在密切关注相关热点，汇聚互联网上的最新资讯，为读者揭示事件的全貌及其深层逻辑。本栏目将持续更新，致力于提供全面、及时的信息，满足公众对#sora到底懂不懂物理世界#资讯的关注。

文章基于OpenAI官方公布的Sora技术文档，从模型能力、训练方式和技术原理三个角度出发，剖析Sora的出现对人工智能的发展，到底意味着什么？...OpenAI最终想做的，其实不是一个“文生视频”的工具，而是一个通用的“物理世界模拟...

还记得2023年AI视频最出圈的片段吗？威尔·史密斯吃面，动作鬼畜，画面寂静：当时的视频大模型，只会动，不会说话。Sora的发布让视频质量飞跃、物理规则...如果说Sora是让AI看懂物理世界，那Veo3，就是让AI能“听懂”“会说”。

如果说 Sora 是让 AI 看懂物理世界，那 Veo 3，就是让 AI 能「听懂」,「会说」。看来，音画一体，将是下一轮视频模型竞赛的标配。文中视频链接：https://mp.weixin.qq.com/s/rJFwZ1lLiWzFLE7jd4jGyA 登录并发贴阅读下一篇/ ...

利用预训练视频生成大模型，让 AIGC 的魔力从数字世界走进具身智能的物理世界，就好比“机器人界的 Sora VPP 利用了大量互联网视频数据进行训练，直接学习人类动作，极大减轻了对于高质量机器人真机数据的依赖，且可在不同人形...

像Sora和Veo这样的生成式视频模型，本质上是神经物理引擎。...更令人惊讶的是，当将模型输入来自全新环境的初始画面时，视频世界模型依然能够生成高度真实、合理的机器人视频，这些视频在遵循微调期间学到的运动学规律的同时，还...

它们已经有了大量的用户和场景，我们才能尝试这个模型究竟怎么做。如果我们上就来做ToC，第一件事情就得是user ...姜大昕：你给它一个电影的开头，它能够一直往下编，并且大家认为还挺有道理的，连续、符合逻辑、符合物理规律。...

据悉，Veo 3对标OpenAI的Sora，具备生成视频的同时同步嵌入音效的能力。谷歌表示，Veo 3不仅可以...谷歌DeepMind产品副总裁Eli Collins表示：“从文字和图像提示，到真实世界物理效果与精准的唇形同步，Veo 3的表现都非常出色。...

对于最新的 Sora 等策略模型，也只用了 1 年时间，这就是规模扩展和数据驱动过程的力量。还记得一开始给你们看的视频吗？这个视频里没有一个真实像素，它完全是由定制模型...基本上可以给软件配备物理执行器，让它改变物理世界。...

当然，也有「人」会在这个「世界」里，发现一些蛛丝马迹。过去，我们每只手有七根手指，我记得很清楚。但现在我们每只手只有五根手指了。再...Hassabis介绍说，Veo 3之所以能有如此逼真的效果，是因为它已能推断复杂的物理现象。...