• 最新
真碾压Sora了,谷歌Veo 3首次实现音画同步

还记得2023年AI视频最出圈的片段吗?威尔·史密斯吃面,动作鬼畜,画面寂静: 当时的视频大模型,只会动,不会说话。Sora的发布让视频质量飞跃、物理规则建模进步巨大,也直接引爆了整条赛道。Runway、Pika、Luma、Kling、...

让四郎开口唱“朕EMO啦”硬刚Sora的国产AI视频工具爆红!

Sora引发新一轮AI视频生成浪潮,国内大厂中为什么频频出圈的是阿里?“头号AI玩家”进行了一番探究。让四郎开口唱上春山,阿里EMO模型上线通义App 一张图片就能生成唱歌视频了!想听玛丽莲梦露唱《科目三》?安排!想让《甄嬛...

真碾压Sora了!谷歌Veo 3首次实现音画同步,视频模型开口说话

还记得 2023 年 AI 视频最出圈的片段吗?威尔·史密斯吃面,动作鬼畜,画面寂静— 当时的视频大模型,只会动,不会说话。Sora 的发布让视频质量飞跃、物理规则建模进步巨大,也直接引爆了整条赛道。Runway、Pika、Luma、Kling...

中国大模型火出圈 行业内外共花香

中国大模型飞速发展的这几年,尽管有“百模大战”的阵势,但中国AI企业难免时不时被追问:中国什么时候能做出自己的ChatGPT、自己的Sora?而此番中国大模型火出圈,极大地提升了行业“士气”。“这次实际上是把海外对中国大...

叫板Sora出圈后,Luma AI如何接住泼天的流量?36氪专访

Barkley对《智能涌现》表示,团队在Sora同款DiT架构的基础上,采用了独家改进的架构,保证生成效果的同时,还节省了训练和推理成本。视频模型“Dream Machine AI”的发布时间,2024年6月13日,踩中了视频模型赛道的空白点—这...

人大高瓴教授为Sora吵起来了-The Paper

网络结构参考了大语言模型,核心技术是面向图像生成的扩散Transformer(DiT)。Sora具备极强的可扩展性,并能够刻画世界交互行为或进行数字模拟,体现出模型的涌现性。其局限性是仍不能把握更为广泛的物理场景。第二个学术报告...

Sora出手后,它的同行们都咋样了?-The Paper

在 SV 官网,有图像生成和文字生成两个选择,我直接把跟 Sora 那个火出圈的视频提示词喂给了 AI。它先是根据提示词,生成了四张图像让我选。接着,再手动把镜头运动的方式也设置下,等个十分钟,就能生成一条 4 秒的视频。但不...

炸场的Sora和冷静的同行-The Paper

然而,第一个出圈的还是 Sora,核心依然是它远超预期的效果。以往几秒钟的 AI 视频,给人的感觉还是「会动的图片」,而 Sora 则展现了对真实世界的理解力和还原力,还有对虚拟场景的充沛想象力。Sora 官网发布的几十个视频 ...

Sora降临,影视圈要被抢饭碗了?-The Paper

另一方面,任何一个产品想要持续迭代形成巨大影响力,就必须能够商业化,而Sora在影视圈的商业空间足够大。美国旧金山早期投资人Zak Kukoff预测,一个不到5人的团队将在5年内用文生视频模型和非工会的劳动力,制作一部票房收入...

深度|Sora开启AI牛顿时代?-The Paper

从OpenAI官网公布的Sora技术报告中可以发现,Sora采用的DiT架构的理论基础是一篇名为Scalable diffusion models with transformers的学术论文。该篇论文是2022年12月由伯克利大学研究人员、现Sora团队技术领导William(Bill)...

相关阅读