• 最新
不玩噱头的北京,用数据和实力成就「全球开源之都」

北京的底气在于,这里集聚了全国AI的顶尖学者,清华、北大等高校成为大模型“技术母体”,智源研究院则被称为AI界的...2024年4月,北京市围绕“人工智能+”战略又推出8大举措,宣布对大模型、通用智能体等项目最高奖励3000万元。...

生成未必理解:基于扩散模型能否实现视觉世界模型报告-北京大学(袁粒)_OpenAI_Plan

同时,视频生成领域也不断发展,OpenAI发布的Sora开启了AI视频生成的新阶段,但目前该领域开源项目较少。2.视觉生成与理解的现状及问题:视觉生成模型(如Diffusion系列)和视觉理解模型(如LLaVA系列)在建模方式和参数规模上...

北京大学(袁粒)生成未必理解:基于扩散模型能否实现视觉世界模型报告_统一_Video_问题

在生成方面,Open-Sora Plan等项目致力于视频生成等多模态生成任务,且这些工作大多开源。3.实现生成和理解统一的探索:面临诸多问题与挑战。视觉理解和生成的Encoder在短期内难以统一,长期统一则需解决压缩和对齐问题;对于...

Sora上线百余天,AI视频生成赛道卷成什么样了?

距离 OpenAI 在 2024 年 12 月正式向付费用户推出 Sora 服务,已经过去了一百多天。...从当前的几十秒到数分钟,甚至未来可能触及更长的叙事单元,例如前不久 英伟达、美国斯坦福大学等机构的联合团队就基于测试时训练生成了 具有...

清华、北大团队推出“安卓智能体”训练评估框架AndroidLab;Meta提出视频生成加速方法AdaCache|大模型日报...

Sora 强调了视频生成在开发遵循基本物理定律的世界模型方面的潜力。然而,视频生成模型在没有人类先验的情况下纯粹从视觉数据中发现这些规律的能力可能会受到质疑。学习真实规律的世界模型应能预测细微差别,并正确推断未见...

优才面对面|北大深圳研究生院袁粒:推动技术普惠与创新-The Paper

数月前的憧憬,如今正逐步变为现实…今年3月,北京大学博士生导师、北大深圳研究生院助理教授袁粒及其团队发起Sora复现计划—“Open-Sora”。袁粒透露,当前,Open-Sora Plan已初步实现视频生成功能,并向公众全面开放,无需...

北大领衔开源复现Open-Sora,生成10秒高清视频,支持华为AI芯片|编码器|open|视频文件_网易订阅

这期间,北京大学和兔展智能在三月份联合发起了开源项目 Open-Sora-Plan,旨在通过开源框架重现 Sora,训练一个包含无条件视频生成、类视频生成和文本、视频生成等技术的模型。就在昨天,Open-Sora-Plan v1.0.0 正式推出,显着...

超10秒高分辨率,北大Open Sora视频生成更强了-The Paper

今年 3 月初,北大团队联合兔展启动了 Sora 复现计划—Open Sora Plan,该项目希望通过开源社区的力量复现 Sora。项目上线一个月,星标量已经达到 6.6k。项目地址:https://github.com/PKU-YuanGroup/Open-Sora-Plan 技术报告...

再谈复现 Sora:被仰望与被遗忘的-The Paper

据不完全统计,国内已有近 10 支团队在复现 Sora,让我们拭目以待。先于 DiT 的技术架构创新 Sora 使用的 DiT(Diffusion Transformer)架构目前来看是其最大的技术创新,但追溯来看,也许国内相关的进度更早一些。U-ViT 架构 ...

围攻光明顶:Sora效应下的AI视频生成竞赛-The Paper

北大团队发起了一项Sora复现计划—Open Sora,希望集结开源社区的力量,尽可能完成对Sora的复现。这个初始团队一共有13人:带队的是北大信息工程学院助理教授、博导袁粒和北大计算机学院教授、博导田永鸿等人。消息一经公布,...

相关阅读