• 最新
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。...第三阶段则引入更大规模,更高质量的图像与视频描述数据,初步奠定模型对视觉内容的...

阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升

阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升 ...作者对比了随机掩码与基于困惑度(PPL)的难度导向掩码策略,也就是通过计算模型恢复掩码时的损失值(即困惑度),优先选择恢复...

360开源高质量图文对齐数据集!收纳1200万张图像+1000万组细粒度负样本,让模型告别“图文不符”

就在最近,冷大炜博士团队将这一“秘籍”开源:FineHARD高质量图文对齐数据集。该数据集主打两个核心特点:细粒度+难负样本。FineHARD是FG-CLIP模型背后的高质量图文对齐数据集,以规模化与精细化为特色,包含...常见数据集对比 ...

谷歌开源大模型评测工具LMEval,打通谷歌、OpenAI、Anthropic

据科技媒体The Decoder 5月26日报道,当天,谷歌正式发布开源大...在数据存储与隐私保护层面,LMEval将测试数据存储于自加密的SQLite数据库中,本地访问需密钥验证,有效阻断搜索引擎抓取,在数据使用过程中全方位保障数据安全与...

135 个项目、七大趋势:撕开大模型开源生态真相,你会怎么卷?

ChatGPT 和其他大语言模型的爆火,一度把「泼天的富贵」砸向了 向量数据库,一时间风头无两。但热潮也很快退去,发展趋势逐渐趋于平稳。最近两年,它们既没被「拍死」,也没卷出新高度,更多是以「相敬如宾」的姿态各自发展。...

135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?

向量数据库的每月 Star 增量变化 预测指出,技术「厚不厚」不是重点,关键是有没有持续迭代的范式空间。对向量数据库来说,短期看是稳定期,但中长期是否能迎来「第二曲线」,还要看 AI 生态新场景的开拓速度。发布现场的圆桌...

【万字长文】大模型开源开发全景与趋势解读

例如,向量化的存储、计算和检索是作为大模型应用接入领域知识的重要一环,一度给 Milvus、Qdrant 等垂类的向量数据库带来“泼天的流量”,而传统大数据系统也纷纷做向量化转型,蚂蚁的开源分布式数据库 OceanBase 也在去年...

AGI时代,数据库厂商如何破局

三、15年积淀,企业级分布式数据库能力已打下基础 这个势头正猛的国产数据库主力,经过15年的...杨传辉现场演示对比了OceanBase与业界主流的3款开源向量数据库,结果显示,OceanBase的跑分超过其他三大业界主流开源向量数据库。...

不玩噱头的北京,用数据和实力成就「全球开源之都」

几天前的5月6日,智源研究院在法国巴黎举行的GOSIM全球开源创新论坛上发布大型开源文本数据集CCI 4.0,为全球的大模型创新发展再次奉献出重要的开源资源。更早之前,4月21日,昆仑万维的SkyReels团队正式发布并开源SkyReels-V2...

具身智能必看!五大开源数据集核心要点全解析_Franka

接下来,文章重点介绍5家(1家国外+4家国内)主流的具身智能开源数据集:Open X-Embodiment、RoboMIND、AgiBot World、RH20T和AIRO。5家具身智能开源数据集基本情况梳理 一、Open X-Embodiment 1.基础内容 数据集名称:Open X-...

相关阅读