• 最新
效率飙涨177%!清华、蚂蚁联合开源全异步RL新成果,8B/14B模型斩获同尺寸SOTA|异步|模型|训练_新浪新闻

难能可贵的是,AReaL-boba²在开源代码、数据集、脚本及SOTA级模型权重的基础上,新增了详细教程与深度文档,帮助开发者更便捷地使用与定制上述研究成果,并提供了对多轮智能体强化学习(Multi-Turn Agentic 强化学习)训练的...

阿里又开源两款Qwen3模型!拿下文本嵌入模型SOTA,技术报告公布

Qwen3-Reranker 4B模型同样具备32k的上下文长度,它通过多项架构增强提升...Qwen3-Reranker 4B模型在AIME25(美国数学邀请赛)评测中得分为81.5,刷新了开源模型记录,展现出强大的数学推理能力,能够处理复杂的数学问题,进行...

阿里又开源两款Qwen3模型!拿下文本嵌入模型SOTA,技术报告公布

Qwen3-Reranker 4B模型同样具备32k的上下文长度,它通过多项架构增强提升...Qwen3-Reranker 4B模型在AIME25(美国数学邀请赛)评测中得分为81.5,刷新了开源模型记录,展现出强大的数学推理能力,能够处理复杂的数学问题,进行...

开源即屠榜!UniME多模态框架登顶MMEB训练榜,刷新多项SOTA纪录

开源即屠榜!UniME多模态框架登顶MMEB训练榜,刷新多项SOTA纪录,样本,屠榜,多模态框架,eb训练榜,深度思考模型

智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

BGE-Code-v1在两个基准上均以显著优势超越谷歌、Voyage AI、Salesforce、Jina等商业/开源模型,登顶SOTA。BGE-VL-v1.5:通用多...基于zero-shot设置(未使用MMEB训练集),BGE-VL-v1.5-zs在MMEB基准中刷新zero-shot模型最佳表现;...

新晋开源顶流模型 Llama 3.1 被开发者赞爆!小扎拿苹果“开刀”反对闭源厂商:AI 不要“苹果税”ai|开源...

“如今,几家科技公司正在开发领先的闭源模型,但开源正在迅速缩小差距。Meta 首席执行官马克·扎克伯格说道,“今年,Llama 3 与最先进的模型相媲美,并在某些领域处于领先地位。给扎克伯格底气的就是刚刚正式发布的第一个...

UC伯克利LLM准中文排行榜来了!GPT-4稳居第一,国人开源RNN模型冲进前六_Claude-v_

【新智元导读】现在大语言模型们也要像王者荣耀/LoL/Dota这些游戏里的玩家一样打排位赛了!前段时间,来自LMSYS Org(UC伯克利主导)的研究人员搞了个大新闻—大语言模型版排位赛!这次,团队不仅带来了4位新玩家,而且还有...

浪人早报|英伟达发布新一代AI加速卡、马斯克开源Grok1大模型、中外专家签署北京AI安全国际共识…

马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。其开源所遵循等许可证允许用户自由地使用、修改和分发...

昆仑万维正式开源Matrix-Game:从图像出发构建可控交互世界,重塑交互式世界生成标杆

昆仑万维长期关注空间智能的新进展,经过不懈的技术研发,今天正式开源Matrix-Game,不仅刷新了交互式世界生成的技术,也为构建通用虚拟...未来,昆仑万维将持续投入前沿技术与基础模型研发,并且坚定开源SOTA级别模型回归社区。...

定位地球上的每一个物体:新一代遥感目标检测开源工具LAE-DINO_数据_VisGT_模型

在2025年3月,清华大学、浙江工业大学及苏黎世联邦理工大学等多家机构联合推出了一项名为LAE-DINO的开源项目,旨在加速遥感领域的开放词汇目标检测。这一创新性研究发表于第39届人工智能年会(AAAI 2025),提供了强大的工具,...

相关阅读