• 最新
阿里发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型

阿里发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,算法,上下文,强化学习,学习训练,推理模型,阿里巴巴集团,深度思考模型,qwenlong

阿里千问3登顶,开源模型掀起产业智能化新浪潮

千问3同步开源了8款不同规模的模型版本,包括0.6B、1.7B、4B、8B、14B、32B密集模型,以及30B-A3B、235B-A22B两款MoE大模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能),...2024年重要大模型(Notable Models)中,阿里入选...

阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首

阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首,推理,金融,算法,大模型,阿里云,知名企业,dianjin

黄仁勋再谈中国AI:DeepSeek和阿里通义千问是最好的开源模型

以中国领先的开源模型阿里通义千问为例,今年以来其开源消息频传,从除夕夜开源全新的视觉模型Qwen2.5-VL,再到3月初发布并开源了全新推理模型QwQ-32B,在...DeepSeek的出现以及通义千问的系列开源产品极大推动了国际大模型的开源...

小米MiMo-VL多模态大模型开源,性能超越阿里Qwen2.5-VL-72B引关注

小米公司近日通过其官方公众号“Xiaomi MiMo”震撼宣布,已将旗下多模态大模型—Xiaomi MiMo-VL,正式向全球开源。此次开源的版本中,MiMo-VL-7B的强化学习(RL)前后模型,以及支持超过50项任务的框架,均已在GitHub上亮相。...

Deepseek更新模型、马斯克星舰试飞失败、阿里开源长文本思考模型丨本周全球前沿科技动态

3.阿里开源长文本思考模型,登Huggingface热榜。1 Deepseek更新R1,...AI从业者表示,DeepSeek-R1-0528此次依然是基于原来的V3的基础模型进行训练,但性能提升明显,而且蒸馏的小模型还能打败更大模型,证明了后训练的无限潜力。...

小模型媲美大模型,阿里通义开源「推理+搜索」预训练新框架

小模型媲美大模型,阿里通义开源「推理+搜索」预训练新框架,预训练,大模型,智能体,推理+搜索,阿里巴巴集团,深度思考模型

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题

推理大模型开卷新方向,阿里开源 长文本深度思考 模型 QwenLong-L1,登上HuggingFace今日热门论文第二。其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等,取得与Claude-3.7-Sonnet-Thingking相当的性能。除测评分数外,...

AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速...

本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增

登顶开源大模型榜首 阿里Qwen3成色如何?聚焦

阿里千问大模型官网用“思深,行速”来描述Qwen3,是指Qwen3 是中国公司...开放传神(OpenCSG)联合创始人陈冉认为,通义大模型的出现充分验证大模型领域金律“模型天天变,不变的是数据沉淀“,也再次证明开源是技术创新的压箱石...

相关阅读