• 最新
黄仁勋再谈中国AI:DeepSeek和阿里通义千问是最好的开源模型|

以中国领先的开源模型阿里通义千问为例,今年以来其开源消息频传,从除夕夜开源全新的视觉模型Qwen2.5-VL,再到3月初发布并开源了全新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜,4月29日凌晨...

刚刚,阿里又开源了,超长上下文大模型|算法|ids|阿里巴巴集团|深度思考模型_网易订阅

阿里又开源新模型了,这次是通义千问文档团队带来的 QwenLong-L1-32B—首个通过强化学习训练、专为长上下文推理设计的大语言模型。解决的问题是: 大型推理模型(LRMs)通过强化学习(RL)展现出强大的推理能力,但局限于短上...

QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型

阿里通义千问 Qwen 团队昨日(5 月 26 日)发布 QwenLong-L1-32B 模型,是其首个通过强化学习训练的长文本情境推理模型(LRM)。

阿里发布通义千问QwenLong-L1-32B模型 长文本推理能力突破

阿里通义千问团队5月26日正式推出QwenLong-L1-32B模型,这是其首个通过强化学习训练的长文本情境推理模型(LRM)。该模型在七个长文本DocQA基准测试中表现优异,超越多个旗舰模型,性能与Claude-3.7-Sonnet-Thinking相当。...

英伟达开源多个代码大模型 以阿里通义千问为底座

《科创板日报》9日讯,英伟达近日开源其代码推理模型(Open Code Reasoning model),包括32B、14B和7B三个参数。记者了解到,该模型以阿里通义千问Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B为底座模型。(记者 黄心怡)

英伟达开源多个代码大模型 以阿里通义千问为底座_7x24小时财经新闻_新浪网

新浪财经为您带来:英伟达近日开源其代码推理模型(Open Code Reasoning model),包括32B、14B和7B三个参数。记者了解到,该模型以阿里通义千问Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B为底座模型。

阿里千问3登顶,开源模型掀起产业智能化新浪潮

千问3问世以前,该系列的推理模型为QwQ,非推理模型是Qwen2.5,现在推理和非推理能力合二为一。...为了适配不同场景需求,千问3同步开源了8款不同规模的模型版本,包括0.6B、1.7B、4B、8B、14B、32B密集模型,以及30B-A3B、235B-...

大公司日报|英伟达开源多个代码大模型 以阿里通义千问为底座

英伟达近日开源其代码推理模型,包括32B、14B和7B三个参数。财联社记者了解到,该模型以阿里通义千问Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B为底座模型。查看全文>> 2、iPhone产品线据称将大扩容:一年发两次新机 最多6款新品 ...

英伟达开源代码大模型 基于阿里通义千问底座

5月9日,英伟达宣布开源其代码推理模型,包含32B、14B和7B三个参数规模。据悉,这些模型基于阿里通义千问Qwen2.5系列底座构建,涵盖多个版本。此举旨在推动代码生成与推理技术发展.

阿里发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型

IT之家 5 月 27 日消息,阿里通义千问 Qwen 团队昨日(5 月 26 日)发布 QwenLong-L1-32B 模型,是其首个通过强化学习训练的长文本情境推理模型(LRM)。...重构训练框架,开源新方法:抛弃替代损失函数,仅需优化原始目标 ...

相关阅读