• 最新
国内SaaS公司失败的最主要原因:错误地追求了Growing 而不是Scaling

实际上,SaaS公司要追求的,根本就不是增长,而是扩展(Scaling)。因为追求增长很难盈利,而通往盈利之道的,只能是扩展。因此,所有SaaS企业都必须明白:增长和扩展是有区别的,二者背后对应的决策和行动也是截然不同的。...

刚刚,DeepSeek首曝V3降成本秘诀,软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程,揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈,实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验,还为未来AI硬件与模型...

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器-The Paper

来自法国索邦大学、苹果的研究人员开展了原生多模态Scaling Laws的研究,表明早融合优于后融合,多模态MoE好于密集模型。论文链接:https://arxiv.org/abs/2504.07951 研究表明,后融合架构相较于不依赖图像编码器的早融合架构...

突破大模型推理瓶颈!首篇「Test-Time Scaling」全景综述

随着大模型训练成本急剧攀升、优质数据逐渐枯竭,推理阶段扩展(Test-Time Scaling,TTS)迅速成为后预训练时代的关键突破口。与传统的「堆数据、堆参数」不同,TTS 通过在推理阶段动态分配算力,使同一模型变得更高效、更智能...

早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗?

机器之心PRO·会员通讯 Week 19-本周为您解读 ②个值得细品的 AI&Robotics 业内要事-1.早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law.

突破大模型推理瓶颈!首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道

随着大模型训练成本急剧攀升、优质数据逐渐枯竭,推理阶段扩展(Test-Time Scaling,TTS)迅速成为后预训练时代的关键突破口。与传统的「堆数据、堆参数」不同,TTS 通过在推理阶段动态分配算力,使同一模型变得更高效、更智能...

后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述|

此外,包括低秩适应(LoRA)、适配器和检索增强生成(RAG)在内的 scaling 技术也可提高计算效率和事实准确性。这些策略加上分布式训练框架,促进了大规模部署,并进一步提高了 LLM 在不同应用中的可用性,见下图 1。通过这些...

千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈

对此,千寻智能具身智能部负责人解浚源表达了自己对“具身智能 Scaling Law”的看法。“对于机器人来说,现在的规模仍处于 Scaling Law 里非常早期的状态。解浚源解释道,“尽管赛道火热,但相较于大模型公司来说,大家的规模...

机器人的「物理图灵测试」,英伟达大牛演讲揭秘具身Scaling Law_

1.英伟达机器人部门主管Jim Fan在AI Ascent上演讲,介绍了解决通用机器人问题的第一性原理,包括训练机器人AI的数据策略、Scaling Law和物理API。2.他提到,物理图灵测试是评估机器人和AI通过模拟真实场景和指令的能力,目前...

AI长身体,直接做实验!自主通用科学家,科研界的Scaling Law来了

AI长身体,直接做实验!自主通用科学家,科研界的Scaling Law来了,科学,实验,物理学,生物学,机器人,人工智能,诺贝尔化学奖

相关阅读