• 最新
DeepSeek-R1模型升级 推理能力显著提升

这一提升源于模型思维链的深度优化:旧版平均每题消耗12K tokens,新版则增至23K tokens,表明其在解题过程中进行了更详尽的逻辑推导和多步验证,显著减少了跳跃性思维导致的错误。此外,DeepSeek开发团队通过蒸馏R1升级版的...

腾讯团队:如何用自然语言增强大模型定理证明?

受到R1等推理专用模型成功的启发,研究团队在系统提示中鼓励模型在 标签中封闭其推理过程,以激励更详细的推理行为,然后要求模型以\

烜翊数智申请基于活动块的架构模型活动图快速设计更新验证方法专利,提高活动图更新的效率与准确性

国家知识产权局信息显示,烜翊数智(上海)科技有限公司申请一项名为“一种基于活动块的架构模型活动图...通过智能扩展、逻辑生成和布局算法,自动推导节点间的依赖关系和控制流路径,确保活动图在设计过程中的一致性和准确性。...

决策能力暴增500%!语言模型微调技术突破

不过这些语言模型在决策过程存在显著缺陷:模型能推导正确策略却无法执行(knowing-doinggap,纸上谈兵),过度偏好短期高回报选项(greediness,贪婪选择),较小模型还会机械重复常见动作(frequencybias,频次偏见)。...

西门子股份公司申请用于监控离心机的专利,可根据推导出的运行模式自动得出分离过程信息

在分离过程的进程中,取决于时间得出驱动器的多个变量和参数,并且由驱动器的变量和参数的相互关系,推导出离心机运行的周期的运行模式(I、II、III、IV),并根据推导出的运行模式自动得出关于分离过程的信息。天眼查资料显示,...

谷歌与ISTA研究院联合推出大模型高效数据筛选新方法

这个问题与当今大型语言模型(如ChatGPT背后的模型)的训练极为相似。研究人员面临着从海量数据中选择哪些数据来训练模型的难题。...这种方法对梯度下降(GD)和Adam优化器都有效,研究团队为这两种优化器都推导了最优权重公式。...

DeepTheorem创始人:如何用自然语言提升大模型定理

受到R1等推理专用模型成功的启发,研究团队在系统提示中鼓励模型在 标签中封闭其推理过程,以激励更详细的推理行为,然后要求模型以\

清华与新加坡国立团队:大模型推理增强会加剧幻觉吗?

这表明后两类模型在训练过程中实际上丧失了部分不确定性表达能力。这就像一个学生,他不仅答错了题,更糟糕的是他不知道自己不知道—他失去了对自己知识边界的感知能力。相比之下,经过完整训练流程的模型则保留了这种\

DeepMind揭惊人答案:智能体就是世界模型!跟Ilya 2年前预言竟不谋而合

为了探寻这个答案,研究者们推导出了一些算法,能够在已知智能体策略和目标的情况下恢复其世界模型。这些算法补全了规划和逆强化学习的三位一体关系。规划:世界模型+目标→策略 逆强化学习:世界模型+策略→目标 研究者提出的...

李飞飞对话a16z:LLM是有损压缩,世界模型才是真正重要方向,应用远超机器人

李飞飞指出,相比于语言,空间感知才是人类进化过程中更为古老而本能的能力。她分享了一段亲身经历:数年前因角膜受伤导致短暂丧失立体视觉,在那段时间里,她不敢独自驾车,哪怕是熟悉的...纯靠语言,不可能推导出这类几何构造。...

相关阅读