• 最新
挑战AI数学推理极限,大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%

最强AI模型面对5560道数学难题,成功率仅16.46%?背后真相大揭秘。香港中文大学、西湖大学、MAP、浙江大学、马克斯·普朗克智能系统研究所等机构联合推出FormalMATH形式化...形式化数学推理是人工智能领域公认的核心难题之一。...

喜讯|港中大(深圳)王本友教授团队在第二届人工智能数学奥林匹克竞赛获得金牌

数学推理能力不仅是衡量人工智能发展水平的关键指标,更是其解决复杂工程设计、金融建模等现实世界难题的基石。人工智能数学奥林匹克竞赛(AIMO)被认为是数学推理领域最难的测试之一,正是检验AI在该领域能力的试金石。若AI...

对话阶跃星辰创始人姜大昕:多模态模型还没出现GPT-4时刻,坚持追求「智能上限」

姜大昕觉得,现在最要紧的还是得想办法把 AI 的「智商」往上再拔一拔,不然离大家心心念念的 AGI(通用人工智能)还远着呢。在 DeepSeek R1 面世,以及大厂高调入场后,...比如解个奥数题、写段复杂的代码,这需要「慢思考」。...

大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%|

形式化数学推理是人工智能领域公认的核心难题之一。尽管大语言模型(LLM)在自然语言处理和代码生成等领域取得显著进展,但面对需要严格逻辑推导的数学定理证明任务时,其能力仍面临严峻挑战。FormalMATH基准测试 首次系统性...

通义灵码携手Qwen3,编程智能体上线,一键集成魔搭MCP广场!

这款智能体具备多项先进能力,包括自主决策、环境感知及高效工具使用,能够根据开发者的具体需求,灵活运用工程检索、文件编辑、终端操作等多种手段,一...在奥数水平的AIME25评测中,它获得了81.5分的高分,刷新了开源模型的纪录...

地平线发布L2城区辅助驾驶系统HSD,能否成为智能驾驶的「安卓」?

彼时业界热衷于云计算和人工智能软件算法创意,地平线却坚持从“边缘”切入,用软件+硬件的方式,为未来的机器人与智能汽车打造计算平台。...实现硬件可插拔、软件可升级,试图从源头解决辅助驾驶量产落地中最棘手的兼容性难题。...

阿里千问3登顶,开源模型掀起产业智能化新浪潮|甲子光年

如何兼顾性能与成本,成为每一个开发者与企业共同的难题。...在李飞飞领衔的斯坦福HAI研究所发布的《2025年人工智能指数报告》显示,2024年重要大模型(Notable Models)中,阿里入选6个,按照模型贡献度排名,阿里AI贡献位列全球...

小学六年真相:家长别被分数蒙了眼,忽略这3件小事耽误孩子一生|初中|奥数|中小学人工智能_网易订阅

小学六年真相:家长别被分数蒙了眼,忽略这3件小事耽误孩子一生,初中,奥数,小学六年真相,中小学人工智能

晓|当大语言模型遇上联邦学习:一场隐私与智能的双向奔赴

有的客户端计算能力强,能处理复杂的参数更新,而有的客户端(如边缘设备)可能连基本的训练任务都难以完成,就像让小学生和大学生一起参加奥数比赛,...联邦大语言模型的发展,本质上是一场隐私保护与人工智能发展的平衡探索。...

见谈|商汤绝影王晓刚:越过山丘,我如何冲刺智驾高地?蔚来|自动驾驶|智能驾驶|21汽车·一见auto_网易订阅

“人工智能公司擅长从0到1,因为聚集了一批非常优秀的工程师,但都很贵。...平台化方面,为了应对不同硬件平台与底层软件的适配难题,实现跨项目的经验共享,商汤绝影开发了一套工具链,包括中间件适配层和统一模型部署系统,前者...

相关阅读