• 最新
珠海格力申请模型部署专利,实现将复杂操作系统设计的AI推理框架适配到嵌入式设备

基于自定义中间件在无操作系统环境下加载并运行目标模型,实现了将为复杂操作系统设计的AI推理框架适配到资源受限、操作系统简化的嵌入式设备上,同时保证高效的内存利用率和推理性能。天眼查资料显示,珠海格力电器股份有限...

大幅提升AI推理速度:UCLA与Meta AI联合推出d1框架

中文科技资讯精选摘要:UCLA与Meta AI研究人员推出的d1框架通过强化学习显著提升了扩散式大语言模型(dLLMs)的推理能力。

后训练时代AI如何深度推理?产学研齐聚这场论坛共探未来

形成反事实数据增强、动态语义干预、混合策略强化学习等关键技术,研制支持数学推理、复杂决策等跨领域场景的鲁棒推理框架。该研究实现了数学推理准确率...未来将深化通算融合架构与开源工具链建设,赋能千行百业智能化转型,引领...

清华李涓子团队:让推理模型学会何时思考;上海AI Lab提出“视觉代理强化微调”大模型论文

在这项工作中,清华大学软件学院长聘副教授、机器学习课题组负责人龙明盛团队提出了一个统一框架—RLVR-World,其利用可验证奖励强化学习(RLVR)来直接...为了开发 RRM,他们推出了一个强化学习框架,其无需明确的推理轨迹作为...

英伟达Blackwell GPU助力AI推理速度飞跃,达成千TPS/用户新高度

英伟达进一步解释说,Blackwell架构与Llama 4 Maverick级别的超大规模语言模型完美适配,这得益于其专为大型语言模型推理加速设计的EAGLE3软件架构。...过去应用层点划这种主要交互形式很可能会被一个AI agent根据语音口令后自动...

英伟达 Blackwell GPU 刷新 AI 推理速度世界纪录,实现 1000 TPS/User 里程碑

为实现该突破,工程师团队采用基于 EAGLE3 的软件架构。该架构专为大型语言模型推理加速设计,与 GPU 硬件架构形成协同效应。IT之家注意到,测试结果显示 Blackwell 架构已完全适配 Llama 4 Maverick 级别的超大规模语言模型。...

2025边缘AI芯片架构争霸赛:GPU、NPU、FPGA谁将领航?

这场变革的核心动力来自于智能终端设备、工业物联网以及实时决策需求的激增,它们共同推动了底层架构的革新,使得传统算力分配模式面临严峻挑战。...恩智浦收购AI芯片初创公司Kinara,则聚焦于强化其在高性能AI推理领域的能力。...

AI巨头新品亮相Computex 2025 争霸生态整合与AI推理市场

针对企业级AI推理市场,英伟达还推出了RTX PRO服务器,最多可配置8张Blackwell RTX Pro Graphics 6000卡以及英伟达网络技术,完全兼容AI企业软件平台,个人工作站 DGX Spark也将从7月起发售。在机器人赛道上,英伟达更新了机器...

为AI推理和专业工作站量身定制 英特尔发布锐炫Pro B60/B50专业显卡

【天极网DIY硬件频道】5月19日,英特尔在Computex 2025上推出了为专业人士和开发者设计的全新图形处理器锐炫Pro B系列,包含锐炫Pro B60和锐炫Pro B50 GPU,搭载了为AI推理和专业工作站量身...在Linux上支持容器化的软件栈...

英伟达TensorRT AI推理加速登陆GeForce RTX,性能倍增引期待!

此次更新意味着GeForce RTX全系列显卡用户将能够享受到TensorRT AI推理加速框架带来的极致性能提升。据悉,TensorRT for ...而全新Windows ML推理框架的推出,通过ONNX Runtime构建,与各硬件厂商优化的AI执行层实现了无缝衔接。...

相关阅读