• 最新
联想重磅发布两款智能体 多模态交互重构人机协作新范式

联想天禧AI生态春季新品超能之夜在上海举办,联想重磅发布了天禧和想帮帮两款智能体,面向年轻客户发布全场景AI终端,更为大学生群体发布了量身定制的“青春有AI”教育特惠计划。5月8日,以“热AI自发光”为主题的联想天禧AI...

“农田监测评价多模态AI智能体平台”首次亮相

“农田监测评价多模态AI智能体平台”首次亮相-\

腾讯开拓智能体大模型落地路径,谷歌/微美全息引领AI协同多模态应用开启新篇

获悉,在近日举行的2025腾讯AI产业应用峰会上,腾讯(TCEHY.US)深入探讨在打造智能体(Agent)产品过程中的技术细节与设计逻辑,揭示了腾讯在这一新兴领域进行布局。腾讯指出,在智能体产品的开发中,特别...谷歌重磅发布多模态新模型 ...

智能体大潮汹涌,但留给天工和阶跃们的时间不多了

随后的 5 月 22 日,昆仑万维发布基于 AI Agent 架构的 Office 智能体—天工超级智能体,产品整体转向文档办公场景。...3D 模型生成等细分方向都有开源项目发布,放弃短期内 C 端用户爆发的目标,把资源押在基础模型和「多模态 ...

研究人员设计多模态通用智能体,性能超过Claude计算机代理等系统

近期,美国明尼苏达大学与伊利诺伊大学芝加哥分校等联合团队提出并实现了一个名为 InfantAgent-Next 的通用型多模态智能体系统,其能够通过文字、图像.

文心智能体平台推动AI+文旅创新:长城数字守城与多模态交互突破_智能化_文化_内容

在新一轮AI智能化浪潮中,文心智能体平台的创新应用再次彰显国产大模型在多模态理解和行业场景融合中的突破。北京日报社携手百度推出的“长小城”AI智能体,结合了文心大模型的强大算力和丰富内容IP,为长城文化注入了数字化新...

开放式验证码:解读MBZUAI团队多模态LLM智能体测试平台|

2025年5月,来自MBZUAI(穆罕默德·本·扎耶德人工智能大学)VILA实验室和MetaAgentX的研究团队发表了一篇题为《Open CaptchaWorld:A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents》...

SCIENCEBOARD:评估科学工作流中的多模态自主智能体

这篇论文探讨了如何评估多模态自主智能体在真实科学工作流中的表现,为人工智能辅助科学研究开辟了新的方向。论文由Qiushi Sun、Zhoumianze Liu、Chang Ma等多位研究人员共同完成。有兴趣深入了解的读者可以通过arXiv平台访问...

让模型像o3一样动手搜索写代码!Visual ARFT实现多模态智能体能力

团队发布了全新的多模态智能体评测基准:MAT(Multimodal Agentic Tool Bench),专门评估多模态工具调用能力: 这一基准填补了当前开源模型在「多模态智能体以及工具调用」方面的评估空白。图 3.MAT 数据标注过程。MAT-Search...

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

团队发布了全新的多模态智能体评测基准:MAT(Multimodal Agentic Tool Bench),专门评估多模态工具调用能力: MAT-Search:包含 150 道多跳视觉问答任务,人工标注+搜索推理;MAT-Coding:包含 200 道复杂图像问答任务。模型...

相关阅读