• 最新
2025年中国多模态大模型行业模型现状 图像、视频、音频、3D模型等终将打通和融合【组图】

多模态大模型的模型路径 多模态大模型的探索正在逐步取得进展,近年来产业聚焦在视觉等重点模态领域突破。理想中的“Any-to-Any”大模型,Google Gemini、Codi-2等均是处于探索阶段的方案,其最终技术方案的成熟还需要在各个...

小米开源多模态大模型MiMo-VL:70亿参数的强力新星

​​核心事件:​​ 小米公司已于 ​​2025年5月30日​​ 通过其官方公众号「Xiaomi MiMo」正式宣布开源其强大的多模态大模型 ​​MiMo-VL-7B​​ 系列...​​VL-RewardBench(评估视觉语言联合任务奖励建模):​​ MiMo-VL-7B-RL ...

众数信息科技申请基于多模态大模型的船舶与海洋工程辅助设计方法专利,通过智能化手段提升工作效率

金融界2025年5月31日消息,国家知识产权局信息显示,众数(厦门)信息科技有限公司申请一项名为“一种基于多模态大模型的船舶与海洋工程辅助设计方法”的专利,公开号CN120070673A,申请日期为2025年04月。专利摘要显示,本...

小米多模态大模型MiMo-VL开源,官方称多方面领先Qwen2.5-VL-7B

IT之家5月30日消息,XiaomiMiMo官方公众号今日发文宣布,小米多模态大模型XiaomiMiMo-VL现已正式开源。官方表示,其在图片、视频、语言的通用问答和理解推理等多个任务上,大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B,并且在...

若愚科技取得基于多模态大模型的具身智能任务规划器训练相关专利

金融界2025年5月30日消息,国家知识产权局信息显示,深圳若愚科技有限公司取得一项名为“基于多模态大模型的具身智能任务规划器训练方法及系统”的专利,授权公告号CN118036750B,申请日期为2024年03月。天眼查资料显示,深圳...

云从科技从容大模型登顶全球多模态评测榜首 中国AI首超国际巨头

近日,云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中,以80.7分的综合成绩登顶榜首。https:...

支付宝申请利用多模态大模型处理多模态数据方法及装置专利,提供处理多模态数据的方法

本文源自:金融界金融界2025年5月30日消息,国家知识产权局信息显示,支付宝(杭州)信息技术有限公司申请一项名为“利用多模态大模型处理多模.

奥运攻关技术创新联合体在北京成立,将建全球最长智能跑道、首个国人运动人体专业多模态大模型

【奥运攻关技术创新联合体在北京成立,将建全球最长智能跑道、首个国人运动人体专业多模态大模型】成立仪式上,国家体育总局体育科学研究所与近 60.

小米MiMo-VL多模态大模型开源,性能超越阿里Qwen2.5-VL-72B引关注

小米公司近日通过其官方公众号“Xiaomi MiMo”震撼宣布,已将旗下多模态大模型—Xiaomi MiMo-VL,正式向全球开源。此次开源的版本中,MiMo-VL-7B的强化学习(RL)前后模型,以及支持超过50项任务的框架,均已在GitHub上亮相。...

多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa

国内团队打造纯扩散多模态大模型 LLaDA-V,理解任务新 SOTA 谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍 ...唯一的主要区别是:它的注意力掩码是非因果式的,并且它使用的建模目标是如下扩散语言建模目标,...

相关阅读