• 最新
谷歌AI技术革新引领行业突破,深度解析多模态模型与全家桶布局_Gemini

最新于2025年5月举行的谷歌I/O大会,集中展示了其在多模态模型、生成式AI、搜索升级以及硬件融合等多方面的深度布局,标志着公司在AI技术革新方面迈出了关键性步伐。这场盛会不仅强调了“从研究到应用”的转变,更深层次地揭示...

谷歌Gemini2.5Pro引领AI技术革新,深度解析多模态突破

近期,谷歌提前发布的Gemini2.5Pro版本成为行业关注的焦点,其在编码能力和视频理解方面的突破,彰显了AI技术领先优势,也为未来多模态AI的发展树立了标杆。这一系列创新不仅彰显了谷歌在深度学习和自然语言处理领域的深厚积累...

谷歌推出开源医疗AI模型MedGemma 助力多模态医疗分析与诊断

中文科技资讯精选摘要:在2025年I/O开发者大会上,谷歌发布了开源模型MedGemma,专注于多模态医疗文本与图像理解。

谷歌推出LMEval开源评测框架,统一评估大模型与多模态模型

谷歌近日推出了一款名为LMEval的开源评测框架,旨在为大型语言模型及多模态模型提供统一的评估工具。此前,由于各大厂商采用不同的API、数据格式和评测标准,跨模型的性能对比往往耗时且难以实现。LMEval的出现有效解。

谷歌推出 LMEval:统一评估大语言与多模态模型的新工具

中文科技资讯精选摘要:LMEval 是谷歌发布的开源框架,用于简化和标准化大型语言及多模态模型的评估,支持跨平台模型对比,提供增量评估和可视化分析功能。

谷歌Gemma AI模型下载突破1.5亿,多模态技术引发热议与期待_Llama_

总之,谷歌Gemma AI模型的成功下载量突破1.5亿次,不仅是技术层面的胜利,更是开发者社区对其多模态功能认可的体现。随着技术的不断进步,Gemma无疑将在未来的人工智能市场中扮演更加重要的角色,期待其能带来更多颠覆性的创新...

2025年中国多模态大模型行业模型现状 图像、视频、音频、3D模型等终将打通和融合【组图】

理想中的“Any-to-Any”大模型,Google Gemini、Codi-2等均是处于探索阶段的方案,其最终技术方案的成熟还需要在各个模态领域的路线跑通,实现多模态知识学习,跨模态信息对齐共享,进而实现理想中多模态大模型。现阶段产业...

谷歌联合创始人:AI将重塑搜索与多模态交互未来

此外,布林还谈到了谷歌在多模态交互方面取得的最新进展。他描绘了一个场景:用户不仅可以使用文字或语音提问,还可以上传图片或播放声音,让 AI 结合多种信息来源进行理解和回应。回顾谷歌早期推出的智能眼镜项目 Google ...

多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa

国内团队打造纯扩散多模态大模型 LLaDA-V,理解任务新 SOTA 谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍 简单来说,为了使预训练的扩散模型能够感知视觉输入,LaViDa 的做法是使用一个视觉编码器将视觉...

中国自研AI实现历史性突破 云从科技超越谷歌OpenAI登顶多模态榜首

来源标题:中国自研AI实现历史性突破 云从科技超越谷歌OpenAI登顶多模态榜首 近日,云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中,以80.7分的综合成绩登顶榜首。这一成绩不仅刷新了国内AI...

相关阅读