• 最新
郑纬民院士:国产大模型训练亟需“类CUDA”系统,生态构建成关键

首先,他建议构建类似CUDA的国产系统,以降低开发者的学习成本,并通过习惯的迁移来重塑生态体系。这一策略旨在减少开发者在切换硬件平台时的障碍,从而推动国产芯片在AI领域的广泛应用。其次,他强调要不断提升国产卡的硬件...

院士郑纬民:需要加快研发国产类CUDA系统

对此,郑纬民院士建议从两方面突破:一方面构建“类 CUDA”系统,确保降低开发者学习成本,通过习惯迁移重塑生态。另一方面提升国产卡硬件性能,即便起步晚、进程难,只要性能基本达标,配合生态优化,仍可吸引用户。他表示:...

中国工程院院士郑纬民:国产芯片需打造类CUDA生态

对此,郑纬民建议从两方面突破,一方面构建“类CUDA”系统,确保降低开发者学习成本,通过习惯迁移重塑生态;另一方面提升国产卡硬件性能至国外同类产品的60%以上(若达 70%~80%更佳),即便起步晚、进程难,只要性能基本达标...

郑纬民院士:国产芯片生态构建,类CUDA系统成关键?

首要任务是构建类似CUDA的国产系统,以降低开发者的学习成本,并通过熟悉的开发环境促进生态的重塑。其次,需不断提升国产芯片的硬件性能,即便进程艰难,只要性能达到国际同类产品的60%至80%,并辅以生态优化,便有望吸引用户...

清华大学郑纬民:国产芯片核心问题并非硬件质量而是生态薄弱;需要加快研发国产类CUDA系统和基础软件

对此,郑纬民院士建议从两方面突破,一方面构建“类 CUDA”系统,确保降低开发者学习成本,通过习惯迁移重塑生态;另一方面提升国产卡硬件性能至国外同类产品的60%以上(若达 70%~80%更佳),即便起步晚、进程难,只要性能...

郑纬民:需要加快研发国产类CUDA系统和基础软件

对此,郑纬民院士建议从两方面突破,一方面构建“类 CUDA”系统,确保降低开发者学习成本,通过习惯迁移重塑生态;另一方面提升国产卡硬件性能至国外同类产品的60%以上(若达 70%~80%更佳),即便起步晚、进程难,只要性能...

郑纬民院士呼吁加快研发国产类CUDA系统和基础软件

5月17日,2025搜狐科技年度论坛在北京举行。清华大学计算机系教授、中国工程院...郑纬民建议构建“类CUDA”系统以降低开发者学习成本,并将国产芯片性能提升至国外同类产品60%以上,同时集中资源开发核心软件,推动国产化进程。

斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好,翻倍碾压原生PyTorch,华人主创

这些内核是用纯CUDA-C编写,无需使用CUTLASS和Triton等库和DSL(Domain-Specific Language,领域专用语言)。不同于传统方法的是,模型并不是一上来就直接改代码,而是先用自然语言生成优化思想,然后再将这些思想转化为新的...

斯坦福意外用AI生成超强CUDA内核 性能好得出奇!华人主创

这些内核是用纯CUDA-C编写,无需使用CUTLASS和Triton等库和DSL(Domain-Specific Language,领域专用语言)。不同于传统方法的是,模型并不是一上来就直接改代码,而是先用自然语言生成优化思想,然后再将这些思想转化为新的...

斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创

这些内核是用 纯CUDA-C编写,无需使用CUTLASS和Triton等库和DSL(Domain-Specific Language,领域专用语言)。不同于传统方法的是,模型并不是一上来就直接改代码,而是先用自然语言生成优化思想,然后再将这些思想转化为新的...

相关阅读