- 首页>
- 正文
DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2025-2-25 14:31
#DeepSeek开源核心技术,寒武纪股价创新高# 北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对HopperGPU(一种英伟达GPU架构)开发的高效MLA解码内核,其...

好帖子,需要你的鼓励
评论0
请先登录后发表评论