太平洋科技智造

首页 > 智造 > 通信半导体> 正文

英伟达优化 DeepSeek-R1 性能大提升成本降 20 倍推理升 25 倍

科技阿诚整合编辑：太平洋科技发布于：2025-02-28 17:42

英伟达在 Blackwell 架构上对 DeepSeek-R1 进行了优化，推出了 DeepSeek-R1-FP4 并开源。这一优化成果显著，B200 推理性能相比 H100 提升 25 倍，每 token 成本降低 20 倍。

在精度与性能平衡方面表现出色，FP4 精度下能在 MMLU 通用智能基准测试中达到 FP8 模型性能的 99.8%。

同时，实现了硬件与软件的协同优化，充分发挥 Blackwell 架构硬件运算潜力，通过软件精细调优提升系统整体性能。

此外，DeepSeek 持续开源多个英伟达 GPU 优化项目，包括 FlashMLA、DeepEP 和 DeepGEMM 等，共同探索模型性能极限。

近期，AI 大模型领域掀起降价潮，DeepSeek 也推出错峰优惠活动，其持续火爆引发国内外科技巨头关注。

在大模型行业竞争日益激烈的当下，算法优化与迭代成为关键因素。

英伟达 DeepSeek-R1 优化性能成本

科技阿诚

评论点赞0 +1 收藏+1

原创栏目

【硬件编年史】窥见台北电脑展 AI&VR双管齐下

硬件编年史

硬件编年史

从平平无奇到各领风骚，显卡外观设计大盘点

硬件编年史

硬件编年史

经典IP！蜘蛛侠宇宙有多少惊喜是你不知道的

硬件编年史

硬件编年史

【硬件编年史】那些年我们一起折腾过的DIY硬件

硬件编年史

硬件编年史

IT百科

iOS闪退修复工具

AI大数据教你把妹儿？都是送人头的低俗趣味

我在双11买杜X斯的秘密怎么全网都知道？

收藏！买买买之后最该看的网购维权指南

比炒鞋更狂的炒盲盒

还去淘宝买iPhone有锁机？华强北的卖家都哭了

三餐都吃外卖的你，知道商家的套路有多野吗？

终于！AI开始对这届大学生们“下手了”

网友评论

聚超值•精选

1
2
3
4

推荐手机 笔记本 影像硬件家居商用企业出行未来

意见反馈回到顶部