论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 23阅读
  • 0回复

[业界新闻]NVIDIA A100计算卡新变体现身闲鱼 含7936个核心 比原版多15% [复制链接]

上一主题 下一主题
 

发帖
4808
今日发帖
最后登录
2024-05-04
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-04-16 15:39:37
  根据最近的零售清单,英伟达似乎正在中国销售核心数量高于原始规格的A100"安培"图形处理器。这并不奇怪,中国市场上总会充斥着各种奇特的产品供我们观赏和探索,比如我们看到NVIDIA旗舰产品Ada Lovelace SKU的移动版通过转接板被改头换面成台式机型号,或者RTX 4090 GPU的原型散热器。现在,中国市场上出现了英伟达A100 AI GPU的新变体,其规格甚至还优于原始设计。 V5S6?V \  
G'WbXX  
  让我们先快速回顾一下NVIDIA的A100s。该GPU基于安培架构,有40 GB和80 GB两种不同配置,在内存和速度方面各有差异。两款GPU产品都具有6912个CUDA内核,但新推出的型号的内核数为7936个,比以前的型号多出15%,与完整的GA100 GPU(8192个内核)相比,减少了2个SM。 V*1-wg5>  
9[Xe|5?c  
  新的英伟达Ampere A100 GPU还配备了96 GB HBM2E内存和6144位总线接口,这意味着我们将看到6个8-hi堆栈,每个模块的容量为16 GB。根据列表中提供的图片,该显卡采用PCIe外形,是最初为GRID系统设计的原型设备。 xZ>@wBQ  
gutf[Ksu  
  该显卡有三个8针连接器和一个巨大的GPU,GPU位于一个巨大的IHS下方。内存芯片不在PCB上,而是在GPU封装上,因为该显卡基于HBM,而不是消费级显卡上常见的传统GDDR DRAM。 P B"nf|pm  
~Ut?'}L( d  
  基本时钟速度为1260 MHz,提升时钟速度未提及,但GPU可产生约20 TFLOPs的单精度计算能力和10 TFLOPs的双精度计算能力。作为参考,A100 PCIe 80 GB的单精度计算能力为19.5 TFLOPs,双精度计算能力为9.74 TFLOPs。 .5+5ca  
1-?TjR  
  现在,这种差异背后的原因还不能完全确定,但这可能是英伟达为特定客户量身定制的解决方案,虽然GPU早在2020年就已生产,但现在却出现在市场上。在eBay上还可以找到一些相同的A100 96 GB型号的列表,分别在这里和这里。该GPU的售价约为1.7万至2万美元。 G[\3)@I