fbpx
维基百科

安培微架构

安培微架构Ampere)是NVIDIA于2020年5月发布的一个GPU架构。用以取代圖靈微架構(Turing microarchitecture)。命名為「安培」以向法國物理學家安德烈-馬里·安培(André-Marie Ampère)致敬。Ampere架构拥有晶体管达540亿,是三星8nm级芯片。[1]是世界上晶体管最多的晶片,直到後來被蘋果M1 Max擊敗[2]

Nvidia Ampere
制造工艺
历史
前代产品
后继产品
  • 愛達·勒芙蕾絲英语Ada Lovelace (microarchitecture)(消费)
  • 霍普英语Hopper (microarchitecture)(专业)

硬件 编辑

  • NVIDIA A100 Tensor Core GPU基于NVIDIA Ampere架构,是针对 AI、数据分析和 HPC的GPU[3]
  • DGX A100系统集成8个NVIDIA A100 Tensor Core GPU、有着320GB内存,拥有NVIDIA Mellanox® HDR 200Gbps互连以及5Petaflops 的AI性能。[4]
  • DGX SuperPOD是140台DGX A100系统运用MellanoxHDR 200Gbps InfiniBand互连技术组成的一个集群,AI计算能力达到了700Petaflops。[5]
  • NVIDIA EGX™ A100是NVIDIA于2020年5月发布的基于Ampere架构的一款边缘AI平台。[6]
  • NVIDIA GeForce 30系列
    • GeForce RTX 3050
    • GeForce RTX 3060
    • GeForce RTX 3060Ti
    • GeForce RTX 3070
    • GeForec RTX 3070Ti
    • GeForce RTX 3080 10GB
    • GeForce RTX 3080 12GB
    • GeForce RTX 3080Ti
    • GeForce RTX 3090
    • GeForce RTX 3090Ti

核心配置 编辑

核心代号 GPC SM/GPC 每个SM含有的各类核心 制程 显存支持 芯片面积(mm2 晶体管数(亿个)
单精度浮点核心 双精度浮点核心 32位整数核心 张量运算核心 光线追踪核心 纹理映射单元
GA100 8 16 64 32 64 4 - 4 台积电 7nm HBM2 826 542
GA102 7 12 128 - 1 三星 8nm GDDR6X 628 283
GA104 4 GDDR6 393 174
  • 在作为计算卡专用的GA100核心中,和其前身一样,每个SM中安排有32个双精度浮点核心;在作为非计算卡使用的GA102等核心中,这些双精度浮点核心被替换为两倍数量的单精度浮点核心。由于单精度浮点核心事实上作为绝大多数游戏的流处理器,因此单个SM表观流处理器数量达到上一代的2倍,RTX 3070的流处理器数量达到近6千个,接近上代旗舰RTX 2080 Ti;但相应的,用单精度浮点核心模拟双精度的效率并不高,因此游戏显卡的双精度浮点计算速度(主要作用于挖矿深度学习等应用)相较上代并没有明显提升。
  • 晶体管密度:GA100使用台积电7nm制程达到约6600万/mm2,GA102、GA104使用三星8nm制程达到约4500万/mm2,而上代的图灵全系列均使用台积电12nm制程,仅达到约2500万/mm2
  • A100显卡中每个SM私有的L1/共享内存容量达到了192KB,相比于前代V100显卡的128KB增加了1.5倍。

记录 编辑

2020年7月,根据MLPerf基准测试结果,NVIDIA宣布安培打破16项世界纪录,包括加速器的八项基准测试和集群DGX SuperPOD的八项。[7]

參考資料 编辑

  1. ^ . www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. (原始内容存档于2022-05-09) (中文(中国大陆)). 
  2. ^ . [2021-10-20]. (原始内容存档于2022-05-09). 
  3. ^ . www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. (原始内容存档于2021-03-18) (中文(中国大陆)). 
  4. ^ 性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. (原始内容于2020-05-21) (中文(中国大陆)). 
  5. ^ NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. (原始内容于2020-05-21) (中文(中国大陆)). 
  6. ^ 英伟达正式发布7nm安培GPU:八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. (原始内容于2020-05-21) (中文(中国大陆)). 
  7. ^ NVIDIA安培打破16项世界纪录:一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. (原始内容于2020-08-01) (中文(中国大陆)). 

外部链接 编辑

安培微架构, 此條目可参照英語維基百科相應條目来扩充, 2022年7月21日, 若您熟悉来源语言和主题, 请协助参考外语维基百科扩充条目, 请勿直接提交机械翻译, 也不要翻译不可靠, 低品质内容, 依版权协议, 译文需在编辑摘要注明来源, 或于讨论页顶部标记, href, template, translated, page, html, title, template, translated, page, translated, page, 标签, ampere, 是nvidia于2020年5月发布的一个gpu架. 此條目可参照英語維基百科相應條目来扩充 2022年7月21日 若您熟悉来源语言和主题 请协助参考外语维基百科扩充条目 请勿直接提交机械翻译 也不要翻译不可靠 低品质内容 依版权协议 译文需在编辑摘要注明来源 或于讨论页顶部标记 a href Template Translated page html title Template Translated page Translated page a 标签 安培微架构 Ampere 是NVIDIA于2020年5月发布的一个GPU架构 用以取代圖靈微架構 Turing microarchitecture 命名為 安培 以向法國物理學家安德烈 馬里 安培 Andre Marie Ampere 致敬 Ampere架构拥有晶体管达540亿 是三星8nm级芯片 1 是世界上晶体管最多的晶片 直到後來被蘋果M1 Max擊敗 2 Nvidia Ampere制造工艺台積電 7 nm 专业 三星 8 nm 消费 历史前代产品图灵 消费 伏打 专业 后继产品愛達 勒芙蕾絲 英语 Ada Lovelace microarchitecture 消费 霍普 英语 Hopper microarchitecture 专业 目录 1 硬件 2 核心配置 3 记录 4 參考資料 5 外部链接硬件 编辑NVIDIA A100 Tensor Core GPU基于NVIDIA Ampere架构 是针对 AI 数据分析和 HPC的GPU 3 DGX A100系统集成8个NVIDIA A100 Tensor Core GPU 有着320GB内存 拥有NVIDIA Mellanox HDR 200Gbps互连以及5Petaflops 的AI性能 4 DGX SuperPOD是140台DGX A100系统运用MellanoxHDR 200Gbps InfiniBand互连技术组成的一个集群 AI计算能力达到了700Petaflops 5 NVIDIA EGX A100是NVIDIA于2020年5月发布的基于Ampere架构的一款边缘AI平台 6 NVIDIA GeForce 30系列 GeForce RTX 3050 GeForce RTX 3060 GeForce RTX 3060Ti GeForce RTX 3070 GeForec RTX 3070Ti GeForce RTX 3080 10GB GeForce RTX 3080 12GB GeForce RTX 3080Ti GeForce RTX 3090 GeForce RTX 3090Ti核心配置 编辑核心代号 GPC SM GPC 每个SM含有的各类核心 制程 显存支持 芯片面积 mm2 晶体管数 亿个 单精度浮点核心 双精度浮点核心 32位整数核心 张量运算核心 光线追踪核心 纹理映射单元GA100 8 16 64 32 64 4 4 台积电 7nm HBM2 826 542GA102 7 12 128 1 三星 8nm GDDR6X 628 283GA104 4 GDDR6 393 174在作为计算卡专用的GA100核心中 和其前身一样 每个SM中安排有32个双精度浮点核心 在作为非计算卡使用的GA102等核心中 这些双精度浮点核心被替换为两倍数量的单精度浮点核心 由于单精度浮点核心事实上作为绝大多数游戏的流处理器 因此单个SM表观流处理器数量达到上一代的2倍 RTX 3070的流处理器数量达到近6千个 接近上代旗舰RTX 2080 Ti 但相应的 用单精度浮点核心模拟双精度的效率并不高 因此游戏显卡的双精度浮点计算速度 主要作用于挖矿和深度学习等应用 相较上代并没有明显提升 晶体管密度 GA100使用台积电7nm制程达到约6600万 mm2 GA102 GA104使用三星8nm制程达到约4500万 mm2 而上代的图灵全系列均使用台积电12nm制程 仅达到约2500万 mm2 A100显卡中每个SM私有的L1 共享内存容量达到了192KB 相比于前代V100显卡的128KB增加了1 5倍 记录 编辑2020年7月 根据MLPerf基准测试结果 NVIDIA宣布安培打破16项世界纪录 包括加速器的八项基准测试和集群DGX SuperPOD的八项 7 參考資料 编辑 英伟达发布全新数据中心GPU 新浪网 www finance sina com cn 2020 05 19 2020 08 30 原始内容存档于2022 05 09 中文 中国大陆 存档副本 2021 10 20 原始内容存档于2022 05 09 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力 中国信息网 www cscaa org cn 2020 05 15 2020 08 30 原始内容存档于2021 03 18 中文 中国大陆 性能提升20倍 英伟达GPU旗舰A100登场 全新7nm架构安培出炉 新浪网 www tech sina com cn 2020 05 15 2020 08 30 原始内容存档于2020 05 21 中文 中国大陆 NVIDIA DGX A100帮助对抗COVID 19 新浪网 www finance sina com cn 2020 05 14 2020 08 30 原始内容存档于2020 05 21 中文 中国大陆 英伟达正式发布7nm安培GPU 八代史上性能最大飞跃 新浪网 www tech sina com cn 2020 05 14 2020 08 30 原始内容存档于2020 05 21 中文 中国大陆 NVIDIA安培打破16项世界纪录 一年半性能暴增4倍 新浪网 www tech sina com cn 2020 07 30 2020 08 30 原始内容存档于2020 08 01 中文 中国大陆 外部链接 编辑NVIDIA A100 Tensor Core GPU Architecture whitepaper 页面存档备份 存于互联网档案馆 Nvidia Ampere Architecture 页面存档备份 存于互联网档案馆 Nvidia A100 Tensor Core GPU 页面存档备份 存于互联网档案馆 NVIDIA Ampere Architecture In Depth 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title 安培微架构 amp oldid 73756585, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。