显卡GPU架构介绍之-----Ampere(安培)

如题所述

在2020年9月的历史性时刻,NVIDIA推出了基于Ampere架构的显卡3080与3090,犹如科技界的璀璨明星,彻底改变了硬件行业的格局。这些新品不仅挑战了上一代的卡皇2080Ti,而且标志着显卡架构的一次重大飞跃。本文将深入解析Ampere架构的亮点及其与图灵架构的显著提升。

Ampere架构早在2020年5月就已经悄然登场,遵循了传统的产品发布顺序,首先亮相的是专为计算领域设计的计算卡,其核心GA100。尽管GA100在计算核心规模和图形卡核心之间存在显著差异,但本文的重点将集中在针对图形处理的GA102核心,尤其是3090所采用的版本。

3090的GPU核心为GA102-300,其设计遵循了GPC-TPC-SM的经典架构。每个3090配备了7个GPC(图形处理集群),每个GPC由6个TPC(纹理处理集群)组成,每个TPC包含2个SM( Streaming Multiprocessors,流处理器单元)单元,每个SM拥有128个CUDA核心。这样,完整的GA102核心总共提供了惊人的10752个CUDA核心,而3090通过裁剪掉部分TPC,保留了10496个CUDA核心。

尽管3090没有采用完整的GA102核心,但人们对于3090 Ti的期待并未消减,如果真有此款产品,很可能将采用完整的GPU设计。而在Ampere架构中,每个SM单元的威力被进一步强化,不仅L1缓存提升至128KB,RT Core升级到第二代,Tensor Core也进化到了第三代,AI运算性能大幅提升。

在Ampere架构中,SM单元的革新尤为显著。图灵架构曾将INT32与FP32处理分离,但在Ampere中,ALU(算术逻辑单元)支持FP32和INT32,每个SM单元能同时处理64个INT32和64个FP32,或者128个FP32,理论上性能提升了接近两倍。尽管这是否为"误宣传"存在争议,但NVIDIA的创新无疑为游戏体验带来了实质性的提升。

随着Ampere架构的发布,GDDR6X显存也随之而来,其带宽相较于GDDR6有了显著提升。GDDR6X的等效频率高达19~21Gbps,这意味着在相同位宽下,GDDR6X的带宽提升了约35%,最高可达到惊人的912GB/s~1008GB/s,为显卡性能的释放提供了强大的支持。

以3070与3070 Ti为例,NVIDIA的DLSS 2.1技术在Ampere架构下更上一层楼,8K分辨率的性能提升明显,通过深度学习技术,玩家能在8K分辨率下享受原本4K才可能的流畅游戏体验,这在Ampere架构的加持下变得触手可及。

总的来说,Ampere架构带来了革命性的飞跃,RT Core、Tensor Core的升级,以及SM单元性能的大幅提升,展示了NVIDIA的创新精神。然而,对于消费者来说,何时才能以原价购得这些令人期待的30系显卡,仍是个让人关注的问题。无论如何,Ampere架构无疑为未来的图形处理性能树立了新的标杆。
温馨提示:答案为网友推荐,仅供参考
相似回答