¿Qué es Nvidia Ampere??

¿Qué es Nvidia Ampere??

Cuando se trata de GPU, NVIDIA es un experto líder. Al estar en el negocio desde 1993, Nvidia ha producido una amplia gama de GPU profesionales y de consumo de alta calidad. Las estimadas arquitecturas de sus procesadores están detrás del éxito de su producto, especialmente de su línea principal, la GeForce. Las GPU de Nvidia fueron más allá del espacio de juego, ampliando su presencia en el aprendizaje profundo, la IA (inteligencia artificial) y el análisis acelerado. Nvidia se infiltró en el mercado de centros de datos hace una década, comenzando con los chips de Fermi. Se hicieron iteraciones posteriores, y la compañía lanzó continuamente GPU que llenan la demanda insaciable de una velocidad de procesamiento más rápida en los centros de datos. Las GPU de Nvidia han evolucionado a lo largo de los años, y los diseños de la arquitectura impulsan principalmente la evolución.

Arquitectura de amperios de nvidia

La competencia es muy apretada entre los fabricantes de GPU, pero Nvidia no contiene nada para tomar el primer lugar. De hecho, Nvidia ha dominado el mercado de IA en la última década. En 2020, las noticias de la GPU de 7 nvidia (8 nm para piezas de consumo) con 54 mil millones de transistores comprimidos en un troquel tan pequeño hicieron un gran zumbido. Con nombre en código Amperio Después del matemático francés André-Marie Ampère, La arquitectura del procesador de Nvidia aumenta una mejora masiva sobre sus predecesores, Turing y Volta, prometiendo más funcionalidades, una mejor eficiencia y un mayor rendimiento a niveles de potencia más bajos. Ampere está detrás de la segunda generación de GPU RTX de NVIDIA, la serie RTX 30, y se dice que es el doble de rápido que sus contrapartes de la serie RTX 20. La arquitectura Ampere es también la fuerza detrás de las GPU de Centro de datos NVIDIA A100.

Especificaciones de Ampere

Ampere es el primer GPU de 7 nvm/8 nvidia, la segunda generación de rastreo de rayos de consumo, y tiene la tercera generación de núcleos de tensor. Ampere es la arquitectura subyacente de GPU GA100, GA102 y GA104 que están integradas en GeForce RTX 3090, RTX 3080, RTX 3070, y más recientemente, el RTX 3060. NVIDIA también está programado para lanzar RTX 3050 en los siguientes meses. Mientras tanto, la GPU de Enterprise GA100 proporciona 20 veces más potencia informática que las generaciones anteriores de GPU del centro de datos. Aquí hay una descripción general de las GPU profesionales y de consumo basadas en amperios de NVIDIA [1]:

GPU GA100 GA102 GA102 GA104
Tarjeta grafica Nvidia A100 GeForce RTX 3090 GeForce RTX 3080 GeForce RTX 3070
Proceso (nm) TSMC N7 Samsung 8n Samsung 8n Samsung 8n
Transistores (mil millones) 54 28.3 28.3 17.4
Tamaño de die (mm^2) 826 628.4 628.4 392.5
Configuración de GPC 8 × 16 7 × 12 6 × 12 6 × 8
SMS 108 82 68 46
Núcleos de cuda 6912 10496 8704 5888
Núcleos de RT Ninguno 82 68 46
Núcleos de tensor 432 328 272 184
Boost Clock (MHz) 1410 1700 1710 1730
Velocidad de VRAM (GBPS) 2.43 19.5 (GDDR6X) 19 (GDDR6X) 14 (GDDR6)
VRAM (GB) 40 (48 Max) 24 10 8
Ancho de bus 5120 (6144 Max) 384 320 256
Ropas 128 112 96 96
Tmus 864 656 544 368
Gflops FP32 19492 35686 29768 20372
Rt tflops N / A 69 58 40
Tensor Tflops FP16 (Sparsity) 312 (628) 143 (285) 119 (238) 81 (163)
Ancho de banda (GB/S) 1555 936 760 448
TBP (Watts) 400 (250 PCIe) 350 320 220

Nvidia A100

La Nvidia A100 es la primera GPU que utilizó la arquitectura Ampere. El chip empresarial está dirigido a los centros de datos y está diseñado para tareas intensivas en GPU como el aprendizaje profundo y la IA. Construido utilizando el proceso de 7 nm de TSMC, alberga una cantidad tremenda de 54 mil millones de transistores. Ha superado a las generaciones anteriores de GPU empresariales con un aumento de 20X en el rendimiento con 6,912 núcleos CUDA, 432 unidades de mapeo de textura, 160 ROP, núcleos de tensor de tercera generación y un VRAM de 40 GB con ancho de banda de memoria que supera a 1 en 1 en 1.6tb/seg. DGX A100 es el primer sistema de IA del mundo con un clúster de ocho A100 y un alto precio de $ 199,000.

Serie GeForce RTX 30

Además de dominar el mercado empresarial, Nvidia siempre tiene en mente a los consumidores, especialmente a los jugadores y creadores. La arquitectura Ampere también se adopta en las tarjetas de gráficos de consumo de Nvidia. La segunda generación de GeForce RTX lleva las GPU basadas en amperios que aumentan el rendimiento al doble que la generación anterior.

En la mayoría de los aspectos, Ampere tiene más del doble de la potencia de procesamiento de Turing. Ha duplicado el rendimiento del sombreador de Turing con el doble de la cantidad de núcleos CUDA FP32. Específicamente, tiene 30 shader-tflops, 2.7x más que Turing's, que es solo 11 Shader-Tflops. Del mismo modo, el núcleo de tensor de Turing mide a 89 tensor-tflops, pero Ampere ha más que duplicado esta tasa con sus 238 tensor-tflops. Sin olvidar sus tasas de núcleo de rastreo de rayos, que es 58 RT-Tflops, 1.7x más rápido que las 34 rt-tflops de Turing, y para hacer que las GPU funcionen aún más rápido, el chip de amperios se conecta a la memoria más rápida del mundo, el Micron G6X.

La serie RTX 30 se realiza utilizando el proceso personalizado Samsung 8n Nvidia con 28 mil millones de transistores para GA102 y 17 mil millones de transistores para GA104. La clase Titan RTX 3090 funciona con la GPU GA102 y ofrece un rendimiento de la tarjeta de consumo extremadamente potente. A diferencia de las generaciones anteriores, RTX 3090 está abierto a terceros para el diseño personalizado.

RTX 3080 también está utilizando una GPU GA102, entregando el doble de rendimiento de RTX 2080 y una impresionante destreza de juegos 4K. RTX 3070, alimentado por GPU GA104, está a la par con RTX 2080 Ti a la mitad del precio. El RTX 3060 recientemente lanzado nunca deja de impresionar con su rendimiento asombroso impulsado por núcleos de rastreo de rayos mejorados, núcleos de tensor, nuevos multiprocesadores de transmisión y memoria G6 de alta velocidad.

A pesar del aumento masivo en el rendimiento, las nuevas GPU RTX no se ponen pesadas en el bolsillo. Las tarjetas gráficas mucho más rápidas son fácilmente accesibles cuando se trata de precios. El buque insignia del Nvidia GeForce, RTX 3080, comienza en $ 699, el RTX 3070 se vende a $ 499 y el RTX 3060 tiene un precio de $ 329. El RTX 3090 de gama alta cuesta $ 1,499; Todavía es considerablemente bajo considerando su rendimiento a nivel de titán.

Solo unos meses después de su lanzamiento, según los informes, ha habido escasez de tarjetas gráficas basadas en amperios, y no es sorprendente con la impresionante actuación de Ampere a un precio razonable. Para aquellos que consideran una actualización de GPU, ahora es el mejor momento para tener en sus manos las GPU basadas en amperios de Nvidia.

Fuentes

[1] Walton, Jarred. "NVIDIA RTX 30-Serie Ampere Architecture Deep Dive: Todo lo que sabemos". https: // www.tomshardware.com/características/nvidia-ampere-arquitecture-profundidad. 13 de octubre de 2020.