Cuando se trata de GPU, NVIDIA es un experto líder. Al estar en el negocio desde 1993, Nvidia ha producido una amplia gama de GPU profesionales y de consumo de alta calidad. Las estimadas arquitecturas de sus procesadores están detrás del éxito de su producto, especialmente de su línea principal, la GeForce. Las GPU de Nvidia fueron más allá del espacio de juego, ampliando su presencia en el aprendizaje profundo, la IA (inteligencia artificial) y el análisis acelerado. Nvidia se infiltró en el mercado de centros de datos hace una década, comenzando con los chips de Fermi. Se hicieron iteraciones posteriores, y la compañía lanzó continuamente GPU que llenan la demanda insaciable de una velocidad de procesamiento más rápida en los centros de datos. Las GPU de Nvidia han evolucionado a lo largo de los años, y los diseños de la arquitectura impulsan principalmente la evolución.
Arquitectura de amperios de nvidia
La competencia es muy apretada entre los fabricantes de GPU, pero Nvidia no contiene nada para tomar el primer lugar. De hecho, Nvidia ha dominado el mercado de IA en la última década. En 2020, las noticias de la GPU de 7 nvidia (8 nm para piezas de consumo) con 54 mil millones de transistores comprimidos en un troquel tan pequeño hicieron un gran zumbido. Con nombre en código Amperio Después del matemático francés André-Marie Ampère, La arquitectura del procesador de Nvidia aumenta una mejora masiva sobre sus predecesores, Turing y Volta, prometiendo más funcionalidades, una mejor eficiencia y un mayor rendimiento a niveles de potencia más bajos. Ampere está detrás de la segunda generación de GPU RTX de NVIDIA, la serie RTX 30, y se dice que es el doble de rápido que sus contrapartes de la serie RTX 20. La arquitectura Ampere es también la fuerza detrás de las GPU de Centro de datos NVIDIA A100.
Especificaciones de Ampere
Ampere es el primer GPU de 7 nvm/8 nvidia, la segunda generación de rastreo de rayos de consumo, y tiene la tercera generación de núcleos de tensor. Ampere es la arquitectura subyacente de GPU GA100, GA102 y GA104 que están integradas en GeForce RTX 3090, RTX 3080, RTX 3070, y más recientemente, el RTX 3060. NVIDIA también está programado para lanzar RTX 3050 en los siguientes meses. Mientras tanto, la GPU de Enterprise GA100 proporciona 20 veces más potencia informática que las generaciones anteriores de GPU del centro de datos. Aquí hay una descripción general de las GPU profesionales y de consumo basadas en amperios de NVIDIA [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Tarjeta grafica | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Proceso (nm) | TSMC N7 | Samsung 8n | Samsung 8n | Samsung 8n |
Transistores (mil millones) | 54 | 28.3 | 28.3 | 17.4 |
Tamaño de die (mm^2) | 826 | 628.4 | 628.4 | 392.5 |
Configuración de GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SMS | 108 | 82 | 68 | 46 |
Núcleos de cuda | 6912 | 10496 | 8704 | 5888 |
Núcleos de RT | Ninguno | 82 | 68 | 46 |
Núcleos de tensor | 432 | 328 | 272 | 184 |
Boost Clock (MHz) | 1410 | 1700 | 1710 | 1730 |
Velocidad de VRAM (GBPS) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (48 Max) | 24 | 10 | 8 |
Ancho de bus | 5120 (6144 Max) | 384 | 320 | 256 |
Ropas | 128 | 112 | 96 | 96 |
Tmus | 864 | 656 | 544 | 368 |
Gflops FP32 | 19492 | 35686 | 29768 | 20372 |
Rt tflops | N / A | 69 | 58 | 40 |
Tensor Tflops FP16 (Sparsity) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Ancho de banda (GB/S) | 1555 | 936 | 760 | 448 |
TBP (Watts) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
La Nvidia A100 es la primera GPU que utilizó la arquitectura Ampere. El chip empresarial está dirigido a los centros de datos y está diseñado para tareas intensivas en GPU como el aprendizaje profundo y la IA. Construido utilizando el proceso de 7 nm de TSMC, alberga una cantidad tremenda de 54 mil millones de transistores. Ha superado a las generaciones anteriores de GPU empresariales con un aumento de 20X en el rendimiento con 6,912 núcleos CUDA, 432 unidades de mapeo de textura, 160 ROP, núcleos de tensor de tercera generación y un VRAM de 40 GB con ancho de banda de memoria que supera a 1 en 1 en 1.6tb/seg. DGX A100 es el primer sistema de IA del mundo con un clúster de ocho A100 y un alto precio de $ 199,000.
Serie GeForce RTX 30
Además de dominar el mercado empresarial, Nvidia siempre tiene en mente a los consumidores, especialmente a los jugadores y creadores. La arquitectura Ampere también se adopta en las tarjetas de gráficos de consumo de Nvidia. La segunda generación de GeForce RTX lleva las GPU basadas en amperios que aumentan el rendimiento al doble que la generación anterior.
En la mayoría de los aspectos, Ampere tiene más del doble de la potencia de procesamiento de Turing. Ha duplicado el rendimiento del sombreador de Turing con el doble de la cantidad de núcleos CUDA FP32. Específicamente, tiene 30 shader-tflops, 2.7x más que Turing's, que es solo 11 Shader-Tflops. Del mismo modo, el núcleo de tensor de Turing mide a 89 tensor-tflops, pero Ampere ha más que duplicado esta tasa con sus 238 tensor-tflops. Sin olvidar sus tasas de núcleo de rastreo de rayos, que es 58 RT-Tflops, 1.7x más rápido que las 34 rt-tflops de Turing, y para hacer que las GPU funcionen aún más rápido, el chip de amperios se conecta a la memoria más rápida del mundo, el Micron G6X.
La serie RTX 30 se realiza utilizando el proceso personalizado Samsung 8n Nvidia con 28 mil millones de transistores para GA102 y 17 mil millones de transistores para GA104. La clase Titan RTX 3090 funciona con la GPU GA102 y ofrece un rendimiento de la tarjeta de consumo extremadamente potente. A diferencia de las generaciones anteriores, RTX 3090 está abierto a terceros para el diseño personalizado.
RTX 3080 también está utilizando una GPU GA102, entregando el doble de rendimiento de RTX 2080 y una impresionante destreza de juegos 4K. RTX 3070, alimentado por GPU GA104, está a la par con RTX 2080 Ti a la mitad del precio. El RTX 3060 recientemente lanzado nunca deja de impresionar con su rendimiento asombroso impulsado por núcleos de rastreo de rayos mejorados, núcleos de tensor, nuevos multiprocesadores de transmisión y memoria G6 de alta velocidad.
A pesar del aumento masivo en el rendimiento, las nuevas GPU RTX no se ponen pesadas en el bolsillo. Las tarjetas gráficas mucho más rápidas son fácilmente accesibles cuando se trata de precios. El buque insignia del Nvidia GeForce, RTX 3080, comienza en $ 699, el RTX 3070 se vende a $ 499 y el RTX 3060 tiene un precio de $ 329. El RTX 3090 de gama alta cuesta $ 1,499; Todavía es considerablemente bajo considerando su rendimiento a nivel de titán.
Solo unos meses después de su lanzamiento, según los informes, ha habido escasez de tarjetas gráficas basadas en amperios, y no es sorprendente con la impresionante actuación de Ampere a un precio razonable. Para aquellos que consideran una actualización de GPU, ahora es el mejor momento para tener en sus manos las GPU basadas en amperios de Nvidia.
Fuentes
[1] Walton, Jarred. "NVIDIA RTX 30-Serie Ampere Architecture Deep Dive: Todo lo que sabemos". https: // www.tomshardware.com/características/nvidia-ampere-arquitecture-profundidad. 13 de octubre de 2020.