Websites

Nvidia onthult Next-Gen Fermi-architectuur

Nvidia GTC 2009: GT300 "Fermi" architecture unveiled by Jen Hsun Huang (Full Version in HD)

Nvidia GTC 2009: GT300 "Fermi" architecture unveiled by Jen Hsun Huang (Full Version in HD)
Anonim

Nvidia heeft de naam van haar NVISION-promotie mogelijk gewijzigd conferentie naar de 'GPU Technology Conference', maar het is nog steeds een Nvidia-show door en door. CEO Jen-Hsun Huang nam tijdens zijn keynote enige tijd in beslag om de volgende grote GPU-architectuur van het bedrijf, met de codenaam 'Fermi', te onthullen. Dit is de grafische chipfans die GT300 noemen, de opvolger van de GT200-chip die kaarten genereert zoals de GeForce GTX 285.

"

compute en grafische" chip, in die volgorde (cursieve mijn). Sterker nog, bijna alles wat onthuld wordt over de nieuwe chip heeft te maken met de computationele functies, in plaats van traditioneel grafisch georiënteerde dingen zoals texture-eenheden en render-back-einden. Wat we wel weten is dat de chip enorm is met naar schatting 3,0 miljard transistors en zal worden geproduceerd op een 40nm-proces bij TSMC. Dit is ongeveer 40 procent meer transistors dan de RV870-chip in de nieuwe Radeon 5800-serie DirectX 11-kaarten die zojuist door concurrent AMD zijn uitgebracht. De chip heeft 512 verwerkingseenheden (Nvidia noemt ze CUDA-kernen) georganiseerd in 16 "streaming multiprocessors" van elk 32 cores. Dit is meer dan het dubbele van de 240 kernen in GT200, en de kernen hebben bovendien belangrijke verbeteringen. De chip maakt gebruik van een 384-bits GDDR5-geheugeninterface. Hier volgen enkele van de belangrijkste opsommingspunten:

Derde generatie streamingmultiprocessor (SM)

32 CUDA-kernen per SM, 4x over GT200

  • 8x de piekprestatie met dubbele precisie met drijvende komma over GT200
  • Dual Warp Scheduler die twee warps van 32 threads
  • per klok
  • 64 KB RAM met een configureerbare partitionering van gedeeld geheugen en L1 cache
  • plant en verzendt Generation Parallel Thread Execution ISA

Uniforme adresruimte met volledige C ++ -ondersteuning

  • Geoptimaliseerd voor OpenCL en DirectCompute
  • Volledige IEEE 754-2008 32-bits en 64-bits precisie
  • Volledig 32-bits geheel getalpad met 64 -bit-uitbreidingen
  • Geheugentoegangsinstructies ter ondersteuning van de overgang naar 64-bits adressering
  • Verbeterde prestaties door predikatie
  • Verbeterd geheugensubsysteem

NVIDIA parallelle datacachehiërarchie met configureerbare L1 en Unified L2

  • cachegeheugen
  • Eerste GPU met ECC-geheugenondersteuning
  • Sterk verbeterde werking van het atomaire geheugen prestaties
  • NVIDIA GigaThread Engine

10x snellere applicatiecontext-switching

  • Concurrente kerneluitvoering
  • Uitbesteding thread-thread-uitvoering
  • Dual overlapped memory-overdrachtsmotoren
  • Er zijn veel extra functies die moeten verbeteren de prestaties van deze chip in stream computing-taken, zoals een veel snellere drijvende-komma-berekeningssnelheid met dubbele precisie. De huidige Nvidia GPU's berekenen dubbele precisie bij een fractie van de snelheid van bewerkingen met één precisie. Dubbel-precisie drijvende-kommabewerkingen moeten nu de helft van de prestaties van enkele precisie zijn, wat een enorme verbetering is. Grote verbeteringen in caching en planning zijn ook duidelijk. U kunt meer lezen over de architectuur op de nieuwe Fermi-pagina van Nvidia, die een PDF-whitepaper bevat.

Dus wanneer kunt u een grafische kaart kopen die deze chip gebruikt? Nvidia zegt niet. Vertegenwoordigers van het bedrijf hebben gezegd dat ze momenteel "de chip op de kop zetten", wat betekent dat werkmonsters pas recent zijn teruggekomen van de fabriek. Als we een goed gefundeerde schatting uit het verleden maken, zouden we zeggen dat december een optimistische releasedatum is en dat Q1 2010 voor brede beschikbaarheid waarschijnlijker is. Verwacht dat boards duur zijn. Nvidia zal de grootte van de chip niet onthullen, maar te oordelen naar de telling van de transistor raden we tussen 450 en 500 mm

2 . In combinatie met de extra kosten voor een 384-bits geheugeninterface en de uitdagingen om goede opbrengsten te halen uit zo'n enorme chip op het relatief nieuwe 40nm productieproces, en je kijkt naar kaarten die waarschijnlijk zowel krachtiger als duurder dan de zojuist uitgegeven Radeon 5800-serie kaarten van AMD. Volg Jason Cross op twitter of bezoek zijn blog.