Nvidia tillkännager en ny generation av grafik med Maxwell / Nyheter

Idag släppte Nvidia sin första produkt med GM107 Maxwell Architecture, Geforce GTX 750 TI som kommer att sälja för 115 £ (149 $, ca 165 USD).

Nvidia hävdar att kortet kan matcha prestanda för sin flaggskepps GPU från fyra år sedan, GeForce GTX 480, men med endast en 60W TDP, det är en fjärdedel av kraften som släpptes ut.

Men GTX 750 TI är mindre intressant än arkitekturen. Maxwells design handlar mestadels om energieffektivitet per watt som förbrukas med GPU-enheten som är avsedd att användas i energibegränsade miljöer som bärbara datorer och småformat-datorer.

Hämta DirectX 9.29 för Windows

Grafikkmarknaden blir allt viktigare eftersom som Steam vill tjäna upp spel på lägre specmaskiner.

I hjärtat av Maxwell är en helt ny design för streaming multiprocessorn som förbättrar prestanda per watt. Detta är en förbättring på Kepler och hanterades genom förbättringar för att styra logisk partitionering, balans mellan arbetsbelastning, klockgrindning, kompilatorbaserad schemaläggning och antal instruktioner utfärdade per klockcykel.

Nvidia har också ökat antalet SM till fem, jämfört med två i GK107. Maxwell har också en större L2-cache-design på 2048KB istället för 256KB. Med mer cache på chipet behövs färre förfrågningar till grafikkortet DRAM.

Maxwell makt

På grafiksidan har Maxwell en liknande struktur som Kepler. Det använder också flera strömmande multiprocessor-enheter inom ett grafikbehandlingskluster. Varje strömmande multiprocessor innefattar en polymorf motor och textur enheter, medan varje GPC inkluderar en rastermotor.

GM107 GPU innehåller en GPC, fem Maxwell streaming multiprocessorer och två 64-bitars minneskontrollers vilket betyder 128 bitar totalt.

Nvidia hävdar att Maxwell levererar 35% mer prestanda per Cuda-kärna på skadereglerade arbetsbelastningar och behövde lite tungt arbete med schemaläggarkitekturen. Vissa algoritmer måste skrivas om för att undvika bås och minska strömförlusten.

Varje SM är uppdelad i fyra separata bearbetningsblock, var och en med sin egen instruktionsbuffert, schemaläggare och 32 Cuda-kärnor. Denna partitionering förenklar design och schemaläggningslogik, sparar område och kraft och minskar latens.

På videofronten har Maxwell ett förbättrat NVENC-block som lovar en snabbare kodhastighet på 6-8X realtid för H.264 och 8-10X snabbare avkodning, och tack vare en ny lokal dekodercache ger högre minneseffektivitet per ström för videoavkodning, vilket resulterar i lägre effekt för videoavkodning.

Maxwell har ett nytt GC5-strömtillstånd som har skräddarsys för att minska GPU: s strömförbrukning för lätta arbetsbelastningsfall som videoavspelning.