NVIDIAnı yeni mimarisi Pascal hakkında teknik detaylar, Maxwell karşılaştırması ve bilmeniz gereken önemli noktaları bu yazıda bulacaksınız.
Geçtiğimiz yıl GTC (GPU Technology Conference) 2015te ilk bilgilerini aldığımız en yeni NVIDIA mimarisi Pascalın çıkışı yaklaşıyor. HBM2 bellek, daha az güç tüketimi, daha fazla bellek kapasitesi gibi önemli gelişmeler vadeden Pascal mimarisine ait ilk ürünlerin, önümüzdeki ay gerçekleşecek olan GTC 2016da duyurulması bekleniyor. Yeni mimariye dair nihai bilgiler, önümüzdeki ay ilk örneklerle birlikte ortaya çıkacaktır. Ancak biz o zamana kadar Pascal mimarisine dair bildiğimiz her şeyi gözden geçirelim.
GTC 2015 sırasında NVIDIA CEOsu esprili bir şekilde Pascal mimarisinin performansının Maxwelle göre kabaca 10 kat daha fazla olduğunu belirtmişti. Bu iddianın arkasındaki matematiğe, Pascalın Maxwelle göre üstünlük sağladığı farklı kategorilerin toptan bir araya getirilmesi gözüyle bakabiliriz. Örneğin Pascal, Maxwelle göre 3 kat daha fazla bellek bant genişliği, 2 kat daha fazla tek duyarlı işlem performansı ve 2 kat daha fazla Watt başına performans sunuyor.
Elbette Pascal mimarisi her alanda Maxwellden 10 kat daha hızlı değil ve NVIDIA da böyle bir beklentinin gerçekçi olmadığını itiraf ediyor. Ancak her ne kadar 10 kat deyimi süslü bir başlık olarak görünse de, Pascalın sunduğu geliştirmeleri göz önüne aldığımızda, Pascal GPUların teoride Maxwell GPUlara göre ciddi bir performans artışı sunduğu çok açık.
Pascal mimarisinin NVIDIA dünyasına kazandıracağı dört temel teknoloji bulunuyor. Bunlar sırasıyla HBM bellek, karma duyarlılık, NV-Link ve TSMC 16nm FinFET üretim süreci. Bunların her biri kendi alanları için mihenk taşı olma özelliğine sahip ve yazımızda her birine detaylı bir şekilde değineceğiz.
HBM2
SK Hynix ve AMD tarafından ortak bir şekilde geliştirilen yüksek bant genişlikli yığın bellek standardı, Pascal ile birlikte NVIDIA tarafında da resmen kullanıma girecek. Yeni bellek standardı, bellek bant genişliğinin saniyede 1 TBa ulaşmasına olanak sağlayacak. Bu değer kabaca Titan Xin sahip olduğunun üç katı. HBM2 ile birlikte bir diğer önemli kısıtlama olan maksimum VRAM sınırı da artacak. Maxwellde 12 GB olan bu sınır, Pascal ile birlikte 32 GBa çıkacak.
NVIDIAnın en büyük rakibi AMD, hali hazırda Fiji XT GPUsu ile HBM kullanıyor. HBM destekli bu GPU tam olarak 512 GB/s bellek bant genişliğine sahip ki, bu değer GTX 980in iki katı. Ayrıca AMD ikinci nesil HBM bellekleri, 2016da tanıtacağı Arctic Islands GPUlarında kullanmaya hazırlanıyor. Yani önümüzdeki yıllarda hem AMD, hem de NVIDIAnın HBM2 bellekleri standart belirleyeceğini tahmin edebiliriz.
Her HBM yığını, GPUya 1024-bitlik bir bellek veriyolu ile bağlanıyor. Bu sayede her ne kadar HBM bellekler kağıt üstünde GDDR5 belleklere göre daha düşük frekansta çalışsa da, daha geniş bellek arayüzü sayesinde 9 kata kadar daha fazla performans sunabiliyor.
NV-Link
Pascal ile birlikte hayatımıza girecek bir diğer yeni teknoloji ise NV-Link. NVIDIAnın iddiasına göre PCIE 3.0dan 5 ile 12 kat arası daha hızlı olan NV-Link, özellikle verimli enerji kullanımı ile dikkat çekiyor. NVIDIA, NV-Link bağlantısının PCIe Gen 3.0 x16 kanalına göre 3 kat daha az enerji harcadığını iddia ediyor.
Özellikle süper bilgisayarlar için geliştirilen NV-Link, Summit ve Sierra süper bilgisayarlarının sunucu düğümü mimarisi için kilit bir rol oynuyor. NV-Link ile IBM Power CPU ve NVIDIA GPU, birbirleriyle hızlı ve kesintisiz bir iletişim kurabiliyor. Programcı gözüyle bakacak olursak NV-Link, CPU ve GPU ile ilişkilendirilmiş verilerin açıklıklarını, CPU ve GPUnun bellek sistemlerini birleştirerek ortadan kaldırıyor. Hem CPU, hem de GPU kendi bellek kontrolcülerine sahip olduğu için kullanılan temel bellek ihtiyaca göre optimize edilebiliyor.
Kısaca NV-Link, HPC (High Performance Computing) kullanıcılarına iki önemli kolaylık sunuyor. İlki, düğüm elementleri arasındaki bant genişliği arttığı için kullanılan uygulamaların genel performansı ciddi bir şekilde artıyor. İkincisi ise, birleşik bellek teknolojisi sayesinde GPU ve CPU için kod yazmak daha da kolaylaşıyor.
16nm FinFET
Pascal, TSMCin 16nm FinFET üretim sürecinden geçen ilk NVIDIA GPUsu olacak. Bu sayede güç tüketimi, 28nm Maxwell ve öncüllerine göre çok daha düşük seviyede. Ayrıca 16nm ölçek, NVIDIAnın daha karmaşık tasarımları, güç tasarrufundan fedakârlık yapmadan elde etmesine olanak sağlıyor.
İşin teknik kısmında ise 16FF+ (FinFET Plus), 28nm öncülüne göre %65 daha yüksek hız, 2 kat daha yoğunluk ve %70 daha düşük güç tüketimi sunuyor. 20SoC teknolojisi ile karşılaştırdığımızda ise %40a varan performans artışı ve %60a varan güç tasarrufu gözlemliyoruz.
FP16
Yeni mimarinin sunduğu teknolojiler arasında FP16 karma duyarlılık veya yarı duyarlılık desteği, oldukça önemli bir yer kaplıyor. FP16 modunda GPUnun yaptığı hesaplama işlemlerinin tutarlılık oranı, standart FP32 moduna göre daha düşüktür. FP32, son yıllarda aramızda olan neredeyse bütün grafik programlama arayüzleri için vazgeçilmez bir teknoloji. DirectX 12, 11, 10 ve DX9 Shader 3.0 bu arayüzlerden bazıları. Yani görüldüğü gibi FP16 ve karma duyarlılık, modern oyun ihtiyaçlarımız konusunda neredeyse kullanılamaz durumda.
Ancak FP16nın FP32 ve FP64e göre büyük bir güç tasarrufu avantajı mevcut. Bu sayede yüksek derecede kompleks hesaplamalar haricinde, FP16nın kullanılması ciddi güç tasarrufu sağlayabiliyor. FP16 desteği özellikle mobil cihazlar için oldukça önemli bir gelişme.
NVIDIAnın Maxwell GPU mimarisi, FP32 ile sınırlı olduğu için GPU, FP16 ve FP32 işlemlerini aynı oranda işliyordu. Ancak Pascal ile denkleme dahil olan karma duyarlılık sayesinde GPU, FP16 gerektiren işlemleri artık iki kat daha hızlı işleyebilecek.
Pascal GP100 GPUsu Hakkında Bildiklerimiz
Pascal mimarisi.
Maxwelle kıyasla Watt başına performans oranı yaklaşık iki kat arttı.
2016nın ikinci yarısında piyasaya sürülmesi bekleniyor.
DirectX 12yi 12_1 veya daha yüksek seviyede destekliyor.
GTX Titan X ve GTX 980 Tida bulunan GM 200ün yerini alacak.
TSMC tarafından 16nm FinFET üretim süreciyle geliştirildi.
Yaklaşık 17 milyar transistöre sahip. Bu değer, GM200ün neredeyse iki katı.
Toplamda 16 GB VRAM için dört adet 4-Hi HBM 2 yığını, 32 GB VRAM için ise dört adet 8-Hi yığını içeriyor.
4096-bitlik bellek arayüzüne sahip.
Yeni nesil IBM PowerPC sunucularla uyumlu NV-Link desteği.
FP16 yarı duyarlı işleme desteği.
Karşılaştırma Tablosu
GPU Mimarisi NVIDIA Fermi NVIDIA Kepler NVIDIA Maxwell NVIDIA Pascal
GPU Üretim Süreci 40nm 28nm 28nm 16nm (TSMC FinFET)
Amiral Gemisi Çekirdek GF110 GK210 GM200 GP100
GPU Tasarımı SM (Streaming Multiprocessor) SMX (Streaming Multiprocessor) SMM (Streaming Multiprocessor Maxwell) Duyurulacak
Maksimum Transistör Sayısı 3.00 Milyar 7.08 Milyar 8.00 Milyar 17 Milyara Kadar
Maksimum GPU Ölçeği 520mm2 561mm2 601mm2
İşlem Birimi Başına Düşen SP Sayısı 32 SP 192 SP 128 SP
Maksimum CUDA Çekirdeği 512 CC (16 CU) 2880 CC (15 CU) 3072 CC (24 CU)
İşlem Performansı 1.6 TFLOP 5.1 TFLOP 6.1 TFLOP 12 TFLOP
Maksimum VRAM 1.5 GB GDDR5 6 GB GDDR5 12 GB GDDR5 32 GB HBM2
Maksimum Bant Genişliği 192 GB/s 336 GB/s 336 GB/s 1 TB/s
Maksimum Güç Tüketimi 244W 250W 250W 250W
Öncülüne Göre Performans Artışı +45%
(GTX 285e Karşı GTX 580) +55%
(GTX 580e Karşı GTX TITAN BLACK) +30%
(GTX TITAN BLACKe Karşı GTX TITAN X)
Amiral Gemisi Ekran Kartı Fiyatı $499
(GTX 580) $999
(GTX Titan Black) $999
(GTX Titan X)
Çıkış Tarihi 2010 (GTX 580) 2014 (GTX Titan Black) 2015 (GTX Titan X) 2016