Kepler architektura została opracowana przez NVidia dla swoich kart graficznych. Ma podwoić wydajność na wat w porównaniu do poprzedniej architektury Fermi , co pozwala na wykorzystanie go w mobilnych kartach graficznych . Pierwsza karta graficzna wykorzystująca tę architekturę to GTX 680, wykorzystująca procesor graficzny GK 104.
To trwa około Fermiego architektury, więc jest to mądry podzielony GPC lub Graphics Processing Cluster które są równoważne z sercem z mikroprocesorem , chyba że są one pozbawione pamięci podręcznej, że składają się z dwa lub trzy SMX i zawierają 8 jednostek ROP . Aby obsługiwać rdzenie CUDA, które są jednostkami obliczeniowymi, układ oferuje dwa poziomy pamięci podręcznej (L1 i L2). Układ wyposażony jest w 512 KB z pamięci podręcznej L2, ze zwiększoną prędkością w porównaniu z Fermiego .
SMX , jest wielką nowością wprowadzoną przez Keplera, to wymiana z Fermiego SM . Przechowuje do 192 rdzeni CUDA lub obliczeń jednostek, najbardziej zaawansowana wersja w porównaniu z 32 rdzeniami CUDA z SM firmy Fermi . Z drugiej strony SMX rezygnuje z podwójnego systemu czasowego Fermiego , który podwoił częstotliwość SM, a tym samym jednostki obliczeniowe. Każdy SMX posiada 64 KB o wspólnej pamięci i 16 jednostek tekstur.
NVidia wykorzystuje Kepler do wprowadzenia „GPU Boost”, który zwiększa częstotliwość procesora w zależności od jego zużycia i temperatury, które są mierzone bezpośrednio na karcie . Wzmocnienie może sięgać kilkudziesięciu MHz . W GeForce Titan Nvidia używa nazwy „GPU Boost 2.0”, której jedyną zmianą jest zastąpienie przez temperaturę czynnika ograniczającego zużycia.
Architektura Kepler jest używany w wielu GPU :
W 2013 roku wszystkie chipy Keplera są grawerowane przy 28 nm .
Wszystkie współpracują z DirectX 11.0 , OpenGL 4.3, OpenCL 1.2 i PCI-Express 16x 3.0.
Szablony | GeForce GT 640 (A2) | GeForce GT 640 (DDR3) | GeForce GT 640 (DDR5) | GeForce GTX 650 | GeForce GTX 650Ti | GeForce GTX 650Ti Boost | GeForce GTX 660 | GeForce GTX 660 OEM | GeForce GTX 660Ti | GeForce GTX 670 | GeForce GTX 680 | GeForce GTX 770 | GeForce GTX 690 | GeForce GTX 780 | GeForce GTX Titan | GeForce GTX780 Ti |
Próba grawerowania procesora | 28nm | |||||||||||||||
Kod chipowy | GK107 | GK106 | GK104 | 2 × GK104 | GK110 | |||||||||||
Powierzchnia wiórów | 118mm² | 221mm² | 294mm² | 2 × 294mm² | 569 mm² | |||||||||||
Tranzystory | 1.3 G. | 2,54 G | 3,54 G | 2 × 3,54 G. | 7.1 G. | |||||||||||
Częstotliwość 3D | 797 MHz | 900 MHz | 950 MHz | 1058 MHz | 928 MHz | 980 MHz | 823 MHz | 915 MHz | 1006 MHz | 1045 MHz | 915 MHz | 863 MHz | 837 MHz | 875 MHz | ||
Częstotliwość turbo | NC | NC | NC | NC | NC | 1032 MHz | 888 MHz | 980 MHz | 1006 MHz | 1058 MHz | 1084 MHz | 1019 MHz | 902 MHz | 876 MHz | 928 MHz | |
Częstotliwość zapasu TDP | NC | NC | NC | NC | NC | 1110 MHz | 927 MHz | 1136 MHz | 1084 MHz | 1123 MHz | 1136 MHz | 1071 MHz | 1006 MHz | 1020 MHz | ||
Maksymalna temperatura z Turbo | 94 ° C | 94 ° C | 80 ° C | 80 ° C | 80 ° C | 80 ° C | ||||||||||
Liczba RPO | 16 | 24 | 32 | 2 × 32 | 48 | |||||||||||
TMU | 32 | 64 | 80 | 96 | 112 | 128 | 2 × 128 | 192 | 224 | 240 | ||||||
Liczba rdzeni Cuda | 384 | 768 | 960 | 1152 | 1344 | 1536 | 2 × 1536 | 2304 | 2688 | 2880 | ||||||
Liczba FP32 | 320 | 640 | 800 | 912 | 1064 | 1216 | 2 × 1216 | 1824 | 1344 | 2280 | ||||||
Liczba FP64 | - | - | - | 48 | 56 | 64 | 2 × 64 | 96 | 896 | 120 | ||||||
Liczba jednostek SFU | 64 | 128 | 160 | 192 | 224 | 256 | 2 × 256 | 384 | 448 | 480 | ||||||
Liczba GPC | 1 | 2 | 3 | 4 | 2 × 4 | 5 | ||||||||||
Liczba SMX | 2 | 4 | 5 | 6 | 7 | 8 | 2 × 8 | 12 | 14 | 15 | ||||||
Koperta termiczna | 50 watów | 65 watów | 75 watów | 65 watów | 85 watów | 130 watów | 140 watów | 130 watów | 150 watów | 170 watów | 195 watów | 230 watów | 300 watów | 250 watów | 250 watów | 250 watów |
Rodzaj pamięci | DDR3 | GDDR5 | ||||||||||||||
Możliwa pojemność | 1/2 GB | 1 GB | 1/2 GB | 1 GB | 1/2 GB | 2 GB | 1,5 / 3 GB | 2/3 GB | 2/4 GB | 2 × 2/4 GB | 3 GB | 6 GB | 3 GB | |||
Szybkość pamięci | 1782 MHz | 1250 MHz | 1350 MHz | 1500 MHz | 1450 MHz | 1500 MHz | 1750 MHz | 1500 MHz | 1750 MHz | |||||||
Szerokość magistrali pamięci | 128 bitów | 192 bity | 256 bitów | 2 × 256 bitów | 384 bitów | |||||||||||
Przepustowość pamięci | 28,5 GB / s | 80 GB / s | 86,4 GB / s | 144,2 GB / s | 134 GB / s | 144,2 GB / s | 192,3 GB / s | 209 GB / s | 250 GB / s | 2 × 192,3 GB / s | 268 GB / s | |||||
Piksele Fillrate | 12,8 Gpikseli / s | 14,4 Gpikseli / s | 15,2 Gpikseli / s | 16,9 Gpikseli / s | 14,8 Gpikseli / s | 23,5 Gpikseli / s | 19,8 Gpikseli / s | 21,9 Gpikseli / s | 29,3 Gpikseli / s | 32,2 Gpikseli / s | 2 × 29,3 Gpikseli / s | 27,6 Gpikseli / s | 33,5 Gpikseli / s | 42,0 Gpikseli / s | ||
Turbo | NC | NC | NC | NC | NC | 26,6 Gpikseli / s | 22,3 Gpikseli / s | 27,3 Gpikseli / s | 34,7 Gpikseli / s | 35,9 Gpikseli / s | 2 × 34,3 Gpikseli / s | 40,2 Gpikseli / s | 40,2 Gpikseli / s | 44,54 Gpikseli / s | ||
Wypełnij tekstury | 25,5 Gtexels / s | 28,8 Gtexels / s | 30,4 Gtexels / s | 33,9 Gtexels / s | 59,4 Gtexels / s | 62,7 Gtexels / s | 78,4 Gtexels / s | 79 Gtexels / s | 102,5 Gtexels / s | 128,8 Gtexels / s | 2 × 117,1 Gtexels / s | 166 Gtexels / s | 187,5 Gtexels / s | 210,0 Gtexels / s | ||
Turbo | NC | NC | NC | NC | NC | 71 Gpikseli / s | 88,8 Gpikseli / s | 89 Gpikseli / s | 127,2 Gpikseli / s | 121,4 Gpikseli / s | 143,7 Gpikseli / s | 2 × 137,1 Gpixels / s | 193 Gpikseli / s | 225,3 Gpikseli / s | 222,72 Gtexels / s | |
Filtrowanie geometryczne | 797 mln trójkątów / s | 900 M trójkątów / s | 950 mln trójkątów / s | 1058 mln trójkątów / s | 1856 mln trójkątów / s | 1960 mln trójkątów / s | 2450 mln trójkątów / s | 2469 mln trójkątów / s | 3203 mln trójkątów / s | 4024 mln trójkątów / s | 2 × 3660 M trójkątów / s | 5178 mln trójkątów / s | 5859 mln trójkątów / s | 5250 mln trójkątów / s | ||
Turbo | NC | NC | NC | NC | NC | 2220 mln trójkątów / s | 2775 mln trójkątów / s | 2781 mln trójkątów / s | 3976 mln trójkątów / s | 3794 mln trójkątów / s | 4492 mln trójkątów / s | 2 × 4284 M trójkątów / s | 6036 mln trójkątów / s | 7042 mln trójkątów / s | 5555 mln trójkątów / s | |
Proste obliczenia precyzyjne | 612,1 Gflo / s | 691,2 Gflo / s | 729,6 Gflo / s | 812,5 Gflo / s | 1425,4 Gflo / s | 1505,3 Gflo / s | 1881,6 Gflo / s | 1896,2 Gflo / s | 2459,5 Gflo / s | 3090,4 Gflo / s | 2 × 2810,9 Gflo / s | 3977 Gflo / s | 4500 Gflo / s | ? | ||
Turbo | NC | NC | NC | NC | NC | 1704,9 Gflo / s | 2131,2 Gflo / s | 2135,8 Gflo / s | 3053,6 Gflo / s | 2913,8 Gflo / s | 3449,9 Gflo / s | 2 × 3290,1 Gflo / s | 4636 Gflo / s | 5408,3 Gflo / s | 5040 Gflo / s | |
Obliczanie podwójnej precyzji | 25,7 Gflo / s | 28,8 Gflop / s | 30,4 Gflop / s | 33,9 Gflop / s | 59,4 Gflop / s | 62,7 Gflop / s | 78,4 Gflop / s | 79 Gflop / s | 102,5 Gflop / s | 128,8 Gflop / s | 2 × 117,1 Gflop / s | 166 Gflo / s | 1499,9 Gflop / s | ? | ||
Turbo | NC | NC | NC | NC | NC | 71 Gflo / s | 88,8 Gflo / s | 89 Gflo / s | 127,2 Gpikseli / s | 121,4 Gpikseli / s | 143,7 Gpikseli / s | 2 × 137,1 Gpixels / s | 193 Gpikseli / s | 1523 Gpikseli / s | 210 Gflo / s | |
Aktualna cena (kwiecień 2013) | 45 € HT jednostka za 1000ex | 79,00 € | 99 € | 119 € | 169,00 € | 179,00 € | 185 € HT za sztukę za 1000ex | 255 € | 340 € | 450 € | 840 € | 650 € | 980 € | 700 € |
Seria QUADRO „Kx000” została zaprojektowana przy użyciu tego samego schematu co TESLA K. Specyfikacje GK104 / 106/110 są zatem identyczne dla serii TESLA i QUADRO.
Szablony | Quadro 410 | Quadro K600 | Quadro K2000 | Quadro K4000 | Quadro K5000 | Quadro K6000 | Quadro K7000 |
---|---|---|---|---|---|---|---|
Rytownictwo | 28 nm | ||||||
edytor | GK107 | GK106 | GK104 | GK110 | |||
Obszar Die | 118mm² | 221mm² | 294mm² | 550mm² | |||
Tranzystory | 1,27 G | 2,54 G | 3,54 miliarda | 7,10 G | |||
Częstotliwość GPU | 706 MHz | 876 MHz | 954 MHz | 811 MHz | 705 MHz | 735 MHz | |
Procesory strumieniowe | 192 | 192 | 384 | 768 | 1536 | 2496 | 2688 |
Jednostki TMU | 16 | 32 | 64 | 128 | 208 | 224 | |
Jednostki RPO | 8 | 16 | 24 | 32 | 40 | 48 | |
Liczba bloków SMX | 1 | 2 | 4 | 8 | 14 | 15 | |
Liczba GPC | 1 | 2 | 4 | 5 | |||
Koperta termiczna | 38 watów | 41 watów | 51 watów | 80 watów | 122 watów | 225 watów | 250 watów |
Rodzaj pamięci | DDR3 | GDDR5 | |||||
Pamięć | 512 MB | 1 GB | 2 GB | 3 GB | 4 GB | 5 GB | 6 GB |
Szybkość pamięci | 891 MHz | 1000 MHz | 1404 MHz | 1350 MHz | 1300 MHz | 1300 MHz | |
Szerokość busa | 64 bity | 128 bitów | 192 bity | 256 bitów | 320 bitów | 384 bitów | |
Pasmo | 13,3 GB / s | 26,5 GB / s | 59,6 GB / s | 125,5 GB / s | 160,9 GB / s | 193,7 GB / s | 232,5 GB / s |
Filtrowanie pikseli | 5,6 Gpikseli / s | 14 Gpikseli / s | 15,3 Gpikseli / s | 19,5 Gpikseli / s | 22,6 Gpikseli / s | 28,2 Gpikseli / s | 35,3 Gpikseli / s |
Filtrowanie tekstur | 11,3 Gtexels / s | 14 Gtexels / s | 30,5 Gtexels / s | 51,9 Gtexels / s | 90,2 Gtexels / s | 146,6 Gtexels / s | 164,6 Gtexels / s |
Filtrowanie geometryczne | 706 mln trójkątów / s | 876 mln trójkątów / s | 954 mln trójkątów / s | 1622 mln trójkątów / s | 2820 mln trójkątów / s | 4935 MT / s | 5513 mln trójkątów / s |
Proste obliczenia precyzyjne | 271,1 Gflo / s | 336,4 Gflo / s | 732,7 GFLOP / s | 1245,7 Gflo / s | 1082,9 GFLOP / s | 3519,4 Gflo / s | 3951,4 Gflo / s |
Obliczanie podwójnej precyzji | 11,3 Gflo / s | 14 Gflo / s | 30,5 Gflo / s | 51,9 Gflo / s | 90,2 Gflo / s | 1173,1 Gflo / s | 1317,1 Gflo / s |
Data wydania | 7 sierpnia 2012 | 1 st marca 2013 | 1 st marca 2013 | 1 st marca 2013 | 17 sierpnia 2012 | 1 st czerwiec 2013 | - 2013 |
Architektura Keplera jest obecna w Tesli K8, K10, K20, K20X, K40 i K80.