Kepler (architektura karty graficznej)

Kepler architektura została opracowana przez NVidia dla swoich kart graficznych. Ma podwoić wydajność na wat w porównaniu do poprzedniej architektury Fermi , co pozwala na wykorzystanie go w mobilnych kartach graficznych . Pierwsza karta graficzna wykorzystująca tę architekturę to GTX 680, wykorzystująca procesor graficzny GK 104.

Historyczny

Marzec 2012 : wydanie GTX 680, pierwszej karty graficznej korzystającej z architektury Kepler
Maj 2012 : wypuszczenie GTX 690, pierwszej karty graficznej korzystającej z dwóch układów Kepler
Listopad 2012 : wypuszczenie Tesli K20 i K20X, pierwsze karty wykorzystujące GK 110
luty 2013 : wydanie GeForce Titan, pierwszej konsumenckiej karty graficznej korzystającej z GK 110
maj 2013 : Wydanie karty Geforce GTX 780
listopad 2013: Wydanie GeForce GTX 780 Ti, pierwszej karty konsumenckiej korzystającej z pełnego GK 110.
Luty 2014 : Wydanie GeForce GTX Titan Black Edition, ewolucja GTX Titan ze wszystkimi jego aktywnymi jednostkami obliczeniowymi.
Maj 2014 : Wydanie GeForce GTX Titan Z, pierwszej karty graficznej korzystającej z dwóch pełnych kart GK 110.

Architektura

To trwa około Fermiego architektury, więc jest to mądry podzielony GPC lub Graphics Processing Cluster które są równoważne z sercem z mikroprocesorem , chyba że są one pozbawione pamięci podręcznej, że składają się z dwa lub trzy SMX i zawierają 8 jednostek ROP . Aby obsługiwać rdzenie CUDA, które są jednostkami obliczeniowymi, układ oferuje dwa poziomy pamięci podręcznej (L1 i L2). Układ wyposażony jest w 512 KB z pamięci podręcznej L2, ze zwiększoną prędkością w porównaniu z Fermiego .

SMX , jest wielką nowością wprowadzoną przez Keplera, to wymiana z Fermiego SM . Przechowuje do 192 rdzeni CUDA lub obliczeń jednostek, najbardziej zaawansowana wersja w porównaniu z 32 rdzeniami CUDA z SM firmy Fermi . Z drugiej strony SMX rezygnuje z podwójnego systemu czasowego Fermiego , który podwoił częstotliwość SM, a tym samym jednostki obliczeniowe. Każdy SMX posiada 64 KB o wspólnej pamięci i 16 jednostek tekstur.

GPU Boost

NVidia wykorzystuje Kepler do wprowadzenia „GPU Boost”, który zwiększa częstotliwość procesora w zależności od jego zużycia i temperatury, które są mierzone bezpośrednio na karcie . Wzmocnienie może sięgać kilkudziesięciu MHz . W GeForce Titan Nvidia używa nazwy „GPU Boost 2.0”, której jedyną zmianą jest zastąpienie przez temperaturę czynnika ograniczającego zużycia.

Lista procesorów i kart graficznych używających Keplera

Architektura Kepler jest używany w wielu GPU :

GK 104, który jest używany w GTX 680, GTX 690, GTX 670, GTX 660, GTX 660ti, GTX 760, GTX 770, Tesla K10, Tesla K8;
GK 106, który jest używany w GTX 660, składa się z 5 SMX;
GK 107, który jest używany w kartach mobilnych firmy NVidia , a także w kartach dla początkujących, począwszy od GT 640;
GK 110, który ma 15 mocniejsze SMXs i 1,5 MB z pamięci podręcznej , jest ona wykorzystywana w Tesla K20, GeForce Titan, GeForce GTX 780 i GeForce GTX 780 Ti

W 2013 roku wszystkie chipy Keplera są grawerowane przy 28 nm .

Pod marką GeForce

Wszystkie współpracują z DirectX 11.0 , OpenGL 4.3, OpenCL 1.2 i PCI-Express 16x 3.0.

Szablony	GeForce GT 640 (A2)	GeForce GT 640 (DDR3)	GeForce GT 640 (DDR5)	GeForce GTX 650	GeForce GTX 650Ti	GeForce GTX 650Ti Boost	GeForce GTX 660	GeForce GTX 660 OEM	GeForce GTX 660Ti	GeForce GTX 670	GeForce GTX 680	GeForce GTX 770	GeForce GTX 690	GeForce GTX 780	GeForce GTX Titan	GeForce GTX780 Ti
Próba grawerowania procesora	28nm
Kod chipowy	GK107				GK106			GK104					2 × GK104	GK110
Powierzchnia wiórów	118mm²				221mm²			294mm²					2 × 294mm²	569 mm²
Tranzystory	1.3 G.				2,54 G			3,54 G					2 × 3,54 G.	7.1 G.
Częstotliwość 3D	797 MHz	900 MHz	950 MHz	1058 MHz	928 MHz	980 MHz		823 MHz	915 MHz		1006 MHz	1045 MHz	915 MHz	863 MHz	837 MHz	875 MHz
Częstotliwość turbo	NC	NC	NC	NC	NC	1032 MHz		888 MHz	980 MHz	1006 MHz	1058 MHz	1084 MHz	1019 MHz	902 MHz	876 MHz	928 MHz
Częstotliwość zapasu TDP	NC	NC	NC	NC	NC	1110 MHz		927 MHz	1136 MHz	1084 MHz	1123 MHz	1136 MHz	1071 MHz	1006 MHz		1020 MHz
Maksymalna temperatura z Turbo										94 ° C	94 ° C	80 ° C		80 ° C	80 ° C	80 ° C
Liczba RPO	16					24				32			2 × 32	48
TMU	32				64		80	96	112		128		2 × 128	192	224	240
Liczba rdzeni Cuda	384				768		960	1152	1344		1536		2 × 1536	2304	2688	2880
Liczba FP32	320				640		800	912	1064		1216		2 × 1216	1824	1344	2280
Liczba FP64	-				-		-	48	56		64		2 × 64	96	896	120
Liczba jednostek SFU	64				128		160	192	224		256		2 × 256	384	448	480
Liczba GPC	1				2		3		4				2 × 4	5
Liczba SMX	2				4		5	6	7		8		2 × 8	12	14	15
Koperta termiczna	50 watów	65 watów	75 watów	65 watów	85 watów	130 watów	140 watów	130 watów	150 watów	170 watów	195 watów	230 watów	300 watów	250 watów	250 watów	250 watów
Rodzaj pamięci	DDR3		GDDR5
Możliwa pojemność	1/2 GB	1 GB	1/2 GB		1 GB	1/2 GB	2 GB	1,5 / 3 GB	2/3 GB	2/4 GB			2 × 2/4 GB	3 GB	6 GB	3 GB
Szybkość pamięci	1782 MHz		1250 MHz		1350 MHz	1500 MHz		1450 MHz	1500 MHz			1750 MHz	1500 MHz			1750 MHz
Szerokość magistrali pamięci	128 bitów					192 bity				256 bitów			2 × 256 bitów	384 bitów
Przepustowość pamięci	28,5 GB / s		80 GB / s		86,4 GB / s	144,2 GB / s		134 GB / s	144,2 GB / s	192,3 GB / s		209 GB / s	250 GB / s	2 × 192,3 GB / s	268 GB / s
Piksele Fillrate	12,8 Gpikseli / s	14,4 Gpikseli / s	15,2 Gpikseli / s	16,9 Gpikseli / s	14,8 Gpikseli / s	23,5 Gpikseli / s		19,8 Gpikseli / s	21,9 Gpikseli / s	29,3 Gpikseli / s	32,2 Gpikseli / s		2 × 29,3 Gpikseli / s	27,6 Gpikseli / s	33,5 Gpikseli / s	42,0 Gpikseli / s
Turbo	NC	NC	NC	NC	NC	26,6 Gpikseli / s		22,3 Gpikseli / s	27,3 Gpikseli / s	34,7 Gpikseli / s	35,9 Gpikseli / s		2 × 34,3 Gpikseli / s	40,2 Gpikseli / s	40,2 Gpikseli / s	44,54 Gpikseli / s
Wypełnij tekstury	25,5 Gtexels / s	28,8 Gtexels / s	30,4 Gtexels / s	33,9 Gtexels / s	59,4 Gtexels / s	62,7 Gtexels / s	78,4 Gtexels / s	79 Gtexels / s	102,5 Gtexels / s		128,8 Gtexels / s		2 × 117,1 Gtexels / s	166 Gtexels / s	187,5 Gtexels / s	210,0 Gtexels / s
Turbo	NC	NC	NC	NC	NC	71 Gpikseli / s	88,8 Gpikseli / s	89 Gpikseli / s	127,2 Gpikseli / s	121,4 Gpikseli / s	143,7 Gpikseli / s		2 × 137,1 Gpixels / s	193 Gpikseli / s	225,3 Gpikseli / s	222,72 Gtexels / s
Filtrowanie geometryczne	797 mln trójkątów / s	900 M trójkątów / s	950 mln trójkątów / s	1058 mln trójkątów / s	1856 mln trójkątów / s	1960 mln trójkątów / s	2450 mln trójkątów / s	2469 mln trójkątów / s	3203 mln trójkątów / s		4024 mln trójkątów / s		2 × 3660 M trójkątów / s	5178 mln trójkątów / s	5859 mln trójkątów / s	5250 mln trójkątów / s
Turbo	NC	NC	NC	NC	NC	2220 mln trójkątów / s	2775 mln trójkątów / s	2781 mln trójkątów / s	3976 mln trójkątów / s	3794 mln trójkątów / s	4492 mln trójkątów / s		2 × 4284 M trójkątów / s	6036 mln trójkątów / s	7042 mln trójkątów / s	5555 mln trójkątów / s
Proste obliczenia precyzyjne	612,1 Gflo / s	691,2 Gflo / s	729,6 Gflo / s	812,5 Gflo / s	1425,4 Gflo / s	1505,3 Gflo / s	1881,6 Gflo / s	1896,2 Gflo / s	2459,5 Gflo / s		3090,4 Gflo / s		2 × 2810,9 Gflo / s	3977 Gflo / s	4500 Gflo / s	?
Turbo	NC	NC	NC	NC	NC	1704,9 Gflo / s	2131,2 Gflo / s	2135,8 Gflo / s	3053,6 Gflo / s	2913,8 Gflo / s	3449,9 Gflo / s		2 × 3290,1 Gflo / s	4636 Gflo / s	5408,3 Gflo / s	5040 Gflo / s
Obliczanie podwójnej precyzji	25,7 Gflo / s	28,8 Gflop / s	30,4 Gflop / s	33,9 Gflop / s	59,4 Gflop / s	62,7 Gflop / s	78,4 Gflop / s	79 Gflop / s	102,5 Gflop / s		128,8 Gflop / s		2 × 117,1 Gflop / s	166 Gflo / s	1499,9 Gflop / s	?
Turbo	NC	NC	NC	NC	NC	71 Gflo / s	88,8 Gflo / s	89 Gflo / s	127,2 Gpikseli / s	121,4 Gpikseli / s	143,7 Gpikseli / s		2 × 137,1 Gpixels / s	193 Gpikseli / s	1523 Gpikseli / s	210 Gflo / s
Aktualna cena (kwiecień 2013)	45 € HT jednostka za 1000ex	79,00 €		99 €	119 €	169,00 €	179,00 €	185 € HT za sztukę za 1000ex	255 €	340 €	450 €		840 €	650 €	980 €	700 €

Pod marką Quadro

Seria QUADRO „Kx000” została zaprojektowana przy użyciu tego samego schematu co TESLA K. Specyfikacje GK104 / 106/110 są zatem identyczne dla serii TESLA i QUADRO.

Szablony	Quadro 410	Quadro K600	Quadro K2000	Quadro K4000	Quadro K5000	Quadro K6000	Quadro K7000
Rytownictwo	28 nm
edytor	GK107			GK106	GK104	GK110
Obszar Die	118mm²			221mm²	294mm²	550mm²
Tranzystory	1,27 G			2,54 G	3,54 miliarda	7,10 G
Częstotliwość GPU	706 MHz	876 MHz	954 MHz	811 MHz	705 MHz		735 MHz
Procesory strumieniowe	192	192	384	768	1536	2496	2688
Jednostki TMU	16		32	64	128	208	224
Jednostki RPO	8	16		24	32	40	48
Liczba bloków SMX	1		2	4	8	14	15
Liczba GPC	1			2	4	5
Koperta termiczna	38 watów	41 watów	51 watów	80 watów	122 watów	225 watów	250 watów
Rodzaj pamięci	DDR3		GDDR5
Pamięć	512 MB	1 GB	2 GB	3 GB	4 GB	5 GB	6 GB
Szybkość pamięci	891 MHz		1000 MHz	1404 MHz	1350 MHz	1300 MHz	1300 MHz
Szerokość busa	64 bity	128 bitów		192 bity	256 bitów	320 bitów	384 bitów
Pasmo	13,3 GB / s	26,5 GB / s	59,6 GB / s	125,5 GB / s	160,9 GB / s	193,7 GB / s	232,5 GB / s
Filtrowanie pikseli	5,6 Gpikseli / s	14 Gpikseli / s	15,3 Gpikseli / s	19,5 Gpikseli / s	22,6 Gpikseli / s	28,2 Gpikseli / s	35,3 Gpikseli / s
Filtrowanie tekstur	11,3 Gtexels / s	14 Gtexels / s	30,5 Gtexels / s	51,9 Gtexels / s	90,2 Gtexels / s	146,6 Gtexels / s	164,6 Gtexels / s
Filtrowanie geometryczne	706 mln trójkątów / s	876 mln trójkątów / s	954 mln trójkątów / s	1622 mln trójkątów / s	2820 mln trójkątów / s	4935 MT / s	5513 mln trójkątów / s
Proste obliczenia precyzyjne	271,1 Gflo / s	336,4 Gflo / s	732,7 GFLOP / s	1245,7 Gflo / s	1082,9 GFLOP / s	3519,4 Gflo / s	3951,4 Gflo / s
Obliczanie podwójnej precyzji	11,3 Gflo / s	14 Gflo / s	30,5 Gflo / s	51,9 Gflo / s	90,2 Gflo / s	1173,1 Gflo / s	1317,1 Gflo / s
Data wydania	7 sierpnia 2012	1 st marca 2013	1 st marca 2013	1 st marca 2013	17 sierpnia 2012	1 st czerwiec 2013	- 2013

Pod marką Tesla

Architektura Keplera jest obecna w Tesli K8, K10, K20, K20X, K40 i K80.

Uwagi i odniesienia

GeForce GTX 680: Kepler wysyła Tahiti na emeryturę w Tom's Hardware.
Artykuł Keplera
Oficjalna strona firmy NVidia
Artykuł GPU Boost
[1]
Artykuł o Tesli Kx0
Artykuł wyjaśniający obsługę DirectX 11 dla serii GeForces 600 w clubic.com ; [2] i [3] w hardware.fr
Chris Angelini, „ GeForce GTX Titan: The True High-End Kepler ” na Tom's Hardware ,19 lutego 2013(dostęp 20 lutego 2013 )