Nazwisko | FLOPY |
---|---|
yotta FLOPS | 10 24 |
zetta FLOPS | 10 21 |
exa FLOPS | 10 18 |
peta FLOPS | 10 15 |
tera FLOPS | 10 12 |
giga FLOPY | 10 9 |
mega FLOPY | 10 6 |
kilo FLOPS | 10 3 |
Liczba operacji zmiennoprzecinkowych na sekundę (w języku angielskim : operacje zmiennoprzecinkowe na sekundę lub FLOPS ) jest jednostką miary obliczania szybkości komputera systemowego i tym samym częścią jego wydajności .
Zmiennoprzecinkowej operacji (dodawanie lub mnożenie) są operacje, które pozwalają na obliczenia reprezentujących bardzo duże i bardzo małą ilość reprezentowana przez mantysę i wykładnikiem. Takie operacje zajmują więcej czasu obliczeniowego niż operacje na liczbach całkowitych i są używane w niektórych typach aplikacji.
Większość współczesnych mikroprocesorów zawiera jednostkę zmiennoprzecinkową (w języku angielskim : jednostka zmiennoprzecinkowa , FPU), która jest wyspecjalizowaną częścią mikroprocesora przeznaczoną do wykonywania tego typu operacji. Pomiar liczby FLOPS faktycznie mierzy prędkość FPU. Jednym z najczęstszych testów wydajności wykorzystywanych do pomiaru liczby FLOPÓW jest LINPACK .
Liczba FLOPS nie uwzględnia takich czynników, jak profil obciążenia (ciężkie lub lekkie, regularne lub bardzo zmienne obciążenia itp. ) procesora lub kategorie użytych operacji zmiennoprzecinkowych, ani w jakim procencie. Z tego powodu konsorcjum dostawców utworzyło Korporację Standardowej Oceny Wyników (SPEC), która zamierza zapewnić bardziej sensowny pomiar.
Liczbę operacji zmiennoprzecinkowych można obliczyć z różnych wielkości liczb:
Liczba japonki jest powszechnie stosowany w dziedzinie obliczeń naukowych, na przykład w TOP500 z superkomputerów .
Równanie do obliczenia FLOPA to:
W 2011 roku większość mikroprocesorów wykonuje 4 FLOPy na cykl zegara . Tak więc jednordzeniowy mikroprocesor o taktowaniu 2,5 GHz ma teoretyczną szybkość 10 miliardów FLOPS, co oznacza 10 G FLOPS .
Uzyskana szybkość obliczeń różni się znacznie w zależności od tego rozmiaru .
w czerwiec 2011, najmocniejszy superkomputer osiąga 8,162 petaFLOPS. To jest komputer K . Ten japoński superkomputer ma łącznie 68 544 8-rdzeniowych procesorów i ma większą moc obliczeniową niż jego następnych 5 razem wziętych. Ten sam superkomputer pobił swój własny rekord wpaździernik 2011osiągając 10 petaFLOPS (lub 10 16 FLOPS ). W tym czasie posiadał 88 128 8-rdzeniowych procesorów.
w listopad 2012Firma Cray Inc. obejmuje prowadzenie z wyprzedzeniem TOP500 z IBM z Tytana , o 17.59 petaflopów superkomputer, zdolny do osiągnięcia 27 petaflopów w szczytowej wydajności. Ten superkomputer jest zainstalowany w Narodowym Laboratorium Oak Ridge . Jego moc energetyczna wynosi 8,2 MW ; ma hybrydową architekturę opartą na procesorach Opteron (AMD) i akceleratorach GPU Tesla ( Nvidia ).
W 2013 roku najpotężniejszym superkomputerem na świecie była chińska maszyna Tianhe-2 , która wykazała 33,86 petaflopów mocy obliczeniowej.
W 2013 roku komputer osobisty może osiągnąć moc około 200 gigaFLOPS z mikroprocesorem takim jak Intel Core i7 -3770, porównywalną mocą do superkomputerów z 1995 roku i 5 621 gigaFLOPS z procesorem graficznym takim jak Nvidia GTX 690 , czyli powiedzieć moc porównywalna z superkomputerami z 2001 roku .
ten 28 stycznia 2014, platforma przetwarzania rozproszonego BOINC ma łącznie 8251 petaFLOPS.
W 2015 r. rząd USA uruchomił projekt przekroczenia poprzeczki exa FLOPS (10 18 FLOPS ).
W 2016 r. rząd francuski uruchomił za pośrednictwem firmy Bull projekt „rozwijania władzy egzaflotycznej”, Francja pozostaje daleko od swoich japońskich, chińskich, a zwłaszcza amerykańskich konkurentów.
Również w 2016 roku platforma DGX-1 z serwerem GPU Nvidia Pascal 8x (P100) ze zintegrowanym Nvidia Deep Learning ma moc około 170 teraFLOPS (FP16), jest to moc porównywalna z superkomputerami z 2005 roku . Wbudowana wersja Tesla V100 ma moc około 960 teraFLOPS (FP16), jest porównywalna mocą do superkomputerów z 2007 roku .
ten 17 czerwca 2016The sieci wydobycie umożliwiający generowanie Bitcoin kryptowaluta wynosi moc około 64 exaFLOPS. Jest to najpotężniejsza sieć na świecie, z wydajnością ponad 500 razy większą od superkomputera Tianhe-2 , z tym ostatnim na drugim miejscu. Należy zauważyć, że większość tej mocy obliczeniowej jest realizowana na układach ASIC, które przez większość czasu nie pozwalają na użycie jako superkomputer, ponieważ chipy te są bardzo wyspecjalizowane. Użycie liczby FLOPS jest również kontrowersyjne, ponieważ chipy te same w sobie nie wykonują obliczeń zmiennoprzecinkowych. Jest to raczej równoważna miara wydajności.
Chiński superkomputer Sunway TaihuLight po raz pierwszy przekroczył granicę 100 petaflopów w 2016 roku.
IBM ogłosił, że uruchomił nowy superkomputer o wartości 200 petaflopów czerwiec 2018dla Departamentu Energii Stanów Zjednoczonych w Narodowym Laboratorium Oak Ridge , Szczyt .
W 2020 roku system Fugaku opracowany przez Fujitsu i instytut badawczy Riken osiąga 415,5 petaflopów.
W 2020 roku NVIDIA z platformą Ampère przełącza profesjonalny komputer wyposażony w kartę A100 826 mm², uzyskuje moc 19,5 teraFLOPS (FP32) i 312 teraFLOPS dla rdzeni Tensor (FP32), porównywalną z superkomputerami z 2007 roku .