Platforma Google

Google potrzebuje dużych zasobów komputerowych do świadczenia swoich usług. W tym artykule opisano infrastrukturę technologiczną witryn Google przedstawioną w publicznych ogłoszeniach firmy.

Topologia sieci

W 2008 r. Google obsługiwał 34 centra danych na całym świecie, w tym 19 w Stanach Zjednoczonych (w tym 2 w budowie), 11 w Europie, 3 w Azji i 1 w Brazylii. Chociaż liczby nie zostały ujawnione, niektórzy szacują, że Google utrzymuje prawie 2,5 miliona serwerów zlokalizowanych w kilku miastach na całym świecie, z głównymi ośrodkami w Mountain View ( Kalifornia ), Council Bluffs (Iowa), Herndon (Wirginia), Lenoir ( Północna Karolina) ), Hrabstwo Mayes ( Oklahoma ), Atlanta (Georgia); Dublin , Irlandia  ; Saint-Ghislain , Belgia  ; Groningen w Holandii ; Zurych , Szwajcaria  ; São Paulo w Brazylii ; Quilicura ( Chile ); Tokio , Japonia  ; Pekin , Chiny .

Podczas próby połączenia się z Google serwery DNS kierują www.google.com do wielu adresów IP , co działa jako pierwszy poziom równoważenia obciążenia, kierując klientów do różnych klastrów Google. Każdy pakiet Google ma tysiące serwerów, a podczas podłączania do pakietu wykonywane jest inne równoważenie obciążenia, aby wysyłać żądania do najlżejszego serwera internetowego . To sprawia, że ​​Google jest jedną z największych i najbardziej złożonych sieci.

Szafy są wykonywane na zamówienie i zawierają od 40 do 80 serwerów 1U (20 do 40 z każdej strony), podczas gdy nowsze serwery to systemy 2U Rackmount. Każdy uchwyt ma wyłącznik. Serwery są podłączone za pośrednictwem łącza Ethernet 100 Mbit / s do lokalnego przełącznika. Przełączniki są podłączone do głównego przełącznika gigabitowego za pomocą jednego lub dwóch gigabitowych łączy uplink.

Centra danych są zlokalizowane przede wszystkim tam, gdzie energia elektryczna nie jest zbyt droga (na przykład w pobliżu elektrowni wodnych), w szczególności na północno-zachodnim wybrzeżu Stanów Zjednoczonych, gdzie rachunki za energię są jednym z głównych czynników. Najważniejsze centra kosztów: Eksperci szacują, że energia elektryczna zużywana przez serwer w całym okresie jego eksploatacji kosztuje więcej niż sam sprzęt.

Główny indeks

Ponieważ zapytania składają się ze słów, konieczny jest odwrotny indeks dokumentów. Taki indeks pozwala uzyskać listę dokumentów dla tego samego słowa w pytaniu. Indeks jest bardzo duży ze względu na liczbę dokumentów przechowywanych na serwerach.

Serwer sprzętu i oprogramowania

W październik 2008, Chociaż liczby nie są podawane do wiadomości publicznej, Google podobno naliczyło dwa miliony serwerów.

Ze względu na ilość używanego sprzętu i intensywny charakter aplikacji uruchamianych przez jego serwery, Google publikuje interesujące statystyki dotyczące awarii sprzętu: dysków twardych i pamięci DRAM .

Google słynie z używania prostych komputerów PC zmodyfikowanych specjalnie do obsługi swoich algorytmów zamiast drogich serwerów zaprojektowanych specjalnie do tego zadania, szczególnie pod względem mocy obliczeniowej i niezawodności . Szczegóły modyfikacji dokonanych w tych maszynach pozostawały tajemnicą przez długi czas, aż1 st kwiecień 2009. Główną osobliwością jego pecetów jest dodanie do każdego z nich 12-woltowej baterii zapewniającej prąd w przypadku problemu z głównym źródłem prądu, co według Google kosztuje mniej niż zakup zasilacza bezprzerwowego na potrzeby całego centrum danych i pozwalając na lepszą efektywność energetyczną.

Inną interesującą cechą jest to, że od 2005 r. Centra danych składają się ze standardowych kontenerów zawierających 1160 serwerów PC o poborze mocy do 250 kilowatów. Wiadomo również, że Sun Microsystems i Windows Azure używają kontenerów, ale przez krótszy czas.

Zastosowanie wielu zawodnych komputerów PC wymagało stworzenia odpowiednich algorytmów i implementacji. Algorytmy musiały być równoległe , rozproszone (lub rozproszone ), odporne na błędy . To zawiera:

Uwagi i odniesienia

  1. (en) http://www.datacenterknowledge.com/archives/2008/03/27/google-data-center-faq/
  2. https://www.datacenterknowledge.com/archives/2017/03/16/google-data-center-faq
  3. http://www.datacenterknowledge.com/archives/2008/11/25/a-closer-look-at-googles-european-data-centers/
  4. (w) „  Discover naszych centrach danych  ” na centra danych Google (dostęp na 1 st październik 2020 ) .
  5. (w) Chandler Evans Future of Google Earth , Madison Publishing Company,2008( ISBN  978-1-4196-8903-1 , OCLC  250515861 ) , „Google Platform” , str.  299
  6. " "  http://www.investinwallonia.be/ofi-belgium/menu-news/Google-Saint-Ghislain-investment.php  ” ( ArchiwumWikiwixArchive.isGoogle • Co robić? ) ." Zainwestuj w Walonię . 27 kwietnia 2007. Pobrano10 maja 2007
  7. Bezpłatnie! Enter the Free Economy , Chris Anderson , ( ISBN  978-2-7440-6351-0 ) , s. 141
  8. (en) Serwery Google: 2 miliony jednostek (Economist) , Didier Durand,31 października 2008
  9. (en) Dwie cenne analizy dotyczące niezawodności i żywotności dysków twardych 21 lutego 2007
  10. [ (fr) http://linuxfr.org//2009/10/09/25997.html Cenna analiza niezawodności pamięci RAM DRAM],9 października 2009
  11. (w) Google odsłania kiedyś tajny serwer Stephena Shanklanda1 st April +2.009
  12. (w) Omówienie infrastruktury testowej , Mark Kaplan, główny inżynier testów Google,15 października 2007

Powiązany artykuł

Link zewnętrzny

Oficjalna prezentacja centrów danych Google