Apache Impala

Apache Impala

Informacja
Opracowany przez Cloudera i Apache Software Foundation
Ostatnia wersja 3. 4, 0 (22 kwietnia 2020 r)
Kaucja github.com/apache/impala
Stan projektu w rozwoju
Napisane w C ++ , Java i Python
System operacyjny Wieloplatformowy
Środowisko Maszyna wirtualna Java
Licencja Licencja Apache
Stronie internetowej impala.apache.org

Apache Impala to mechanizm zapytań SQL Open Source ( MPP ) firmy Cloudera dla danych przechowywanych w klastrach komputerów z systemem Apache Hadoop .

Opis

Cloudera Impala to silnik zapytań, który działa na Apache Hadoop.

Impala oferuje skalowalną i równoległą technologię baz danych Hadoop, umożliwiając użytkownikom wysyłanie zapytań SQL o małych opóźnieniach do danych przechowywanych w HDFS i Apache HBase bez konieczności przenoszenia lub transformacji danych. Impala jest zintegrowana z Hadoop w celu korzystania z tych samych plików i formatów danych, a także struktur bezpieczeństwa i zarządzania zasobami używanych przez MapReduce , Apache Hive , Apache Pig i inne oprogramowanie Hadoop.

Analitycy i naukowcy zajmujący się danymi preferują Impalę do przeprowadzania analiz danych przechowywanych na Hadoop za pomocą narzędzi SQL lub narzędzi Business Intelligence. Rezultatem jest masowe przetwarzanie danych i interaktywne zapytania, które można wykonywać w tym samym systemie przy użyciu tych samych danych i metadanych - co pozwala uniknąć migracji zbioru danych do wyspecjalizowanych systemów lub do zastrzeżonych formatów. Po prostu w celu wykonania analiz.

Funkcje:

Na początku 2013 roku ogłoszono kolumnowy format plików o nazwie Parquet dla architektur, w tym Impala. WGrudzień 2013, Amazon Web Services ogłosił wsparcie dla Impala. Na początku 2014 r. MapR dodał obsługę Impala. W 2015 roku ogłoszono inny format o nazwie Kudu, który Cloudera zaoferował przekazanie Apache Software Foundation wraz z Impalą. Wpaździernik 2016, Impala staje się projektem Apache Incubator.

Historyczny

Projekt został ogłoszony w październik 2012, w publicznych testach beta i stał się skutecznie dostępny w maj 2013.

W listopad 2015, Cloudera ogłasza, że ​​chce przekazać Impalę fundacji Apache Software Foundation .

Zobacz też

Bibliografia

  1. Wersja 3.4.0  " ,22 kwietnia 2020 r(dostęp 23 kwietnia 2020 )
  2. „  Cloudera Impala  ” (dostęp 14 marca 2014 r. )
  3. (w) Timothy Prickett Morgan, „  Cloudera Impala SQL zmienia się w Hadoop  ” , The Register ,30 kwietnia 2013(dostęp 26 stycznia 2016 )
  4. Yves Grandmontagne, „  Big Data: Impala de Cloudera kwestionuje Hadoop w czasie rzeczywistym  ” , Silicon.fr,31 października 2012(dostęp 26 stycznia 2016 )
  5. (w) Andrew Brust, „  Impala, Kudu, and the Apache Incubator's four-month binge Big Data  ” , ZDNet ,1 st grudzień 2015(dostęp 26 stycznia 2016 )

Linki zewnętrzne