Nástroj pro analýzu velkých objemů dat
na platformě Hadoop

Společnost EMC uvádí vysoce výkonné účelové zařízení pro platformu Hadoop, určené ke společnému zpracování dat, s názvem Greenplum HD Data Computing Appliance. Zařízení kombinuje software Hadoop s databází EMC Greenplum a umožňuje tak společné zpracování strukturovaných i nestrukturovaných dat v rámci jediného řešení. Společnost EMC zároveň oznámila dostupnost softwaru EMC Greenplum HD Community Edition a EMC Greenplum HD Enterprise Edition založeného na platformě Hadoop. Software Greenplum HD je k dispozici ve dvou edicích – Community a Enterprise – a poskytuje ucelenou platformu včetně instalace, školení, globální podpory a přidané hodnoty nad rámec pouhého balíčku distribuce softwaru Apache.
EMC pro platformu Hadoop přináší mimo jiné následující prvky:
- Zařízení EMC Greenplum HD Data Computing Appliance – Software Apache Hadoop se bezproblémově integruje s databází Greenplum v zařízení Greenplum HD Data Computing Appliance. Řešení podporuje externí tabulky softwaru Hadoop a umožňuje tak uživatelům přístup k datům v souborovém systému HDFS (Hadoop Distributed File System), aniž by bylo nutné data vyvolávat. Správci mohou paralelně číst a zapisovat soubory z databáze Greenplum do systému HDFS, což dovoluje rychlé a jednoduché sdílení dat. S využitím výkonu systému Greenplum SQL a pokročilých analytických funkcí při přístupu k datům v systému HDFS lze provádět analýzu na více platformách.
- EMC Greenplum HD Enterprise Edition – Verze Enterprise Edition představuje implementaci prostředí Apache Hadoop, která je stoprocentně kompatibilní s rozhraním. Díky zajištění kompatibility s rozhraním Hadoop poskytuje Enterprise Edition bezproblémovou přenositelnost aplikací a zároveň nabízí pokročilé funkce, jaké velké organizace vyžadují:
- Funkce správy dat jako snímky stavu a replikace rozsáhlých oblastí
- Jednoduché načítání dat a přístup pomocí nativního rozhraní systému NFS
- Možnost ucelené správy včetně nasazení jednoduchých clusterů, automatického rozpoznávání selhání s upozorněním, správy více lokalit a průběžné upgrady
- EMC Greenplum HD Community Edition – vydání Community Edition představuje verzi prostředí Apache Hadoop, která disponuje stoprocentní open-source certifikací a podporou a zahrnuje součásti HDFS, MapReduce, Zookeeper, Hive a HBase. Zařízení EMC Greenplum zajišťuje odolnost proti chybám u součástí Name Node a Job Tracker, které u standardních implementací softwaru Hadoop představují místa náchylná k selhání.









