fb
IT Systems 4/2018 Cloud a virtualizace IT AI a Business Intelligence 10. 5. 2018 10:20

Data Warehouse as a Service jako budoucnost datových skladů

Data Warehouse as a ServiceChcete se zbavit starostí s datovým skladem či datovou platformou, přesunout je na bedra poskytovatele a konečně se začít plně věnovat datové analytice, která je hlavním důvodem vzniku datových skladů (DW – Data Warehouse)? Co přejít na Data Warehouse as a Service (DWaaS) jako alternativu. O co vlastně jde? Je to jen další nový buzzword dodavatelů datových skladů nebo něco reálně uchopitelného a použitelného?

Data Warehouse as a Service (DWaaS) je moderní model outsourcingu provozu a vývoje datového skladu zajišťovaný po stránce hardwaru, softwaru a někdy i organizačně poskytovatelem této služby. Fakticky se tedy nejedná o klasického dodavatele datových skladů. Uživatel alias zákazník poskytuje data, používá výstupy a platí pravidelný poplatek za tuto bez pochyby progresivní službu a nemusí se nadále trápit se svým in-house datovým skladem, který může být zdrojem jeho neklidného spánku. Nějak takto by šel optimisticky popsat DWaaS. V užším slova smyslu se jedná o datovou platformu pro analytické účely provozovanou dodavatelem, v širším pojetí o kombinaci datové a integrační platformy včetně příslušných provozních a vývojových služeb zajišťovaných dodavatelem nebo skupinou dodavatelů.

Konzervativní datové sklady…

Před pár lety bychom si DWaaS nedokázali ani představit, protože řešení datových skladů se vyznačovala z řady dobrých důvodu konzervativními a místy až rigidními přístupy. I dnes můžeme konstatovat, že se existující řešení datových skladů do značné míry řídí celou řadou mýtů a pověr, jak je správně dělat. Tyto přístupy měly kdysi své pragmatické základy postavené na základě těžce vydobytých zkušenostech se zpracováním velkých datových objemů. Ale doba pokročila, dnes lze datové sklady řešit jinak, nově a lépe. Stále však musíme čelit velkým datovým objemům a souvisejícím komplexním datovým integracím a je jedno, zda k řešení použijeme ve výsledku „červenou“, „modrou“ nebo třeba „oranžovou“ technologii.

…nahradí inovativní přístupy založené na cloudu

Nové technologie a přístupy umožňují lepší řešení starých problémů. Zákazníci požadují kvalitnější a rychlejší (a někdy dokonce i levnější) datové sklady. Jejich přání může být díky inovacím vyslyšeno, protože zvyšující se vyspělost cloudových řešení typu PaaS (Platform as a Service) a SaaS (Software as Service) umožňuje vznik opravdu moderních datových skladů koncipovaných jako služba, která stojí funkčně na jejich pomezí, a navíc může přinést i nový rozměr v podobě Managed Services (poskytovatel zajišťuje nejen provoz, ale i vývoj).

DWaaS lze chápat ve dvou režimech:

  • v prvním režimu se fakticky jedná o technickou platformu s provozem zajišťovaným poskytovatelem a vývojem stále v rukách zákazníka;
  • v druhém režimu se může jednat o již zmíněné Managed Services, kdy provoz i vývoj řeší poskytovatel dle jasně stanovených pravidel definovaných na smluvním základě ve prospěch zákazníka.

Pro lepší pochopení různých modelů DWaaS je nutné si uvědomit, že Cloud už dávno není nějakou soustavou služeb dostupný pouze přes veřejný Internet. Technologický pokrok a inovace umožňují realizace dodávek nejen pomocí čistého veřejného Cloudu ale i pomocí on-premise řešení, která mohou mít stejný cenový model jako Cloud varianta. Použít lze dokonce hybridní kombinace obou těchto variant, kdy je možno najít opravdu zajímavá funkční a nákladová optima. Asi nejzajímavější hybridní variantou je nasazení produkční databáze v datovém centru zákazníka na hardwaru poskytovatele, přičemž neprodukční databáze a Disaster Recovery prostředí včetně záloh jsou nasazené do Cloudu.

S DWaaS si zákazník polepší

V současnosti lze téměř vždy najít nějaké vhodné řešení DWaaS respektující požadavky na datovou kapacitu, dostupnost, zabezpečení i výpočetní výkon. Navíc díky expertíze poskytovatele bude mít řešení DWaaS pro zákazníka skutečnou přidanou hodnotu a kvalitu. Díky tomu bude investice do řešení datového skladu chráněna a nedojde k morálnímu ani věcnému zastarávání řešení, které je typické pro pozdější části životního cyklu klasického datového skladu. Dokonce ani velikost poskytovatele už dávno není překážkou, neboť DWaaS poskytovatel může snadno použít služby jiných poskytovatelů, kteří třeba sami ani DWaaS nemají, ale mají potřebné dílčí služby, které jsou nutné pro výstavbu těchto komplexních služeb.

Tabulka: Přehled výhod a nevýhod DWaaS
Výhody Nevýhody
Vysoce kvalitní robustní řešení využívající všech oborových Best Practices Kvalitní a rychlejší procesy nasazování a oprav chyb (datových i transformačních) Silná závislost na kvalitním připojení k internetu u čistě cloudových služeb
Minimální nebo malé počáteční investice Standardizovaný vývoj a procesy včetně silné Data Governance Při přesunech velkých datových objemů velké limitace přenosových pásmech
Snadné a rychlé získání datového skladu, pokud zákazník žádný nemá nebo mu stávající řešení nevyhovuje Multitenatní nebo multijazykový přístup, který umožňuje více instanční produkční řešení nebo snadnou tvorbu neprodukčních prostředí včetně jasné alokace nákladů Některé velmi specifické funkcionality lze zrealizovat velmi obtížně nebo vůbec
Velmi zajímavé úspory z rozsahu vznikající díky tomu, že poskytovatel DWaaS obsluhuje více zákazníků současně Podpora pro pokročilé úlohy jako datová kvalita, predikce nebo Machine Learningu Při chybném plánování nekontrolovaný růst nákladů
Transparentní finanční model, kdy lze snadno vyčíslit celkové náklady na datový sklad, a to fakticky včetně většiny mzdových nákladů Standardizované datové formáty a datové služby (např. JDBC, ODBC atd.) Nižší in-house znalost tématiky Data Warehousingu
Lepší SLA zajišťující maximální dostupnost, kvalitu i výkon Silný důraz na metadata management a dokumentaci Nutnost odpisu existujících investic do stávajícího řešení
Vysoká elasticita kapacit pro výpočty i uložení dat, kdy lze šetřit na některých typech kapacit průběžně (např. nastavení pro běžný provoz vs. nastavení pro měsíční uzávěrku) Silný důraz na bezpečnost, protože DWaaS je zároveň i obchod s důvěrou Nutnost řešit iniciální migraci dat ze stávajícího řešení
Žádné problémy s personálním obsazením vývoje a provozu datové skladu Pravidelné aktualizace, protože dodavatel řeší hromadně Možné pochybnosti o bezpečnosti
Vysoká dostupnost, funkční zálohování i Disaster Recovery, a to i v případě opravdu rozsáhlých pohrom a katastrof díky různým scénářům nasazení Silná integrace s ETL Zákazník nemusí být procesně kompatibilní s novým řešením
Jasně definovaný životní cyklus datové skladu Kvalitní podpora SQL Fixní softwarové komponenty s těžko modifikovatelným vývojovým cyklem
Definována udržovaná architektura řešení Podpora pro dávkové, near real-time i real-time zpracování Nedostatečná zralost dodavatele nebo zákazníka
Maximální automatizace řešení včetně proaktivního monitoringu a optimalizací Jasně definované zodpovědnosti včetně smluvního rámce Vyšší technická složitost celého řešení
    Jistý typ vendor lock-in

Z tabulky je patrné, že výhody DWaaS převažují nad nevýhodami. Migrace do režimu DWaaS je obvykle snadná, protože tuto fázi lze vyřešit ve spolupráci s poskytovatelem, který tento krok neprovádí poprvé a má s datovými migracemi bohaté zkušenosti. Kvalita poskytovatele je proto klíčovým prvkem pro DWaaS. Cena by rozhodně neměla být jediné a hlavní výběrové kritérium, je nezbytné vzít v úvahu kvalitativní parametry.

Za kolik?

Kolik takový DWaaS stojí? Cenové modely mohou být velmi různorodé a přizpůsobené možnostem a preferencím zákazníka, a to v podobách od výkonových plateb vázaných na jednu nebo více metrik (základní metrikou bývá datový objem) až po fixní platby včetně různých kombinací, které umožňují snadné a transparentní finanční plánování a následné úspory. Na DWaaS lze díky elasticitě a využití Best Practices dodavatele opravdu výrazně ušetřit a odstranit původní neefektivní in-house řešení datového skladu, které mohlo i zbytečně odvádět pozornost zákazníka od skutečného businessu.

DWaaS se na trhu prosadí

S ohledem na neustále rostoucí potřeby kvalitní a spolehlivé datové analytiky a nedostatku odborníků na data a datové sklady na trhu, představuje DWaaS způsob, jak tento nesoulad vyřešit. Proto DWaaS čeká skvělá budoucnost a budeme se s těmito pokročilými řešeními potkávat stále častěji. Obecně se nemusíme v úvahách o DWaaS omezovat pouze na klasický relační datový sklad, můžeme uvažovat i o outsourcingu celé analytické platformy. DWaaS lze doporučit i pro řešení typu logický datový sklad, rozšířený datový sklad obohacený o nerelační části nebo nerelační datový sklad založený na Big Data technologiích. Jediným reálným problémem bude najít toho správného DWaaS poskytovatele.

Martin Bém Martin Bém
Autor působí jako Senior Consultant ve společnosti Adastra. Aktivně se věnuje návrhu a vývoji datových skladů, Data Governance a datovému modelování, vždy s důrazem na přidanou hodnotu řešení pro zákazníky. Podílel se na řadě projektů datových skladů v České republice i v zahraničí, primárně v oblasti bankovnictví a finanční služeb.
Denisa Ludvíková Denisa Ludvíková
Autorka je junior konzultantkou ve společnosti Adastra. Zaměřuje se na datovou analýzu, datové modelování a analýzu trendů v oblasti Information Managementu.

Kalendář akcí
Konference - Semináře - Školení
Časopis IT Systems/Speciál
Aktuální číslo časopisu IT Systems Aktuální číslo časopisu příloha #1
Archív časopisu IT Systems
IT Systems 4 IT Systems 3 IT Systems 1-2 IT Systems 12
Archív časopisu IT Systems Special
Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1