fb
IT Systems 4/2023 IT Security 23. 5. 2023 8:20

Archivace dat vs. zálohování

V čem se liší a kdy co použít?

Archivace dat a zálohování po­má­hají udržovat firemní systémy a služby v chodu, chránit know-how nebo skladovat soubory mimo pro­dukční prostředí. Jsou proto klíčo­vou součástí IT infra­struktury. Vě­děli byste čím se od sebe odlišují?

Ztráta důležitých dat může znamenat vážný legislativní problém, nefunkčnost e-shopu nebo obrovské finanční náklady. Naštěstí existuje celá řada postupů a metod, které dokáží těmto černým scénářům zamezit. Patří mezi ně i archivace a zálohování dat.

Obě zmíněné metody jsou založené na kopírování dat z jednoho úlo­žiš­tě na druhé za účelem budoucího použití. Tím ale jejich podobnost končí, zato zásadních odlišností je celá řada. Mezi ty nejdůležitější patří účel uchovávání dat, interval zapisování, způsob skladování, rychlost obnovy a s tím vším související typ storage řešení. V článku proto shrnujeme hlavní rozdíly mezi oběma metodami a uvádíme i možnosti, jak se s archivací i zálohováním technologicky vypořádat.

Účel uchovávání dat

Základní dělicí čárou mezi zálohováním a archivací dat je důvod, proč chceme data duplikovat a skladovat na odděleném úložišti. Od toho se odvíjí i další rozdíly a vhodné technologie.

Účelem zálohování je především možnost obnovy dat ve chvíli, kdy dojde k jejich ztrátě. Taková situace může nastat například kvůli selhání hardwaru nebo chybě v softwaru zajišťujícího zápis dat. Důvodem může být i lidský zásah, a to jak nechtěný (přepsání či smazání dat), tak chtěný (hackerský útok).

Oproti tomu archivace dat se provádí zcela jiným záměrem – dlouhodobě skladovat data, u kterých není prioritou rychlá obnova. Typickým příkladem jsou daňové doklady a různé účetní záznamy, které je ze zákona nutné uchovávat po určitou dobu.

Obecně se archivace dat používá pro soubory, které nejsou potřebné pro každodenní chod firmy, ale je dobré je mít uložené na bezpečném místě. Může jít třeba i o kamerové záznamy, které má smysl procházet až v případě, kdy mohou odhalit původ nějakého problému. Oba procesy – zálohování i archivace dat – se v praxi často kombinují a vzájemně se doplňují.

Interval ukládání

Jedním z hlavních rozdílů vyplývajících z povahy obou úkonů je rychlost a interval ukládání dat na oddělené úložiště. Zatímco zálohování probíhá obvykle v pravidelném intervalu, k archivaci se častěji přistupuje nepravidelně, zkrátka ve chvíli, kdy se objeví soubor vhodný k archivaci, například při proplacení faktury nebo po účetní uzávěrce.

V případě intervalu zálohování dat hrají důležitou roli tyto dvě otázky: „O kolik dat je přijatelné přijít?” a „Za jak dlouho se tato data nasbírají či vytvoří?”. Představme si třeba jednoduchou situaci – programátora vývojářské firmy, který osm hodin denně programuje novou aplikaci, jejíž kód se ukládá na vzdáleném serveru. Jak často jeho práci zálohovat?

Pravděpodobně nebude pro společnost velkou ztrátou, pokud přijde o pár hodin programování svého zaměstnance. Kdyby ale došlo k poškození serveru, na kterém by bez zálohy byla uložena jeho několikaměsíční práce, jednalo by se už o citelnou škodu. Nastavení vhodného, například denního, intervalu záloh tak může být vhodnou strategií, která je kompromisem mezi potenciálním rizikem a cenou za zálohování (s vyšší frekvencí obvykle rostou náklady).

Bezpečnost používané technologie

Pro oba způsoby odlévání dat do speciálního úložiště se vzhledem k odlišným nárokům využívají různá řešení. V obou případech je však důležitá bezpečnost. Například je třeba zvážit, jestli data při přenosu či ukládání šifrovat a jaký hashovací algoritmus použít.

Na místě je rovněž ukládat data do geograficky odděleného místa od původního zdroje. Tím se předejde ztrátě dat z důvodu přírodní katastrofy, požáru nebo fyzického útoku na datové centrum. Samozřejmostí by pak mělo být pravidelné testování a prověřování funkčnosti.

Pro archivaci je pak důležitá durabilita dat (trvanlivost). Tu umí zajistit různé softwarově definované storage. Příkladem může být úložiště založené na technologii Ceph, které v případě výpadku identifikuje zasažená data a vytvoří novou repliku, aby byla zajištěna možnost opravy, a tím i konzistence dat.

Klíčovou roli hrají, jako vždy, i náklady, které se odvíjí od individuálních potřeb firmy. Obecně však lze říct, že pro účely archivace se využívají spíše levnější úložiště. V MasterDC je třeba možné sáhnout po sdíleném backup serveru nebo nesdíleném storage serveru. Dražším řešením jsou pak softwarově definované storage, jako je například zmíněná Ceph Storage.

U zálohování, na rozdíl od archivace, je zásadní rychlost ukládání a obnovy dat, aby byla zajištěna vysoká dostupnost aplikací či webových stránek. Vhodné jsou proto řešení obsahující rychlé disky (třeba SSD NVMe) zapojené přes SAN do diskových polí nebo softwarově definované storage, které umí zajistit i takřka bezvýpadkový přechod z poškozeného uzlu na záložní uzel.

Rozdílem je také práce se soubory na cílovém úložišti. Při zálohování se často ukládá aktuální stav aplikací a souborů. Při dalším zápisu (záloze) se tato data smažou nebo přepíšou, aby na úložišti zůstala pouze aktuální verze. Velikost dat tak nutně nemusí (ale může) narůstat. Možností, jak tohoto stavu dosáhnout i způsobů, jakým se data zálohují, je celá řada.

Proces archivování dat je mnohem jednodušší. Soubory se zkrátka ukládají na cílové úložiště a jejich objem narůstá až do chvíle, kdy už nejsou potřebné a lze je smazat. Aby nevznikl chaos, a bylo možné data snadno dohledat, využívají se různé programy na prohlížení a vyhledávání souborů v archivu (tzv. archive browser).

Jaké řešení zvolit?

Než přejdete k volbě toho správného řešení, je nutné si zodpovědět základní otázky: Kolik bude firmu stát výpadek zásadních IT aplika­cí a systémů za určitý čas? Které soubory jsou pro každodenní chod firmy nezbytné a které je nutné dlouhodobě skladovat z legislativ­ních či jiných důvodů? Jaké náklady na zálohování a archivaci jsou pro firmu přijatelné a kolik by oproti tomu stála ztráta dat?

Jakmile budete znát co nejjasnější odpovědi, je na místě se spojit s IT odborníkem, který převede vaše představy do konkrétního technologického návrhu a pomůže vám s realizací.

Jan Můčka Jan Můčka
Autor článku je PR specialista společnosti MasterDC.

Kalendář akcí
Konference - Semináře - Školení
Časopis IT Systems/Speciál
Aktuální číslo časopisu IT Systems Aktuální číslo časopisu příloha #1
Archív časopisu IT Systems
IT Systems 10 IT Systems 9 IT Systems 7-8 IT Systems 6
Archív časopisu IT Systems Special
Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1