Zálohování a disaster recovery do cloudu má řadu výhod. Vyberte si včas jeden z doporučených scénářů
Dokážete v konkrétně definovaném čase obnovit IT služby vaší společnosti? V tomto článku cloudové encyklopedie se podíváme, jak se dá řešit zálohování pomocí cloudových služeb a vysvětlíme si výhody zálohování do cloudu.
Lukáš Hudeček
Zálohování a následná obnova dat nebo pokročilejší scénáře disaster recovery (dále DR) jsou v mnoha organizacích stále ještě podceňovaným tématem. Společnosti, které o data nikdy nepřišly, berou zálohování a testy obnovy často jen jako okrajovou záležitost.
Statisticky vzato však platí, že dříve nebo později k nějakému selhání dojde, ať už ho bude mít na svědomí HW, lidská chyba nebo třeba hackerský útok. Určitě jste v médiích zaznamenali zprávy o ransomware útocích, při kterých byla zašifrována data mnoha organizací, které tak zjistily, že umět data rychle obnovit je velmi důležité.
Není tedy otázkou jestli, ale kdy se něco stane v každé organizaci. Jak tomu můžeme předejít s pomocí zálohování do cloudu?
Nejprve trocha teorie
Než začnete ve své organizaci nasazovat zálohování, případně komplexnější DR řešení, musí tomu předcházet plánovací část. Nejprve definujeme základní parametry, jako je maximální čas obnovy (dále jen RTO) a maximální čas ztráty dat (dále jen RPO).
Ve větších organizacích bývá tato fáze součástí business continuity planning (BCP) nebo business impact analysis (BIA). Definujeme při ní kritičnost služby a víme, kolik nás bude stát její případný výpadek.
Z uvedených parametrů se definuje SLA služby. Když například máme SLA 99,9 %, můžeme si dovolit maximálně 8 h 45 min 56 s výpadku služby ročně.
Do toho ovšem musíme započítat i činnosti, jako jsou updaty OS, upgrady služby, migrace apod. Proto bychom volili parametr MTPOD (max. tolerable period of down time) na nejvýše 8 hodin a RTO na 4–6 hodin. Parametr RPO, tedy o kolik času jsme přišli, vychází z definice BIA.
Backup volíme v případech, kdy máme delší čas RTO a jsme schopni v definovaném časovém úseku data obnovit.
Disaster recovery používáme při krátkém RTO (většinou jednotky minut) a obnovu služby řešíme přepnutím do záložní lokality. Varianta disaster recovery je cenově nákladnější než backup, ale pokrývá více scénářů (jako ztráta hardwaru nebo celé lokality).
Příklad: Pokud služba běží na SQL serveru a máme nastavené přírůstkové zálohování databáze po 15 minutách, pak se ztráta dat pohybuje v rozmezí 0–15 min a RPO je max. 15 min. RTO závisí na tom, jak dlouho potrvá obnova databáze.
On-premise zálohování
Nejprve si zrekapitulujme nejčastější scénáře zálohování z on-premise prostředí:
- USB disky
Data odléváme na USB disky, které průběžně rotujeme. Levné řešení, vysoké RTO i RPO.
- NAS
Data odléváme na NASku a využíváme nativní SW z NAS nebo scriptů. Levné řešení, střední RTO, vyšší RPO.
- Zálohovací SW
Máme implementovaný specializovaný zálohovací SW s možností granulární obnovy dat. Důležitá data chráníme ještě off-site backupem do další lokality nebo serverovny. Středně drahé řešení, střední RTO, střední/nižší RPO.
- Backup & Disaster recovery scénář
Jedná se o enterpise scénář, který se skládá z komplexního backup řešení a disaster recovery řešení s možností rychlé obnovy dat nebo přepnutí provozu do záložní lokality. Je vhodný pro velké společnosti provozující kritické workloady nebo společnosti podléhající auditům a regulacím. Drahé řešení, v případě přepnutí služby DR je RTO velmi nízké a RPO nízké.
Proč se zálohování do cloudu vyplatí?
Výhoda použití cloudu pro zálohování a disaster recovery spočívá ve velkém množství volných prostředků, které můžeme v případě havárie rychle začít využívat.
Naproti tomu v on-premise prostředí musíme držet patřičné množství připraveného HW. V případě DR pak vyhrazujeme celou druhou lokalitu, která není po většinu času plně využívána a kde k HW ještě řešíme konektivitu, chlazení, síťové prvky apod. To představuje obrovské náklady navíc oproti cloudu, kde platíme pouze za uložená data a za prostředky platíme až v případě jejich využití.
U cloudu obecně platí, že data přenášená směrem dovnitř jsou zadarmo a za data přenášená ven se platí. Toho jde využít při jakémkoli scénáři off-site zálohování.
Příkladem je NAS storage, které dnes nativně umí připojit jak Azure Blob Storage, tak AWS S3 Glacier storage a automaticky na ně odlévat data z NAS. Stejně tak podporují připojení cloudových uložišť zálohovací SW jako Veeam, CommVault, Acronis aj. Výhodou je možnost připojení přes internet bez nutnosti zřizování VPN.
Long term ukládání dat do cloudu na uložiště jako Azure Blob storage archiv tier a AWS S3 Glacier archive umožnují dlouhodobé ukládání dat ve velmi dobrém poměru cena/výkon.
V případě použití Azure Backup nejsou datové přenosy vůbec zpoplatněny. Platíme pouze za službu na základě množství chráněných VM v on-premise prostředí a na základě uložených dat v Azure.
V rámci AWS Backupu platíme také pouze za použité místo. Ceny se drobně liší dle typy služby jako EFS, RDS Database apod. Obecně stojí uložení 1 TB dat službou AWS Backup jednotky dolarů měsíčně.
Možnosti zálohování do cloudu
Každý cloudový provider má implementované vlastní zálohovací technologie a řešení třetích stran. V případě:
- Azure to jsou Azure Backup a Azure Site recovery,
- AWS to jsou AWS Backup services a AWS Disaster Recovery,
- řešení třetích stran to jsou Commvault, Veeam, Acronis, Avamar a další.
Azure Backup
Tato technologie umožnuje zálohovat on-premise prostředky, jako jsou fyzické a virtuální servery na platformách Hyper-v a VMware.
Zálohování probíhá přes appliance deployvanou v lokálním prostředí, která zálohy ukládá částečně lokálně a následně do cloudu. Záleží na nastavení zálohovacích politik a na funkci instant recovery, kdy může obnova proběhnout z lokálního serveru bez nutnosti přenosu dat z Azure.
Vedle podpory on-premise prostředků jsou nativně podporovány všechny Azure prostředky jako:
- virtuální počítače
- managed disky
- SQL Server na VM
- PostgreeSQL
- blob storage
V případě obnovy můžeme obnovovat jak do on-premise prostředí, tak do Azure. Scénář obnovy prostředků do Azure je zajímavý v případě, že jsme přišli o lokální hardware v rámci nějaké havárie.
Azure Site Recovery (ASR)
Tato služba využívá podobné komponenty jako Azure Backup. Neprovádí ale pouze zálohu podle příslušné politiky, avšak kontinuálně replikuje data z chráněných prostředků, jako jsou fyzické servery nebo VM umístěná na hypervisoru VM-ware a Hyper-V.
Prostředky v rámci Azure jsou podporovány nativně. Zde při nasazení ASR probíhá replikace dat do jiného regionu s možností přepnutí provozu do replikované site. O tom jsme detailně psali v článku vysoká dostupnost služeb v cloudu.
Další výhodou ASR je možnost deploymentu replikovaných prostředků v izolované síti (V-netu). To lze použít k ověření funkčnosti DR, nebo pro účely testovacího prostředí, které je 1:1 k produkčnímu prostředí.
AWS Backup
Na straně AWS Backup jsou podporovány všechny typy AWS cloudových prostředků jako:
- Amazon S3
- Amazon EBS
- Amazon RDS including Amazon Aurora
- Amazon DynamoDB
- Amazon Neptune
- Amazon EFS
- Amazon EC2
AWS Backup také umožňuje zálohovat všechny VMware workloads na straně on-premise a ve VMware cloudu. Zálohování standardních fyzických serverů a jiných hypervisorů podporováno není. V případě ochrany fyzických serverů můžeme využít AWS Elastic Disaster Recovery.
AWS Elastic Disaster Recovery
Tato technologie umožňuje (stejně jako Azure Site Recovery) chránit všechny možné typy prostředků v on-premise, kde se RPO pohybuje v sekundách a RTO v minutách. Replikační agent je na úrovni OS a je možné ho využít na fyzických i virtuálních serverech.
AWS Elastic Disaster Recovery dále podporuje scénáře pro další cloud providery a replikaci jejich prostředků. V rámci AWS nativně podporuje replikaci Failover & Fail back mezi regiony.
Zálohovací řešení třetích stran
Mimo nativních řešení můžeme použít jakoukoli technologii třetí strany. Většinou je k dispozici formou appliance nebo nějakého hotového řešení, kde stačí dodat pouze vlastní konfigurace a licenci v modelu BYOL.
Výsledkem je rychlý deployment a konfigurace prostředků a licencování vlastních licencí stejně jako v on-prem. Zde máme na výběr dva scénáře:
1) Ke stávajícímu řešení připojíme cloudovou storage typu Azure Blob Storage nebo S3 Glacier přes AWS storage gateway a cloud využíváme pouze jako off-site uložiště.
2) Rozšíříme zálohovací infrastruktury do cloudu a provedeme deployment zálohovacích serverů a uložišť.
Doporučené scénáře zálohování do cloudu
Scénář 1
Dlouhodobá archivace dat na long term storage jako Azure Blob Storage v režimu Archive, nebo AWS S3 Glacier v režimu Archive, kde ceny začínají na 1–2 EUR za uložený TB dat měsíčně.
K ceně je potřeba přičíst transakční operace jako zápis a čtení, které jsou při jednorázovém uložení zanedbatelné. Archivy nejsou vhodné pro data, která často modifikujeme. V případě Azure je podmínkou uchovávat data nejméně 180 dní.
Scénář 2
Off-site backup pro NAS storage s využitím cloudových uložišť typu Azure Blob storage COL a Archive tieru nebo AWS S3 Glacier v Cold a Archive tieru.
Zde je potřeba správně navrhnout a nakonfigurovat replikačního agenta na NAS, aby data určená k dlouhodobé archivaci byla umístěna na archiv tieru a data, která jsou častěji modifikována a zrcadlena 1:1, končila na COL nebo HOT tieru.
Scénář 3
Off-site backup s využitím stávajícího zálohovacího SW a připojení cloudových uložišť typu Azure Blob storage nebo AWS S3 Glacier.
Tento scénář je využíván nejčastěji, neboť se jedná o nejlevnější možnost off-site backupu. Pokud na straně cloudu potřebujeme pouze deployvat uložiště, můžeme ho připojit přes internet bez nutnosti VPN.
Scénář 4
Off-site backup + DR s využitím stávajícího zálohovacího SW a rozšíření zálohovací infrastruktury směrem do cloudu – buď instalací na VM, nebo deploymentem příslušné appliance či platformní sužby.
Dále je nutné mít připravenu základní infrastrukturu: sítě, VPN, servery (dealokované) nebo pipeline a scripty, kterými během chvilky provedeme deployment potřebných uložišť a navýšíme výpočetní prostředky pro obnovu dat a vytvoření DR-Site s možností přepnutí provozu.
V tomto scénáři je důležitá architektura celého řešení, a to z důvodu síťových readresací, různého přesměrování provozu, integrací, nastavení Firewallu, DNS apod.
Scénář 5
Off-site backup + DR s využitím nativních služeb jako Azure Backup a AWS Backup.
Tento scénář vyžaduje základní infrastrukturu v cloudu jako VPN sítě, servery (dealokované) a nachystané deploymenty potřebných prostředků přes pipeline a scripty nebo IaC, kterými během chvilky navýšíme potřebná uložiště a výpočetní výkon pro obnovu dat a vytvoření DR-Site s možností překlopení provozu. Časy RPO a RTO dosahují desítek minut.
Scénář 6
Plné DR řešení s využitím Azure Site recovery nebo AWS Elastic Disaster Recovery,
Při tomto scénáři je možné dosáhnout minimálních časů RTO a RPO řádově v jednotkách minut. Vše je závislé na architektuře řešení a zvolených komponentách, kde jsou chráněny všechny prostředky replikačním agentem.
Závěrem k zálohování do cloudu
V dnešním světě digitalizace procesů a stále narůstajících podnikových dat vzrůstá důraz na dostupnost služeb definovanou v SLA. Z něj vychází tlak na pokročilejší scénáře zálohování a BCDR – business continuity & disaster recovery.
Jak jsme si v článku ukázali, v cloudu je možné implementovat mnoho scénářů – od jednoduchých, při nichž používáme pouze uložiště, pokročilé, při nichž využíváme obnovy dat v cloudu s pomocí nativních cloud nástrojů nebo specializovaných SW třetích stran. Až po komplexní Enterprise scénáře zajišťující velmi nízké RTO, kde při přepnutí dojde k automatickému deploymentu všech potřebných prostředků a přepnutí provozu.
Z pohledu provozu zálohování nebo DR do cloudu nemusíme řešit velké množství nevyužitého hardware, jeho údržbu, umístění někde v druhém datacentru nebo serverovně a všechny věci spojené s připojením, provozem a údržbou. Řešení postavená na cloudových službách proto dosahují úspor v desítkách procent.