(ne)známá firma & ORBIT
Zatímco jsme se zákazníkem diskutovali otázku, zda by měl investovat do rozšíření HW, nebo raději do přechodu na cloudové řešení, došlo u něj k nehodě. Náš servisní zásah tak celou debatu urychlil. Co vše bylo v sázce? Jak se nám podařilo paralyzovanou firmu resuscitovat? A jak může zákazník opakování podobného scénáře zabránit?
Nepodařená migrace dat
Co se této projekční strojírenské firmě přihodilo?
IT oddělení mělo naplánovaný rušný víkend plný příprav na modernizaci. Nikdo ale nečekal, že ve dvou po sobě jdoucích dnech a ve stejný čas dojde k významnému selhání jednoho z přetížených datových úložišť.
Ukázalo se, že obnova 25 TB dat z cloudové zálohy výrobce datového úložiště by trvala více než týden. IT systémy společnosti by zatím zcela nebo částečně nefungovaly. IT zákazníka bylo v tu chvíli na kolenou – a s ním v podstatě celá firma.
VÝPOČETNÍ LIMITY RŮSTU ANEB JAK TO CELÉ ZAČALO
Pro zmíněného zákazníka jsme před šesti lety stavěli citrixovou farmu pro virtualizaci desktopů projektantů a konstruktérů. Úspěšný projekt mu ušetřil čas při administraci koncových stanic a zvýšil efektivitu i mobilitu konstruktérů.
Od té doby však reálný počet uživatelů zákazníka vzrostl na dvojnásobek. Původní hardware na tyto počty nebyl dimenzován a nedokázal uživatelům zajistit vysokou dostupnost.
Pokud chce firma v podobné situaci zůstat u HW řešení, musí si nechávat výpočetní rezervy a „neždímat“ všechny zdroje na maximum. Pokud však tyto kapacity nutně potřebuje, musí zkrátka dokoupit další zdroje.
Zákazník se tedy rozhodoval, zda investovat do rozšíření HW, nebo do přechodu na cloudové řešení. Havárie datového úložiště celý rozhodovací proces urychlila.
„Sváteční“ servisní zásah
IT administrátorovi v tu chvíli nezbylo nic jiného než požádat ORBIT, servisního partnera společnosti, o servisní zásah. Pro Petra Lenze a jeho kolegy nabral v tu chvíli prodloužený víkend neplánovanou podobu.
Pochopení situace je základním předpokladem pro kvalifikovaná rozhodnutí. Proto si servisní tým nejprve ověřil přesnou historii událostí, které vedly k nastalému stavu.
Vzhledem ke stavu datového úložiště byla na stole reálná možnost, že zákazníkovi skutečně nezbyde, než se týden obejít bez dat. Díky až neurvalému odhodlání problém vyřešit našli kolegové nakonec způsob, jak data z havarovaného úložiště přesouvat na úložiště náhradní a systémy postupně startovat z něj.
I tak trvalo obnovení provozu základních IT služeb firmy skoro tři dny. Naštěstí dostatečně krátce na to, aby mohli uživatelé po návratu do práce normálně pracovat.
Všechno zlé (servisní zásah) je k něčemu dobré (přijmutí opatření)
Ačkoliv se na závadě podílel také lidský faktor, nemuselo k ní dojít. Servisní zásah prokázal, že se zákazník nemůže spoléhat na technologie, které nepřetržitě vytěžuje na maximum. Musí pro svou potřebu zajistit nové zdroje.
O několik týdnů později přijala společnost rozhodnutí situovat klíčové technologie do cloudu, kde ji nedostatek zdrojů nebude omezovat. Riziko opakování podobné situace tím bude minimalizováno.
Jak takový přechod zrealizovat? Nejprve jsme pro zákazníka vypracovali podrobnou strategii, která ho připravila na udržitelnou adopci cloudových služeb a poskytla mu realistickou představu o ušetřených firemních nákladech. Tu jsme následně úspěšně otestovali v rámci proof-of-conceptu.
Výsledkem bude na míru nastavené nové a skutečně flexibilní IT prostředí, které zlepší fungování firmy. Navržené řešení přitom budeme po celou dobu jeho provozu podporovat a dále ho rozvíjet. Zákazník se tak bude moci věnovat vlastnímu rozvoji, a ne strachování o vitalitu IT prostředí.