Poučili jsme se ze slavných fiasek s výpadky sítě??

Každá společnost ví, že plánování pro případ havárie je nedílnou součástí strategie kontinuity provozu.

Ostatně každý podnik, který se ve velké míře spoléhá na IT systémy, si uvědomuje, že i menší výpadek se může rychle vyšplhat na miliony dolarů v podobě ztráty produkce.

Jak časté jsou výpadky? Podle průzkumu společnosti Zetta se 54 % IT profesionálů setkalo s výpadkem trvajícím osm a více hodin. Nejčastějšími důvody výpadků mezi dotazovanými byly výpadky proudu a selhání hardwaru, tedy okolnosti, které společnost zřejmě nemohla ovlivnit.

Ale jsou?

Stojí za to podívat se na důsledky jen několika nedávných příkladů fiasek při odstávkách:

Silicon Valley se vrátilo do doby temna

Dne 21. dubna 2017 ochromil San Francisco na velkou část dne rozsáhlý výpadek proudu. Výpadek, který nebyl první v tomto roce, byl pro město v srdci Silicon Valley, pravděpodobně jednoho z nejdůležitějších technologických center v zemi, obzvláště nepříjemný.

Město se tak vrátilo v čase, výtahy přestaly jezdit, semafory zhasly a podniky byly nuceny platit kreditními kartami pomocí staromódních papírových otisků.

Původně bylo oznámeno, že příčinou byl požár v rozvodně. Skutečným viníkem, jak ukázalo vyšetřování, nebyl požár samotný.

PG&Mluvčí společnosti E Barry Anderson uvedl, že výpadek začal v jejich rozvodně Larkin. „Měli jsme poruchu zařízení, katastrofální selhání jednoho z našich jističů. Při selhání jističe vznikl v jeho okolí požár.“ Během několika hodin byl tento malý jistič zodpovědný za stovky milionů ztracených příjmů městských podniků.

Nebylo to poprvé, co město postihl velký výpadek proudu v důsledku starého vybavení. Stárnoucí infrastruktura ve městě ukazuje na další výpadky proudu v budoucnosti.

Výpadek sítě znemožňuje lety společnosti Delta

V srpnu 2016 postihl společnost Delta Airlines rozsáhlý výpadek, který vedl ke zrušení více než 1 800 letů a obrovským ztrátám na příjmech.

Problémy začaly v pondělí brzy ráno, kdy došlo k poruše modulu řízení napájení v řídicím centru společnosti, což vedlo k přepětí v transformátoru a úplné ztrátě napájení.

Zatímco posádky pracovaly na rychlém obnovení dodávky elektřiny a stabilizaci systému, situaci zhoršila skutečnost, že několik systémů a zařízení se během výpadku nepřepnulo na záložní napájení.

Kvůli postiženým systémům nemohla společnost Delta během výpadku zpracovávat odbavení, provádět typické operace nástupu na palubu a vysílat letadla. Zpoždění a rušení letů v kombinaci s předpisy týkajícími se doby odpočinku pilotů a posádek vedlo k dominovému efektu, který vyústil ve zrušení více než 1 800 letů trvajících více než tři dny.

Co jsme se dozvěděli?

Navzdory titulkům, které tyto události (a mnoho dalších) vyvolaly, je zřejmé, že mnoho společností nedávalo pozor.

Podle společnosti Gartner průměrná velká korporace stále zažívá 87 hodin výpadků ročně, což firmy stojí více než 300 000 dolarů za hodinu. Je to škoda, protože forenzní analýza událostí nejčastěji odhalí, že závady, které vedou k výpadkům, jsou ve skutečnosti předvídatelné a lze jim předcházet.

Fiasku aerolinek Delta se dalo předejít řádným plánováním a předvídavou analýzou. Kdyby byla identifikována potenciální porucha a vyměněna nefunkční součástka, která způsobila přepětí, dalo se fiasku zcela předejít.

Technologie a potenciální léčba

Abychom byli spravedliví, taková prognostická schopnost ještě před několika lety nebyla k dispozici; obvykle musel stačit nejlepší odhad.

To vše se změnilo díky velkým datům a algoritmům, které dokáží nepřetržitě monitorovat zařízení, porovnávat data v reálném čase, přesněji předpovídat poruchy a doporučovat včasnou údržbu.

Pracuje na něm již řada společností. Newyorská společnost Aquant.io využívá umělou inteligenci a strojové učení k předvídání a zlepšování služeb tím, že zajišťuje, aby pracovníci údržby měli k dispozici potřebné díly a nástroje dříve, než se díly porouchají. Systém je také schopen identifikovat potenciální poruchy.

Společnost Exacter Technology, která se zaměřuje na elektrické sítě, využívá proces, který rozpoznává elektrické signatury vyzařované z nadzemního vedení, které naznačují prasklé a znečištěné izolátory, což je hlavní příčina většiny požárů elektrických sloupů. Lze provést okamžité opravy a data sloučit s existujícími geografickými informačními systémy (GIS) a údaji o výpadcích, což pomůže předvídat opakující se poruchy způsobené znehodnoceným zařízením.

Pokud chceme v budoucnu předcházet podobným nákladným výpadkům, zdá se, že nejlepší strategií je být aktivní a vyměňovat díly dříve, než selžou. Vzhledem k tomu, že všechna průmyslová odvětví jsou stále více založena na IT a závislá na technologii internetu věcí, nezdá se, že by taková předvídavost byla jen dobrým nápadem: bude životně důležitá.

Jestli jsme se z nedávné série fiasek s výpadky něco naučili, tak to, že když se nějaké odvětví zastaví, vlny následků sahají velmi daleko.

A my jsme ti, kteří jsou, ať tak či onak, nakonec postiženi.