O nas
Kontakt

Chaos w CrowdStrike: Dlaczego globalna awaria IT uziemiła tak wiele samolotów w zeszłym tygodniu?

Laura Kowalczyk

Passengers queueing at London Stansted Airport in Essex, amid reports of widespread IT outages affecting airlines, broadcasters and banks, 19 July, 2024.

Ujawniło ono scentralizowaną naturę współczesnych podróży lotniczych, ale nie wszystkie linie lotnicze zostały nią w równym stopniu dotknięte.

Piątek 19 lipca miał być jednym z najbardziej pracowitych dni lata dla europejskich lotnisk. Ale największa na świecie awaria IT miała inne plany dla setek tysięcy urlopowiczów.

Przyczyną była wadliwa aktualizacja oprogramowania firmy zajmującej się cyberbezpieczeństwem CrowdStrike, która zablokowała systemy internetowe wielu dużych i małych firm korzystających z usług firmy Microsoft.

Wczoraj Microsoft oskarżył Komisję Europejską, twierdząc, że unijne przepisy dotyczące konkurencji uniemożliwiają jej odrzucenie aktualizacji.

Podczas gdy skutki kryzysu wywołanego przez wielkie firmy technologiczne nie ustępują, lotniska i linie lotnicze analizują swoje plany awaryjne, aby ocenić, czy ich własne plany awaryjne sprawdziły się w obliczu katastrofy.

Oto, jak doszło do rewolucji w świecie lotnictwa i dlaczego niektóre miejsca ucierpiały bardziej niż inne.

Jak globalna awaria informatyczna wpłynęła na linie lotnicze i lotniska?

Chociaż stresujące sceny miały miejsce na lotniskach, które szybko zapełniły się pasażerami uwięzionymi na lotniskach, piątkowa awaria informatyczna była przede wszystkim problemem linii lotniczych.

Dzieje się tak, ponieważ większość linii lotniczych polega na oprogramowaniu opartym na chmurze Microsoft Office365, które pomaga im w planowaniu lotów i dostarczaniu załogi, pasażerów i bagażu tam, gdzie chcą.

Publiczną stroną tego są odprawy. Kiedy w piątek rano systemy online linii lotniczych przestały działać, uciekli się do ręcznej odprawy na lotniskach. Oczywiście jest to znacznie wolniejszy proces, który narastał lawinowo w ich napiętych harmonogramach.

Według firmy FlightAware, zajmującej się śledzeniem lotów, do piątkowego popołudnia na całym świecie odwołano ponad 4000 lotów, a opóźniono 35 500.

„Awaria IT wpłynęła na wiele systemów, uniemożliwiając obsługę lotów” – wyjaśnia rzecznik holenderskiego przewoźnika KLM. „Gdy tylko stało się jasne, że komputery i laptopy z systemem Windows nie mogą się uruchomić z powodu aktualizacji innej firmy, rozpoczęliśmy plan zapasowy, a mianowicie wykonywanie procesów, które można wykonać ręcznie, a jednocześnie stosowanie obejścia, aby jak najszybciej uruchomić maszyny”.

Awaria spowodowała zamieszanie w systemach zoptymalizowanych pod kątem wydajności, nie tylko w odniesieniu do odprawy pasażerów i bagażu.

Linie lotnicze zlecają szereg zadań firmom zajmującym się obsługą naziemną (sprzątanie kabin, ochrona przy bramkach itp.). Niektóre z systemów tych firm również ucierpiały, co oznaczało, że pracownicy mieli problem ze znalezieniem odpowiedniego miejsca o właściwej porze.

Które europejskie lotniska ucierpiały najbardziej w wyniku awarii informatycznej?

Bardziej mieszany obraz dotyczył samych lotnisk. Wczesnym rankiem w piątek lotnisko Berlin Brandenburg Airport miało problemy z systemami IT, które zostały rozwiązane szybciej niż w przypadku niektórych linii lotniczych i innych lotnisk. Aena, która zarządza lotniskami w Hiszpanii, twierdzi, że cała jej sieć została dotknięta.

Ale inne europejskie lotniska twierdzą, że to była wyłącznie kwestia linii lotniczych. „Systemy lotniskowe nie zostały w żaden sposób dotknięte, ale system biletowy używany przez cztery linie lotnicze na miejscu” — mówi rzecznik lotniska w Hamburgu, które odnotowało 49 odwołań w piątek.

„Wszystkie systemy lotniska nie zostały dotknięte problemem” – informuje również lotnisko London Stansted, „jednak niektóre systemy odprawy linii lotniczych również ucierpiały, w tym Ryanair, największy partner lotniczy London Stansted”.

Dlaczego niektóre lotniska ucierpiały bardziej na skutek awarii informatycznej niż inne?

Pomimo faktu, że transport lotniczy jest silnie powiązany i globalny, co powoduje problemy wszędzie, nie wszystkie części świata zostały dotknięte w równym stopniu.

Amerykańskie linie lotnicze odnotowały nieproporcjonalnie dużą liczbę odwołanych lotów. Według danych Cirium amerykańscy przewoźnicy musieli w sobotę odwołać około 3,5 proc. swoich lotów, a skutki uboczne utrzymywały się.

Do możliwych przyczyn zalicza się większy stopień outsourcingu technologii i większą ekspozycję na systemy operacyjne Microsoftu, które otrzymały wadliwą aktualizację od CrowdStrike, powiedział agencji AP Robert Mann, były dyrektor linii lotniczych.

Inni eksperci wskazują na model „hub and spoke” preferowany przez Delta, American i United – które były jednymi z najbardziej dotkniętych amerykańskich linii lotniczych. W ramach tego modelu loty są kierowane przez kilka głównych lotnisk, gdzie pasażerowie robią przesiadki.

Ten poziom centralizacji opiera się na dobrze dopracowanym systemie, więc opóźnienia kumulują się szybciej niż w przypadku lotów „z punktu do punktu”.

„Europejskie linie lotnicze nie są tak uzależnione od systemu hub-and-spoke jak linie amerykańskie” – mówi Michael McCormick, profesor programu zarządzania ruchem lotniczym na Embry-Riddle Aeronautical University, w wywiadzie dla TylkoGliwice Travel.

Na przykład British Airways jest w dużej mierze zależne od jednego węzła w Heathrow. To stawia je w silniejszej pozycji niż linie lotnicze z USA z wieloma węzłami. W porównaniu z Delta, BA „było w stanie lepiej zrozumieć wpływ awarii, a następnie opracować alternatywną strategię radzenia sobie z nią”.

Nie zagubiono tak wielu samolotów ani załóg na terenie UE, co ułatwiło powrót do pracy następnego dnia.

Podobnie jak w USA, duże lotniska „hub”, takie jak Schiphol i Heathrow, ucierpiały bardziej niż ich mniejsze odpowiedniki. Hub w Amsterdamie zgłosił łącznie 200 odwołań lotów i 150 opóźnień z powodu trudności linii lotniczych.

Dlaczego tanie linie lotnicze poradziły sobie lepiej?

„Im bardziej linia lotnicza jest zależna od serwerów w chmurze – co oznacza, że ​​ma nowocześniejsze systemy informatyczne – tym bardziej jest podatna na wyzwanie” – wyjaśnia McCormick.

W USA przewoźnicy niskokosztowi byli mniej dotknięci, ponieważ generalnie mają starsze platformy oprogramowania i obsługują więcej lotów typu punkt-punkt. Southwest Airlines nie ucierpiało w ogóle, ponieważ nadal działają na systemie Windows 3.1.

Podobnie było w Europie, gdzie takim liniom lotniczym jak easyJet i Ryanair wiodło się lepiej niż większym międzynarodowym przewoźnikom w rodzaju BA, Air France i Lufthansa.

Zdaniem McCormicka, ponieważ sieci są prostsze, tanie linie lotnicze nie potrzebują skomplikowanych systemów automatyzacji, aby na bieżąco śledzić, gdzie znajdują się wszystkie samoloty i załogi.

Czy lotniska mogą w przyszłości paść ofiarą podobnej katastrofy informatycznej?

„To naprawdę pokazuje, że to, czego ludzie nie są świadomi, może mieć największe skutki” – dodaje McCormick.

Od piątku centralizacja branży oprogramowania znalazła się w centrum uwagi.

„Widzieliśmy teraz jeden z reperkusji braku różnorodności oprogramowania” – pisze dla MSNBC Marie Vasek, profesor informatyki na University College London. „Jeśli nic się nie zmieni, takie katastrofalne wydarzenie nieuchronnie się powtórzy”.

Linie lotnicze i lotniska będą teraz weryfikować swoje systemy, ale one i ich klienci nadal są podatni na ataki.