Menneskelige ledelsesfejl

Mandag den 13. oktober 2008, kl. 13.30: Alle elektroniske patientjournaler på hospitaler i det tidligere Århus Amt går i sort. Det er umuligt at læse eller opdatere patienternes journaler. Først 10 timer senere bliver de tilgængelige.

Men der udestår et større oprydningsarbejde, som først er afsluttet den følgende eftermiddag. Alle data, som blev registret mandag formiddag, er tabt og skal indtastes igen – med deraf følgende administrative pukler og muligheder for fejl.

Man skulle tro, at et så stort og langvarigt nedbrud ikke kunne lade sig gøre i et så livsvigtigt system. Region MidtJylland har da også indkøbt en hel del isenkram og dyre systemer for at undgå fadæsen. Det var bare ikke tilstrækkeligt. I en pressemeddelelse udsendt i sidste uge af regionen gives følgende forklaring på nedbruddet: »Kerneårsagen til hændelsen er en personfejl. En nyligt tilkommet medarbejder fik ved en fejl slettet nogle meget kritiske filer og dele af EPJ-systemet, hvilket forårsagede nedbruddet.«

Det var altså – som så ofte før – en liden menneskelig fejl, der væltede it-læsset.

Men det er ikke kun medarbejderen, der begik en fejl. Han handlede bare uvidende.

Nej, de største fejl var ledelsesfejl: Hvordan kan det ske, at en nybagt medarbejder overhovedet kan komme til at opdatere produktionssystemet på egen hånd? Endda på et tidspunkt, hvor der er allermest tryk på? Og hvorfor var ændringen ikke afprøvet på et testsystem, inden den blev foretaget på produktionssystemet?

Det vidner om nogle særdeles mangelfulde processer og procedurer omkring et så livsvigtigt system. Ansvaret for, at den slags er på plads, er uden tvivl ledelsens. Systemet skal i øvrigt udbredes yderligere i regionen den kommende tid.

Man må håbe, at ledelsen i Region MidtJylland får bedre styr på regionens it-processer og -procedurer, inden det sker.

Til min store overraskelse har hverken ansvarlige politikere eller kritiske journalister gjort en stor sag ud af forløbet. Men det er bestemt ikke første gang, at nedbrud i samfundsvigtige it-systemer går næsten upåtalt hen. Lad os tage et andet eksempel:

Onsdag den 22. oktober om eftermiddagen: En entreprenør skal skyde kabler under Ringvej Syd ved Århus. Dermed kommer han til at rive to vigtige TDC- lyslederkabler over. TDC’s knudepunkt for mobil- højhastighedsforbindelser i Århus begynder derefter at fungere forkert.

Den slags hændelser er forudset af TDC. Derfor er der et andet knudepunkt i Albertslund, og dette center skal nu tage over. Men noget går galt i overgangen, så til sidst går Albertslund-knudepunktet ned. Derefter går hele systemet ned. TDCs 3G-mobiltelefoni virker først kl. 03.30. Og hændelsen påvirker også TDC’s almindelige mobilnet, der bliver ramt af stor ustabilitet.

En vigtig del af vores samfunds infrastruktur virker i lang tid ikke, som den skal.

Igen er det værd at stille nogle oplagte spørgsmål: Hvordan kan det gå så galt? Og hvorfor tog det så lang tid at komme tilbage til normal drift?

En af årsagerne er – igen – det, som teknikerne gjorde. Til Computerworld udtalte teknisk direktør Flemming Hynkemejer fra TDC Mobil for nylig: »Fejlen viser, at de basale procedurer er fulgt. Men en række detaljerede instrukser var ikke opdaterede, og det er formentlig derfor, at det tog så lang tid at få nettet op igen«.

Nu kan jeg ikke lade være med at tænke: Har ledelsen i TDC prioriteret indtægtsgivende projekter højere end omkostningstunge opdateringer af væsentlige instrukser? Og hvis dette – forståeligt, men fejlagtigt – er tilfældet: Hvilke andre dele af vores lands infrastruktur er dermed blevet lige så sårbare som TDC’s nye højhastighedmobilnet viste sig at være?

Lad os håbe, at nogen – denne gang – vil stille de relevante spørgsmål direkte til TDC’s ledelse.

Bragt som kommentar i Jyllands-Posten og på epn.dk d. 4. november 2008


Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *