It-systemer er en sårbar, men uundværlig størrelse. Alligevel er de omgivet af en besynderlig, afstandtagende respekt: Når der sker et større it-nedbrud, får de oftest lov til at passere, uden at nogen efterfølgende borer i hvorfor, eller forholder sig kritisk til de afgivne forklaringer.
Jeg har før skrevet om dette, men det har ikke ændret noget. Enhver it-ansvarlig kan stadig nøjes med at sige: ”Det var en menneskelig fejl” eller ”der var tale om hidtil uset fejl i et teknisk udstyr”. Begge dele passer sjældent! Nej trinene op til, under og efter uheldet er som regel: Benægtelse, skepsis, uduelighed, redningen og benægtelse – igen. Lad os se nærmere på de enkelte led.
Banægtelsen forekommer lang tid inden ulykken. Som regel er der ikke tale om én benægtelse, men flere små: Typisk således: ”Vi bør udskifte denne boks”. Svar: ”Det må vente”. Eller: ”Hvis denne enhed sætter ud, kan det få store konsekvenser”. Svar: ”Jeg hører hvad du siger, men lad os tage os af det, når vi får bedre råd”. De første tegn på lurende it-katastrofer forudses ofte på denne måde. Men de nødvendige handlinger og investeringer udskydes tit – til efter skaden er sket. Senest investerede IBM meget store millionbeløb i forbedringer af deres infratruktur – som konskvens af det store nedbrud d. 9. april 2008, der lammede mange danske virksomheder.
Skepsis er driftsvagtens umiddelbare reaktion. Langt, langt de fleste dage og nætter sker der ingenting. Men pludselig kommer der en alarm, som i første omgang ser uskyldig ud. Men indenfor de næste 30 minutter bliver det tydeligt, at noget et helt galt. Nu kommer stoltheden ind: Dette problem kan jeg løse, og derfor kaster de sig ud i at læse problemet.
Udueligheden tager nu over for en kort bemærkning. Masser af løsningsmuligheder afprøves, og tilbagemeldingen er hele tiden: ”Om 30 minutter er vi klar igen” Efter 2-4 timer (i den offentlige sektor 2 – 4 dage) træffer en ansvarlig chef beslutningen: ”Dette kan vi ikke selv klare”. Det lyder let, men er det ikke. For selvom et problem var forudset, er det ikke let at indrømme, at man ikke kan løse det. Men erkendelse af egne fejl er som bekendt vejen til helbredelse – også i it-verdenen.
Redningen kommer oftest i form af kollegaer eller eksperter, som kender det ramte system bedst. Den største opgave er som regel, at finde ud af, hvad problemet er. Når det først det er identificeret, går det hurtigt med at få alle systemer tilbage til normal drift. Når det er sket, er vi tilbage til start:
Benægtelsen kommer tilbage: De ansvarlige chefer stiller sig op og siger: ”Det sker ikke igen!” Eller udtaler ”Vi har fundet fejlen og rettet fejlen, så det ikke sker igen” Begge udsagn er letsindige få timer efter et nedbrud. Hvad nu hvis ejeren af et diskotek efter en brand sagde det samme – uden at brandteknikerne havde analyseret hvordan branden brød ud? Ville vi så acceptere udtalelsen? Næppe! Men alligevel er det de færreste der stiller spørgsmålstegn ved de ansvarlige chefers udtalelser efter store it-nedbrud.
Min opfordring skal lyde: Stop hykleriet og gør kort proces: Hvis du er ansvarlig for et vakkel-vorrent it-system, men kan ikke råbe chefen op: Gå din vej og find et bedre job! Hvis du er ansvarlig for, at et it-system fungerer: Sæt dig ned med dem, der passer det i dagligdagen. Og find ud af om det virkelig er ”fit for fight”. Og accepter aldrig lette (bort)forklaringer, eller udsagn om, at det aldrig sker igen. For det gør det. Den vigtigste lektie af alle it-nedbrud er, at de forekommer. Det, der skiller fårene fra bukkene, er antallet af nedbrud samt tiden, der går til alt er tilbage til normal drift.
Bragt som kommentar i Morgenavisen Jyllands-Posten d. 9 juni 2009
Skriv et svar