Okrevalni načrt storitev IT

Posted on 15/05/2011

0


Z vse večjim pomenom informacijskih sistemov narašča tudi obseg morebitne škode, ki jo organizacije utrpijo ob prekinitvi njihovega delovanja. Vsak izpad storitev IT hkrati pomeni tudi izpad dohodka; v nekaterih primerih, če izpad traja predolgo ali če se nekateri ključni podatki trajno izgubijo, pa tudi grožnjo za obstoj same organizacije.
Za nemoteno poslovanje so najnevarnejši zastoji, ki so nepredvidljivi in uničujoči. Mednje štejemo izpade storitev IT, celotnih lokacij ali podatkovnih centrov zaradi človeških napak, napak na strojni in programski opremi, prekinitve omrežnih storitev, prekinitve komunikacijskega ali električnega omrežja, zrušitve stropa, nepravilno delovanje protipožarnega ali hladilnega sistema, uničujoč požar ali naravne katastrofe (potresi, poplave ali plazovi). Na žalost se je večina prej naštetih izpadov že zgodila v nekaterih slovenskih podjetjih.

Dandanes se organizacije vedno bolj zavedajo posledic nepričakovanih zastojev informacijskega sistema, ki jih lahko prinesejo izredne okoliščine. Po nastopu nepričakovanega uničujočega dogodka se mora v najkrajšem času zagotoviti normalno delovanje, saj so organizacije izpostavljene pritiskom (regulativa, konkurenčno poslovno okolje), ki krajšajo sprejemljiv čas okrevanja. Le-ta se dandanes šteje v urah in ne več v dnevih.

Potreba po hitrem okrevanju in vzpostavitvi poslovanja v prvotno stanje pa zahteva vnaprejšnje načrtovanje in pripravo.
Okrevalni načrt za storitve IT– kaj je to?
Okrevalni načrt za storitve IT je opis najhitrejše poti od katastrofe do popolnega delovanja in razpoložljivosti informacijskega sistema (IS).
Načrt ni le teoretični opis, ampak v testnem okolju praktično preverjen in v produkcijskem okolju delujoč način okrevanja. Je edina rešilna bilka v času, ko podjetje nima dostopa do podatkov in informacijskih storitev. Znižuje operativno tveganje trajne izgube podatkov in zvišuje verjetnost za pozitivno mnenje revizorja.
Veliko organizacij ima zaradi regulatornih zahtev ali konkurenčnega poslovnega okolja zelo kratek sprejemljiv čas okrevanja. Zanje je še posebej pomembno, da imajo izdelan in praktično preverjen okrevalni načrt okrevanja IT storitev, ker so njihovi stroški prekinjenega delovanja izjemno visoki.
Okrevalni načrt IT storitev in zakonodaja
V Sloveniji se zakonodaja o neprekinjenem poslovanju razlikuje od panoge do panoge, pritiski na organizacije, ki imajo načrte o neprekinjenem poslovanju brez testiranih okrevalnih načrtov, pa se stopnjujejo.
Zakon o bančništvu /ZBan-1/ (Ur. l. RS, št. 131/2006) določa, da mora vsaka banka izdelati krizni načrt in načrt neprekinjenega poslovanja (NNP), ki zagotavlja ustrezne pogoje, da tudi ob nastopu hudih poslovnih motenj nadaljuje s poslovanjem in da se ustrezno omejijo izgube banke zaradi teh motenj. Nadzor nad izvajanjem tega določila, kot tudi nad celotnim zakonom, izvaja Banka Slovenije.
Na podlagi Zakona o trgu finančnih instrumentov (Ur. l. RS, št. 67/07) je Agencija za trg vrednostnih papirjev izdala Sklep o podrobnejših organizacijskih zahtevah za upravljanje borznega trga in Sklep o organizacijskih zahtevah za vodenje centralnega registra in upravljanje poravnalnega sistema. Zakon o trgu finančnih instrumentov, za razliko od ZBan-1, določa tudi sankcije, in sicer se borza ali centralno klirinško-depotna družba kaznuje z globo od 25.000 do 125.000 EUR za prekršek, če ne izdela kriznega načrta ali NNP. Nadzor nad izvajanjem omenjenega zakona izvaja Agencija za trg vrednostnih papirjev.
Na podlagi Zakona o investicijskih skladih in družbah za upravljanje (Ur. l. RS, št. 26/05) je Agencija za trg vrednostnih papirjev izdala Sklep o kadrovskih, tehničnih in organizacijskih pogojih ter dokumentaciji (Ur. l. RS, št. 107/2007), ki od družbe za upravljanje prav tako zahteva, da mora vzpostaviti krizne načrte in NNP v pogojih hudih motenj poslovanja. Neprekinjeno poslovanje podjetij se sreča z implementacijo določil Basel II v bančnem svetu na točki operativnega tveganja, ki lahko povzroči zmanjšanje količnika donosnosti sredstev (angl. return on equity – ROE).
Za gospodarske javne službe (komunalno gospodarstvo, komunikacije, energetika, promet, koncesije) je bil na podlagi Zakona o prevozih v cestnem prometu (Ur. l. RS, št. 131/06) sprejet Pravilnik o pogojih in merilih za podelitev javnega pooblastila izdajatelja licenc (Ur. l. RS, št. 84/2007). Ta od vlagatelja zahteva, da mora imeti izdelan postopek in sredstva za obnovitev poslovanja v 48 urah po nesreči oziroma razpadu sistema. Pravilnik vključuje varno shranjevanje kopiranih podatkov in postopke za obnovitev funkcionalnih podatkov, ki jih mora vlagatelj navesti v načrtu neprekinjenega poslovanja. Nadzor nad izvajanjem zakona izvajata Ministrstvo za promet in Družba Republike Slovenije za ceste, posebnih sankcij pa zakon v primeru kršitve ne predvideva.
Agencija za pošto in elektronske komunikacije RS (APEK) je na podlagi Zakona o elektronskih komunikacijah (Ur. l. RS, št. 13/2007) izdala Smernice za zagotavljanje varnosti omrežij elektronskih komunikacij in informacijskih sistemov, s katerimi opredeljuje, da mora vsak operater izdelati NNP in načrt za ponovno vzpostavitev (DRP). Smernice imajo status priporočila in veljajo predvsem za javna komunikacijska omrežja in informacijske sisteme. Zaenkrat APEK preverjanja skladnosti s temi smernicami ne opravlja.
Okrevalni načrt storitev IT in neprekinjeno poslovanje
Okrevalni načrti se podrejajo načrtom neprekinjenega poslovanja, katerega del so. Brez okrevalnih načrtov za storitev IT ni mogoče govoriti o dejanski pripravljenosti, da se deklarirano neprekinjeno poslovanje tudi udejanji.
Okrevalni načrt storitev IT omogoča:
• celovit, organiziran in dosleden pristop k razreševanju kriznih situacij,
• menedžment neprekinjenega poslovanja kot dinamičen, proaktiven in cikličen proces, ki mora nenehno zagotavljati nemoteno poslovanje vseh posameznih enot organizacije, tudi v primeru nepredvidenih dogodkov in katastrof večjih razsežnosti,
• identificiranje potencialnega vpliva ogrožanja organizacije,
• določa okvir za vzpostavitev odpornosti in sposobnosti uspešnega odziva.
Elementi neprekinjenega poslovanja so:
• Analiza vpliva na poslovanje (angl. business impact analysis), ki je metoda za opredelitev poslovne vrednosti posameznih delov informatike (procesi, aplikacije, podatki). Analiza ugotovi ključne potrebe, ki so pomembne za vzpostavljanje in zagotavljanje    nemotenega delovanja poslovanja:
1. zagotovi finančne in druge podatke o posledicah na poslovanje v primeru nepredvidenih dogodkov, ki vplivajo na delovanje informatike,
2. določi pomembnost informacijskih procesov, aplikacij in podatkov,
3. določi ciljni čas vzpostavitve delovanja sistema (RTO) in ciljno točko obnavljanja podatkov (RPO),
4. zagotovi seznam informacijskih sredstev z določeno njihovo poslovno vrednostjo.
• Analiza in upravljanje tveganj, ki ugotovi ranljivosti in tveganja, ki jim je izpostavljeno podjetje, da bi jih po potrebi lahko ustrezno zmanjšali pri pripravi nove rešitve. Analiza tveganja v osnovi oceni dve vrednosti za vsako tveganje: grožnjo in potencialno škodo.
• Koncept obnove poslovanja, ki določi strategijo in postopke, ki se bodo uporabljali za obnovo poslovanja. Koncept je zasnovan na potrebah poslovanja, izraženih preko analize vpliva na poslovanje in na omejitvah naložbe. Je določitev najboljše finančno ustrezne rešitve za postavljene zahteve neprekinjenega poslovanja podjetja. Zahteve dobimo iz faze analize, predvsem iz analize vpliva na poslovanje.
• Načrt neprekinjenega poslovanja, ki je proces, ki zagotovi neprekinjeno poslovanje podjetja.
• Krizni menedžment, ki predstavlja sistematični odgovor na nepričakovane dogodke, ki lahko ogrozijo ljudi, lastnino in poslovanje organizacije. Je formalni odziv na vsak dogodek, ki lahko ogrozi finančno ali operativno stabilnost organizacije.
Poslovne koristi okrevalnega načrta storitev IT
Poslovne koristi okrevalnih načrtov za vaše storitve IT so:
1. organizacije, ki povrnejo svojo storitev IT v najkrajšem možnem času, so bolj učinkovite, ker imajo krajši čas nedelovanja, ko uporabniki ne morejo do podatkov,
2. organizacije, ki znajo hitro in zanesljivo povrniti svoje storitve IT, uživajo večje zaupanje kupcev,
3. organizacije, ki znajo hitro in zanesljivo povrniti svoje storitve IT, bolje izkoriščajo nove poslovne priložnosti na trgu,
4. organizacije, ki delujejo neprekinjeno, so bolj produktivne. Ocene stroškov prekinjenosti v večjih organizacijah v ZDA se gibljejo med 0,5 mio in 4,6 mio evrov (vir: Metagroup 2004).
Ko rešujemo storitve IT, ne rešujemo le izgubljenih podatkov, aplikacije ali dostopa do nje. Rešujemo prihodek, stranke, produktivnost, ugled in … podjetje. Podjetja, katerih poslovanje temelji na informacijskem sistemu in spletnih prodajnih poteh, ne morejo prodajati. Ustavijo se nakazila, nakupi delnic, izračuni ali sklenitve zavarovanj. Slabši denarni tok je posledica tudi prekinjenega izstavljanja računov in ponudb. Posledično lahko del strank tudi trajno izgubimo.
Ker ni dostopa do podatkov o kupcih, popustih, cenikih, reklamacijah in preteklih prodajah, pade tako kakovost poprodajnih storitev kot delovna storilnost. Vračanje na »papirno« poslovanje je težavno, iskanje med dokumenti počasno, sodelovanje ohromljeno. Raziskave v ZDA kažejo, da bankrotira 43 % podjetij, ki doživijo uničujoč zastoj informacijskega sistema. Med tistimi, ki najmanj 10 dni nimajo dostopa do podatkov, bankrotira kar 93 % podjetij.

Naj še tako zaupamo sebi in inženirjem, takrat ni čas za improvizacijo. Delovati je treba hitro, s točno določenimi potezami in v natančno določenem vrstnem redu.
Prednosti okrevalnega načrta storitev IT za sistemske inženirje

Nepričakovan uničujoč dogodek ustvarja posebne razmere za vse zaposlene, največji pritiski pa se stopnjujejo ravno na sistemske inženirje in direktorje informatike. Izkušnje iz storitvenega centra SRC in izkušnje naših strank kažejo, da vodilni sistemski inženirji, ki izvajajo postopke okrevanja IT storitev, bistveno lažje izpeljejo postopke okrevanja in operativne teste, če so le-ti dokumentirani, jasni, razumljivi, strukturirani in pregledni. Prednosti napisanega in testiranega okrevalnega načrta za sistemske inženirje so:

1. večamo stanje pripravljenosti infrastrukture IT na nepričakovane uničujoče dogodke,
2. nižamo tveganje, da se bodo podatki izgubili zaradi izpada delovanja storitve IT, izpada celotnih lokacij ali podatkovnih centrov,
3. dosegamo boljšo razpoložljivost in odzivne čase na infrastrukturi IT naročnika,
4. lažje upravljamo infrastrukturo IT na daljavo s proaktivnim poročanjem,
5. lažje spremljamo »zdravja« infrastrukture,
6. hitreje odkrivamo probleme in jih rešujemo,
7. naročniku ni treba vložiti v lastno testno okolje, lahko ga pripravijo strokovnjaki SRC v storitvenem centru SRC.

Težavnost izdelave okrevalnega načrta storitev IT
Priprava okrevalnega načrta za naročnikove storitve IT, ki bo praktično preverjen na naročnikovem okolju, je zahtevno delo ravno zaradi interdisciplinarnih znanj vseh sodelujočih. Med izdelavo okrevalnega načrta se prepletajo:
• znanja o operacijskih sistemih,
• znanje o tehnikah povrnitve iz varnostnih kopij (ang. Bare Metal Restore ali System State Restore) na enakovredne ali pa podobne fizične strežnike z zmogljivim, namenskim orodjem za izdelovanje varnostnih kopij (npr. Microsoft Data Protection Manager 2010 in 2012, HP Data Protector, IBM Tivoli Storage Manager),
• poznavanje zahtev po varnosti IS in načinu delovanja aktivnega imenika,
• sporočilni sistemi,
• znanje programiranja za doseganje višjih stopenj samodejnega izvajanja okrevalnih postopkov (Power Shell odpravlja potrebo po klikanju s čarovniki),
• poglobljeno poznavanje orodja za nadzor informacijskega sistema,
• sistemska znanja o SAN-u, FC-ju, VSS-ju, fizičnih in navideznih tračnih knjižnicah,
• fizična in navidezna strojna oprema ter
• metodološka znanja pri pripravi testnih postopkov.

Vsa ta znanja in izkušnje dobite pri certificiranih strokovnjakih SRC.

Postopki okrevalnega načrta storitev IT za sistemske inženirje
Izdelava okrevalnega načrta vsebuje:
1. pregled primernosti in zadovoljivosti sistemske zmogljivosti (SAN, mrežna stikala, hitrost in latenca mreže, tračne knjižnice, politika varnostnega kopiranja) na primarni lokaciji, opredelitev morebitnih ozkih grl sistema ter oceno vključevanja varne rezervne lokacije v sistem v najkrajšem možnem času;
2. izdelavo postopkov okrevanja (ang. Bare Metal Restore, System State Restore), okrevalni načrt za vsak programski izdelek, ki je gradnik storitve IT, z logičnim in fizičnim načrtom rešitve ter varnostnega kopiranja,
3. postavitev testnega okolja z naročnikovimi podatki na visokozmogljivi SRC IT infrastrukturi z uporabo virtualizacije ali fizičnih strežnikov. Na SRC IT infrastrukturi opravimo sistemske teste in predlog optimizacije gradnikov naročnikove storitve IT (optimizacija relacijske baze, SAN-a, tračnih knjižnic, revizijske sledi). Naročnik se lahko sam odloči, kdaj in kakšno testno okolje bo postavil v svoji organizaciji.
4. načrt in praktični preizkus delovanja okrevalnega načrta z orodjem za varnostno kopiranje in povrnitev (napr. HP Data Protector, DPM 2010, IBM TSM, EMC Networker) ter upravljanje infrastrukture IT (napr. SCOM 2007, HP Operations Manager).

Okrevanje lahko izvedemo s fizičnega na fizični strežnik, s fizičnega na navidezni strežnik ali pa z navideznega na navidezni strežnik.
Naročniku predamo naslednje dokumente: testni postopki, postopki okrevanja (ang. Bare Metal Restore BMR, System State Restore SSR), okrevalni načrt za vsak programski izdelek (napr. SCOM, Exchange 2010, Active Directory, DPM 2010) z logičnim in fizičnim načrtom rešitve ter z zagotavljanjem varnostnih kopij.
Testiranje postopkov okrevalnega načrta storitev IT za sistemske inženirje
Testiranje omogoča preverjanje definiranih postopkov ter zmožnost vseh udeleženih zaposlenih in zunanjih izvajalcev za dosledno in učinkovito uporabo načrta.
Vloga testiranja je naslednja:
• identificira nepredvidene postopke, izdatke, zastoje,
• preveri razpoložljivost virov,
• ugotovi resničen čas trajanja obnove,
• usposobi ljudi v njihovih vlogah pri obnovi,
• poveča zavedanje udeležencev o njihovi vlogi v načrtu neprekinjenega poslovanja.

Med samostojnim testiranjem lastnega okrevalnega načrta se informatika v organizacijah srečuje s težavami:
• z ozkimi grli na strojni opremi (pogosto potrebujemo ciljni strežnik za testno okrevanje, ki naj ima identično konfiguracijo kot primarni strežnik),
• z dolgotrajnim postopkom z ročnimi posegi: napačne konfiguracije strojne opreme in diskovnih particij, neuspešne namestitve Windowsov in Linuxa ter popravki vrednosti v registru, namestitve agentov za varnostno kopiranje,
• s slabšo izurjenostjo osebja zaradi prezasedenosti z dnevnimi nalogami, zaradi zapletenih postopkov, slabšega poznavanja orodij za varnostno kopiranje in pomanjkljive opreme.
Testni postopki okrevanja, ki ga kakovostno pripravijo izkušeni SRC strokovnjaki, vsebujejo preverjanje zdravja relacijskih baz, sporočilnih sistemov, portalov, OS-ov, diskovnih pogonov, strojne opreme, ustvarjanje alarma, priključevanje agentov na strežnik za upravljanje ter testiranje uporabniške izkušnje.

Pri okrevanju na nov ali podoben fizični strežnik z BMR moramo pridobiti novo strojno opremo, ki bo enaka ali podobna stari strojni opremi, jo priklopiti, izdelati instance LUN-a, pripraviti gonilnik za diskovni krmilnik, izvesti pripravo virtualne instance strežnika, opravila za kontrolo izpolnjevanja zahtev, povrniti sliko sistema, priklopiti prenosne nosilce, vstaviti instalacijske medije, nadaljevati z izdelavo instanc LUN-ov ter vključiti uporabnike v domeno.

Za uspešna okrevanja velja naslednje:
• izvajamo jih z orodji za kakovostno varnostno kopiranje in se jih redno testira,
• izpolnjujejo cilje RPO/RTO (ang. Recovery Point Objective/Recovery Time Objective) z rezervno lokacijo, razpoložljivo strojno opremo za okrevanje in z dokumentiranimi ter avtomatiziranimi postopki,
• opravlja jih izurjeno osebje na primarni in rezervni lokaciji.

Okrevalni načrt za storitve IT je nujna izbira, če ima organizacija načrt neprekinjenega poslovanja in želi biti pripravljena na nepričakovane zastoje IS-a ali uničujoče dogodke. Praktično preizkušen okrevalni načrt za storitve IT je opis najhitrejše poti od zastoja ali katastrofe do popolnega delovanja in razpoložljivosti IS-ja.

Organizacije, ki povrnejo svojo storitev IT v najkrajšem možnem času, so bolj učinkovite, ker imajo krajši čas nedelovanja, ko uporabniki ne morejo do podatkov, uživajo večje zaupanje kupcev, imajo nižje stroške prekinjenega poslovanja, bolje izkoriščajo nove poslovne priložnosti na trgu in so bolj produktivne.

Z okrevalnimi načrti za organizacije dvigamo raven pripravljenosti infrastrukture IT na nepričakovane uničujoče dogodke, nižamo tveganje, da se bodo podatki izgubili zaradi izpada delovanja storitve IT, dosegamo boljšo razpoložljivost in odzivne čase na infrastrukturi IT, lažje upravljamo infrastrukturo IT na daljavo, lažje spremljamo »zdravje« infrastrukture in hitreje odkrivamo probleme.
Zakaj je SRC najboljša izbira za okrevalni načrt?

Zato, ker v SRC edini izpolnjujemo vse tri bistvene pogoje:
1. imamo reference in izkušnje z okrevalnimi načrti na najnovejših verzijah Microsoft izdelkov SCOM, DPM, AD, SQL Server in Exchange, HP Data Protector, IBM TSM in Oracle 11g;
2. imamo bogate izkušnje na projektih visoke razpoložljivosti. Hitro znamo odkriti slabosti naročnikovega okolja in predlagati spremembe za hitrejše okrevanje in višjo stopnjo avtomatiziranosti postopka;
3. imamo zmogljivo lastno testno okolje, fizično in virtualno infrastrukturo IT ter izkušene certificirane strokovnjake IT, ki lahko naročnikove zahteve spremenijo v delujočo rešitev ter opravijo selitev testnih podatkov z naročnikovega na okolje SRC.

Andrej Žabkar

Tagged: