To pierwsza prezentacja w cztero-częściowym cyklu omawiającym znaczenie wysokiej dostepności w kontekście umów SLA. Prezentacje przeznaczone są dla odbiorców z kręgu ITPro, a publikowane na zywo na portalu VirtualStudy.pl
***
This is first part of my four-parts cycle about Service Level Agreement for ITPros. It a session for Virtualstudy.pl education portal.
2. Tobiasz Janusz Koprowski „Anorak”
• związany z informatyką od połowy lat dziewięćdziesiątych
• kilkuletnie doświadczenie w informatyce bankowej [Zorba, AS/400, ICBS,
BTeller]
• od ponad czterech lat pracuje w dużej spółce informatycznej
• na co dzień interesujący się technologiami SharePoint, office system,
Windows i SQL Server. Nieobce mu są takie pojecia jak wysoka dostępność,
plany awaryjne, disaster recovery, dobre praktyki ISO/ITIL
• konsultant i wdrożeniowiec przy projektach audytów licencyjnych,
systemów procedur bezpieczeństwa i operacyjnych, wdrożeniach platformy
Microsoft SharePoint, systemów antywirusowych,
•uczestnik kilku programów Microsoft: Connect, Community Leadership
Programm, ITPro Momentum, VS2010 Terminology Community, Windows 7
Beta 2 PL, Desktop & SharePoint Deployment Planning Service,
• lider wrocławskiej grupy PLSSUG
• prelegent na spotkaniach społeczności (online i offline)
•Członek Technical Support Team w GITCA (wcześniej Culminis)
odpowiedzialny za rejon EMEA, APAC, NORAM, LATAM
• autor artykułów technicznych i recenzent wydawnictwa aPress
• właściciel kilku blogów (w tym dwóch specjalizowanych)
POZA PRACĄ: fotografia koncertowa, dziennikarstwo muzyczne, medycyna
ratunkowa, onkologia, wolotariat społeczny.
3. Posiadane certyfikacje:
•Microsoft Certified Professional
•Microsoft Certified System Administrator
•Microsoft Certified Technology Specialist
•Windows 2008 Server Application Configuring
•Windows 2008 Server Infrastructure Configuring
•Windows 2008 server Active directory Configuring
•Microsoft Certified IT Professional
•Windows 2008 Server Administrator
•Microsoft Licensing Specialist
•Microsoft Lite Licensing Sales Specialist
•Microsoft Small Business Specialist
•Microsoft Office Sales Specialist 2003/2007
•Avocent Technical Support
•Novell System Administrator
4. CYKL SPOTKAŃ o tematyce HA i SLA
SESJA I - 26.02.2010, godz. 20:30 - Spojrzenie na SLA
ABSTRAKT: Dla większości z nas serwer jest "pudełkiem które coś tam robi". Aplikacja pracująca na tym serwerze jest
"tylko mniejszym pudełkiem" Dla niektórych każdy z tych elementów może być sercem infrastruktury
przedsiębiorstwa. Ich dostępność jest ważna dla nas, ale przede wszystkim dla naszych przełożonych i klientów. Tych
ostatnich zresztą często nie obchodzi jak i dlaczego to pudełko działa. Dane mają być dostępne w określonym czasie
i postaci. Czy trzymane są na serwerze Windows, w Active Directory, czy może w tabelach SQL - to juz jest bez
znaczenia. Do tego się zobowiązaliśmy podpisując umowę o świadczenie usług - czyli SLA. Dlaczego jest ono dla nas
ważne? Po co administatorowi wiedza o SLA? Czy SLA to tylko sprawa kierownika/dyrektora/prezesa? Na te i kilka
innych pytań postaramy się znaleźć odpowiedzi podczas tej prezentacji.
SESJA II - 10.03.2010, godz. 20:30 - Windows Server, wysoka dostępność i umowy SLA
W pierwszej sesji cyklu mieliśmy okazję zapoznać się z ogólnymi zasadami funkcjonowania umów SLA, wymagań ich
stosowania czy zakresu odpowiedzialności. W tej części chciałbym przedstawić jakie mechanizmy są dostępne dla
systemu Microsoft Windows Server aby zmaksymalizować funkcje wysokiej dostępności.
SESJA III - 12.03.2010, godz. 20:30 - SQL Server, wysoka dostępność i umowy SLA
Ponieważ udało nam się zrozumieć podstawy funkcjonowania rozwiązań wysokiej dostepności, czas by przyjrzeć się
drugiemu (po Windows server) z najważniejszych i najczęściej objętych umowa SLA środowisku: Microsoft SQL
Server. W jaki sposób zabezpieczyć to środowisko? Co wspólnego może mieć z tym DBA? Jakie rozwiązania przynosi
SQL Server 2008/2008 R2? Na te pytania postaramy się odpowiedzieć w trzecim odcinku naszego cyklu.
SESJA IV - 26.03.2010, godz. 20:30 - Usługi kolaboracyjne (exchange/sharepoint), wysoka dostępność i
umowy SLA
Zarówno Windows Server jak i SQL Server stanowią podstawę naszych rozważań o wysokiej dostępności i jej
znaczenia w umowach o świadczenie usług. Oba środowiska "siedzą" sobie gdzieś na zapleczu. Zaś uzytkownicy
końcowi mają styczność przede wszystkim z produktamu typu Exchange Server czy SharePoint Server. Czy te
środowiska równiez podlagają naszym rozważaniom? Czy dla nich też mamy spełnić wymagania SLA?
5. Agenda
• Czym jest HA (High Availibility)
• Rodzaje niedostępności (PSO/USO)
• Wskaźniki mierzalności
• Dziewiątki
• Dlaczego SLA – co to jest?
• Wskaźniki mierzalności
• Grarancje SLA (przykłady)
• Umowy SLA
• Struktura umowy
• Wzór umowy
• Zastosowanie SLA w organizacji
• Zależności SLA i HA
• Q&A
6. Czym jest HA ?
• Wysoka dostępność (HA) to zapewnienie nieprzerwanej pracy
urządzeń i systemów na potrzeby (zazwyczaj) środowiska
produkcyjnego w przedsiębiorstwie.
• Ma zapobiegać utracie danych w wyniku:
• błędów oprogramowania,
• defektów produkcyjnych,
• awarii sprzętowych
• naturalnych katastrof
• błędów człowieka
• innych nieprzewidzianych zdarzeń
7. Dwa rodzaje niedostępności:
• PSO Planned System Outages – Planowana Niedostępność Systemu
• zaplanowana minimalna niedostępność systemu, spowodowana
koniecznością przeprowadzenia prac modernizacyjnych, instalacji
poprawek, wymianą/rozszerzeniem rozwiązań sprzętowych,
• uzgodniona z klientem i nie wpływająca na postanowienia HA i SLA,
do momentu…
• USO Unplaned System Outages – Nieplanowana Niedostępność
Systemu
• wystąpienie błędu uniemożliwiającego częściową, bądź całkowita
pracę środowiska w sposób odczuwalny, mierzalny przez klienta
• powodująca wysokie koszty w przypadku konieczności napraw, jak
również płatności karnych za niewykonanie SLA
8. Wskaźniki wydajności (HA)
• Każdy z nas słyszał o popularnych dziewiątkach?
• Co to naprawdę jest dostępność rzędu 99,99%?
• Dostępność 99,99% to NIEDOSTĘPNOŚĆ rzędu 0,01% w
zadanym okresie (np. rocznym), czyli…
• Ile to jest w przeliczeniu na niedostępność
serwera/środowiska/bazy:
Availability = MTBF / MTBF + MTTR
• MTBF -> Mean Time Between Failures
• MTTR -> Mean Time To Repair
9. Niedostępności w dniach, godzinach, minutach
Downtime per Downtime per Downtime per
Availability % year month* week
90% 36.5 days 72 hours 16.8 hours
95% 18.25 days 36 hours 8.4 hours
98% 7.30 days 14.4 hours 3.36 hours
99% 3.65 days 7.20 hours 1.68 hours
99.5% 1.83 days 3.60 hours 50.4 min
99.8% 17.52 hours 86.23 min 20.16 min
99.9% ("three nines") 8.76 hours 43.2 min 10.1 min
99.95% 4.38 hours 21.56 min 5.04 min
99.99% ("four nines") 52.6 min 4.32 min 1.01 min
99.999% ("five nines") 5.26 min 25.9 s 6.05 s
99.9999% ("six nines") 31.5 s 2.59 s 0.605 s
10. Czym jest SLA?
• SLA – Service Level Agreement.
• Początki sięgają 1980 roku i umów pomiędzy operatorami
telekomunikacyjnymi i klientami końcowymi.
• Obustronnie negocjowalna umowa o świadczenie usług (nie tylko IT,
choć tych w szczególności)
• Powinna być zawarta formalnie, choć prawnie dopuszczalna jest
umowa nieformalna
• Obejmująca poziom i zakres świadczonej usługi za pomocą
mierzalnych wskaźników (poziom dostępności, użyteczności,
wydajności)
• Umowa powinna mieć sprecyzowany zakres minimum i maksimum
dla każdej podlegającej jej usługi
11. Mierzalność SLA
Nie ma umowy SLA bez określonych wskaźników pomiaru!!!
PRZYKŁAD DLA CALL CENTER / SERVICE DESK:
• ABA (Abandonment Rate): Odsetek porzuconych połączeń podczas
oczekiwania na odpowiedź.
• ASA (Average Speed to Answer): Średnia czasu (zazwyczaj w sekundach)
potrzebny do połączenia z help deskiem.
• TSF (Time Service Factor): Odsetek odebranych połączeń w precyzyjnych
ramach czasowych, np. 80% w 20 sekund.
• FCR (First Call Resolution): Procent połączenia, podczas których problem został
rozwiązany bez konieczności przełączania do innego eksperta
• TAT (Turn Around Time): Czas potrzebny do zakończenia określonych zadań.
12. Gwarancja SLA w Google
Piotr Waszczuk, IDG News Service
31 października 2008 16:17
Computerworld
Wczoraj (30 października) Google wprowadził gwarancję dostępności komercyjnej wersji pakietu aplikacji
biurowych. Umowa SLA ma obejmować m.in. aplikacje: Kalendarz, Dokumenty i Google Sites oraz usługę
Google Talk. Wcześniej gwarancja taka dotyczyła tylko usługi Gmail.
Google zobowiązał się do zapewnienia dostępności pakietu Google Apps Premier Edition na poziomie 99,9 proc. w
skali miesiąca. W ramach rekompensaty za ewentualne dłuższe przerwy w dostępności koncern zamierza oferować
klientom darmowy dostęp do komercyjnych usług. Przykładowo, jeśli dostępność Google Apps spadnie poniżej
poziomu 99 proc. w ciągu miesiąca klienci będą mogli za darmo korzystać z aplikacji przez trzy dni. W przypadku
dostępności na poziomie niższym niż 95 proc. użytkownicy Google Apps Premier Edition zostaną zwolnieni z opłat na
15 dni.
Uwzględniane będą jednak tylko przestoje trwające dłużej niż 10 minut. Umowa SLA nie uwzględnia również
planowanych przerw technicznych, zapowiedzianych z co najmniej pięciodniowym wyprzedzeniem.
Jednocześnie Google zobowiązuje się, że przerwy takie nie będą trwały dłużej niż 12 godzin rocznie.
Zapowiedź rozszerzenia gwarancji dostępności jest odpowiedzią na wzrastającą liczbę zarzutów dotyczących spadku
jakości oferowanych usług. Tylko w październiku niektórzy użytkownicy Google Apps nie mogli korzystać z aplikacji
nawet przez 30 godzin. Według oficjalnych informacji z aplikacji Google Apps korzysta ponad 500 tys. firm z całego
świata oraz ponad 10 mln aktywnych użytkowników.
13. Gwarancja SLA w CROWLEY DATA POLAND
SLA - GWARANCJA JAKOŚCI ŚWIADCZONYCH USŁUG
Podstawą sukcesu Crowley Data Poland jest szczególna dbałość o jakość usług i obsługę klienta. Jednak w
odróżnieniu od konkurencji - prócz składania obietnic - bierzemy pełną odpowiedzialność i każdemu z naszych
Klientów udzielamy pisemnej Gwarancji Jakości Świadczonych Usług - SLA (Service Level Agreement).
Niespełnienie warunków SLA powoduje wypłaty rekompensat na rzecz naszych Klientów.
1. Precyzyjnie określenie
1. Gwarancji dostępności usługi Crowley Internet - 99,9%
2. Gwarantowany czas reakcji zespołu Crowley na awarię - 1 godzina
3. Gwarantowany czas usunięcia awarii - 7 godzin
4. Gwarantowana jakość działania sieci IP
5. Średnia miesięczna wartość opóźnień pakietów w sieci IP Operatora nie większa niż 30 ms
6. Średnia miesięczna wartość strat pakietów w sieci IP Operatora nie większa niż 0,5%
2. Istotne rozszerzenie Regulaminu Świadczenia Usług Telekomunikacyjnych Crowley Data Poland
3. Finansowa odpowiedzialność za prawidłowe funkcjonowanie usług i podjęte zobowiązania.
Szczegółowych informacji udzielają nasi konsultancji w Biurze Obsługi Abonenta.
• Szczegółowe warunki SLA
• Wprowadzenie Gwarancji Jakości Świadczonych Usług (SLA) jest wyrazem naszego partnerskiego
nastawienia do Klientów oraz przekonania o najwyższej jakości usług. Działanie naszej sieci jest
kontrolowane 24 godziny na dobę, przez wszystkie dni w roku. Ewentualne usterki są częstokroć wykrywane i
usuwane zanim Klienci zdążą je zauważyć.
http://www.crowley.pl/AdditionalLinkHeaderContent/view/id/2/title/gwarancja-sla.html
14. Gwarancja SLA w TP SA
Pakiet Serwisowy SLA
• Pakiet Serwisowy SLA zapewnia firmie, która np. korzysta z rozwiązania IP VPN ekspercką
obsługę, jaką jest:
- dedykowany pracownik TP - Opiekun Techniczny Klienta,
- dostęp do raportów on-line.
• Usługa jest skierowana do firm dużych i średnich, które korzystają lub zamierzają korzystać z usług
transmisji danych w TP ( IP VPN, Transmisja Danych Frame Relay/ATM, Dostęp do Internetu Frame
Relay) wraz z certyfikatem jakości SLA (ang. Service Level Agreement).
• Opiekun Techniczny Klienta jest osobą odpowiedzialną za wsparcie posprzedażne użytkownika i jako
wykwalifikowany specjalista jest w stanie zapewnić wszelką pomoc związaną z technicznym rozwojem
i utrzymaniem usług.
Wymagania
• Twoja Firma musi posiadać wszystkie dostępy w sieci zakończone ruterami należącymi do TP i przez
TP zarządzanymi
• dostępy muszą być objęte płatnym poziomem SLA, tj. SLA progres lub SLA Premium (dopuszczalne
jest świadczenie pakietu serwisowego tp SLA w przypadku, gdy Twoja Firma nie ma wykupionego
SLA dla pojedynczych dostępów)
http://www.tp.pl/prt/pl/klienci_biz/transmisja_danych/ip_vpn/670407/;jsessionid=F1C080ABCD4574EB0B
315BBFE6C76CAD.portal21;PSID=F1C080ABCD4574EB0B315BBFE6C76CAD.portal21
18. SLA – co to ma wspólnego ADMINEM?
• Hours Of Operation:
• Godziny w których partycja/tabela/baza danych/folder/zasób/macierz musi
być dostępna
• Może być różny dla różnych części bazy danych, zależnych np. od aplikacji
• Procent czasu działania usługi:
• Procent czasu w ciągu (zakresu czasowego) kiedy
usługa/partycja/tabela/baza/folder/zasób/macierz jest dostępna
• Godziny zastrzeżone dla przestojów:
• Podane z wyprzedzeniem godziny przestojów (przerwy techniczne)
ułatwiają pracę użytkownikom
• Metody pomocy dla użytkowników
• Czas odpowiedzi od HelpDesku
• Czas reakcji DBA na zdarzenie
19. SLA – co to ma wspólnego z ADMINEM - cd
• Liczba użytkowników w systemie
• Liczba transakcji obsługiwanych w danej jednostce czasu
• Dopuszczalne poziomy osiągów dla dostępu do różnych operacji
• Minimalny czas wymagany do replikacji na różne serwery
• Termin na odzyskanie danych z awarii
• Przypadkowe usunięcie danych
• Uszkodzenie bazy danych
• SQL Server Crash
• OS Server Crash
• Czas potrzebny na odczytanie danych w internecie (np. odczyt/zapis tabeli
sprzedaży) tak by mona było kontynuować prowadzenie sprzedaży
• Maksymalna ilość miejsca
• Maksymalna ilość miejsca na tabele/bazy
• Ilość użytkowników w konkretnych rolach
20. Czy wiesz dlaczego SLA jest ważne
• Tak naprawdę to coś więcej niż tylko podpisana umowa między
klientem a twoim szefem.
• Jest to kontrakt który również TY musisz spełniać
• Jeśli jest podpisana umowa na zero przestojów i zero utraty danych
(abstrakcja?) to musisz mieć pewność, że w przypadku korupcji
możesz tę umowę spełnić (zmiana/usunięcie danych celowo przez
autoryzowanego użytkownika).
• Jeśli nie możesz spełnić SLA, to biznes narażony jest na przestoje i
utratę danych
• Końcowym efektem jest złożenie swojego CV do agencji pracy…
21. Czy myślisz że możesz spełnić swoje Service Level Agreement?
• Musisz wiedzieć jakie są warunki/wymagania dla SLA jeżeli
masz je spełnić
• Jak możesz je spełnić, jeśli nie wiesz że istnieje umowa
SLA?
• Jak możesz przejrzeć umowę skoro nikt Cię nie zaprosił na
spotkanie w sprawie stworzenia umowy SLA?
• Końcowym efektem jest złożenie swojego CV do agencji
pracy…
22. Czy uważasz, że możesz spełnić swoje SLA?
• Plan odbudowy wygląda świetnie na papierze – ale czy kiedykolwiek
go przetestowałeś?
• Załóżmy taką sytuacje:
• Dopuszczamy 15 minut niedostępności dla bazy danych o wielkości
100 GB.
• Jesteśmy w stanie w ciągu tych 15 minut podstawić kopię bazy dla
użytkownika
• Co zrobisz w przypadku uszkodzenia bazy danych?
• Co zrobisz w przypadku uszkodzenia dysku?
• Co zrobisz w przypadku spalenia się płyty głównej?
• Co zrobisz w przypadku przecięcia kabla FC?
• Jak dużo czasu zajmie odzyskanie z backupu?
• Jak dużo czasu zajmie przywiezienie tasiemki z backupem z drugiej lokalizacji
oddalonej od centrum Warszawy o 5 kilometrów o godzinie 14?
Czy dalej spełniasz SLA 15 minut przestoju?
23. Podsumowanie
Musisz wiedzieć o istnieniu SLA
Musisz brać udział w tworzeniu umowy SLA
(wymagań/możliwości/technologii)
Musisz mieć plany awaryjne – PRZETESTOWANE
Musisz mieć wiedzę o swojej odpowiedzialności
Musisz mieć możliwość techniczną dotrzymania umowy SLA
24. Linki
Amazon S3 Service Level Agreement
http://aws.amazon.com/s3-sla/
Service Level Agreement and SLA Guide
http://www.service-level-agreement.net/
Business Excellence Institute
http://www.bei.org.pl//
SLA - umowa na święty spokój
http://komputerwfirmie.gazeta.pl/itbiznes/1,59368,7600130,SLA___umowa_na_swiety_spokoj.html
Dobre Umowy SLA – grupa na GoldenLine
http://www.goldenline.pl/grupa/dobre-umowy-sla
The SLA world
http://www.sla-world.com/
25. Tematyka: wprowadzenie do SLA
Organizator: Software-Konferencje sp z o.o. || Cel szkolenia: Celem szkolenia jest przedstawienie procesu budowania skutecznego porozumienia SLA i
przekazanie uczestnikom wiedzy przydatnej w przygotowywaniu umów Service Level Agreements na potrzeby własnych środowisk.
• kiedy używać SLA
• identyfikacja kluczowych elementów efektywnego SLA
• jak wybrać najbardziej odpowiednie miary
• planowanie SLA
• efektywne zarządzanie umową SLA,
• przegląd SLA, a przegląd parametrów SLA
• kiedy umowa idzie źle, przerywanie umowy SLA
• kontrakt SLA
Dlaczego warto wziąć udział w szkoleniu:
• Dowiedzą się Państwo, jaka jest rola i miejsce SLA w organizacjach oraz jakie możliwości otwierają umowy wewnętrzne
• Nauczą się Państwo, jak przygotować się do wdrożenia SLA i jakich sytuacji i pułapek należy unikać w tym procesie
• Poznają Państwo zasady konstruowania, raportowania i monitorowania umów SLA
• Dowiedzą się Państwo, jak planować strukturę, ustalać wymagania i projektować SLA
• Poznają Państwo kluczowe wskaźniki i mierniki wydajności i efektywności SLM
• Przegląd praktycznych rozwiązań pozwoli Państwu efektywnie wykorzystywać umowy SLA i dostosować je do warunków w Państwa firmie
Program: Co to jest proces Service Level Management
• Jak przygotować organizację IT oraz komórki biznesowe do wdrożenia procesu SLM
• Zarządzanie wymaganiami biznesowymi przy zachowaniu dobrej relacji biznesowej
• Co jest niezbędne do podpisania dobrej umowy SLA
• Jak monitorować i raportować działanie zasad opisanych w umowie SLA
• Jakie działania należy podjąć, aby zobowiązania w umowie SLA spełniały oczekiwania biznesu i były realne jednocześnie
• Co powinna zawierać optymalna umowa SLA
• Jak nie zginąć w gąszczu zmian i modyfikacji umowy SLA
• Co zrobić, aby cała organizacja IT zrozumiała jaki ma wpływ na dotrzymanie gwarancji zawartych w umowie SLA
• Jak zbadać to czy Klient Wewnętrzny faktycznie jest zadowolony z usług, które świadczy IT w kontekście umowy SLA
• Spełnianie wysokich oczekiwań biznesu w kontekście tendencji do obniżania budżetu IT
• Jakich narzędzi potrzebuje IT, aby gwarancje zawarte w umowie SLA były realne
• Jak zadbać o budowanie właściwych relacji z Klientem Wewnętrznym w zakresie procesu SLM
http://lex.pl/?cmd=szkolenia_jedno,19279&co=1&p=1&a=1
26. Answer? Question! Question? Answer!
Dziękuję za uwagę, proszę o ocenę mojej sesji
PYTANIA PO SESJI / KONTAKT:
MAIL: KoprowskiT@windowslive.com | MSG: KoprowskiT@windowslive.com
JABBER: KoprowskiT@alfa.incenti.net.pl | SKYPE: tjkoprowski (niezmiernie rzadko)
TWITTER/FACEBOOK/LINKEDIN: KoprowskiT
BLOGI:
ITPRO Anorak’s Vision: http://itblogs.pl/blogs/notbeautifulanymore/default.aspx [PL]
Volume Licensing Specialites: http://volumelicensingspecialites.wordpress.com [PL]
Anorak’s Influence View: http://anorakinfluenceview.wordpress.com [EN]
STRONY:
Społeczności IT: http://www.ms-groups.pl | Windows Server System: http://www.wss.pl
Virtual Study Portal: http://www.virtualstudy.pl | CodeGuru: http://www.codeguru.pl