Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Phd Thesis: The Algorithms for Protection of Operating Systems with Special Emphasis on the Neutron Radiation
1. The Algorithms for Protection of Operating Systems
with Special Emphasis on the Neutron Radiation
Algorytmy ochrony systemów operacyjnych ze
szczególnym uwzględnieniem wpływu promieniowania
neutronowego
Bartłomiej Świercz
promotor: prof. dr hab. inż. Andrzej Napieralski
Katedra Mikroelektroniki i Technik Informatycznych
Politechnika Łódzka
Łódź, 27.10.2008
2. Plan prezentacji
Projekt CARE i współpraca z ośrodkiem DESY
Wpływ promieniowania neutronowego na systemy komputerowe
Cel, założenia i tezy pracy doktorskiej
Wykonane badania i opracowane oprogramowanie
Algorytm ochrony systemów operacyjnych przed błędami
pojedynczymi
Podsumowanie wykonanych prac i wnioski
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 2 / 34
3. Projekt CARE
X–FEL
FLASH
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 3 / 34
6. Wpływ promieniowania neutronowego na tranzystor MOS
Neutron jest obojętny
elektrycznie
Reakcja jądrowa (n, α)
Cząstka α (He++ ) o dużej
energii LET
Oddziaływanie poprzez jonizację
Błędy pojedyncze = Single Event Upsets (SEU)
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 6 / 34
7. Błędy SEU w pamięci SRAM
VDD VDD
BL BL
Rejestry procesora
M3 M4
SEU strike
M5
M6
Pamięć podręczna (cache)
M2
Bufory
M1 "off
WL WL
Vnode [V]
Feedback
Initial V1 V2
value
Error occurs Regeneration
V1 V2
SEU
0 SEU strike Time [s]
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 7 / 34
8. Błędy SEU w pamięci DRAM
Column
Row
T
Sensitive node Pamięć główna komputera
C Bufory dużej wielkości
Vnode [V]
Initial
value
C
Noise margin SEU
Error occurs
N+
P substrate
0 SEU strike Time [s]
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 8 / 34
9. Propagacja błędów SEU w układach
SEU cin
y
s
x
cout
Propagacja błędów = Single Event Transient
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 9 / 34
10. Ochrona przed błędami pojedynczymi
Ochrona sprzętowa
Elementy i układy półprzewodnikowe projektowane w technologii
rad-hard (dedykowany proces technologiczny)
Redundancja sprzętowa
Izolacja systemów elektronicznych od źródła promieniowania za
pomocą przegród betonowych lub ołowianych
Ochrona programowa
Projektowanie oprogramowania z uwzględnieniem błędów
sprzętowych:
algorytmy SIHFT (Software Implemented Hardware Fault Tolerance)
kody detekcji i korekcji błędów EDAC (Error Detection and Correction)
wykrywanie błędów poprzez zmianę obliczeń algorytmicznych
(Algorithm Based Fault Tolerance)
Dedykowane kompilatory i biblioteki automatyzujące proces
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 10 / 34
12. Cel i założenia przeprowadzonych badań
Opracowanie programowych metod ochrony systemów
komputerowych przed błędami pojedynczymi
Zastosowanie systemów komputerowych zbudowanych ze
standardowych i powszechnie dostępnych elementów (COTS)
Przeźroczyste dla aplikacji algorytmy ochrony
Algorytmy ochrony przed błędami realizowane na poziome systemu
operacyjnego
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 12 / 34
13. Tezy pracy (1/2)
Teza I w języku angielskim:
The implementation of the memory error detection algorithms at the
operating systems kernel level allows to protect commonly used computer
systems against Single Event Upsets generated by the neutron radiation
Teza I w języku polskim:
Implementacja algorytmów wykrywających błędy w pamięci na poziomie
jądra systemu operacyjnego pozwala na ochronę powszechnie stosowanych
systemów komputerowych przed błędami pojedynczymi powstającymi na
skutek oddziaływania promieniowania neutronowego
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 13 / 34
14. Tezy pracy (2/2)
Teza II w języku angielskim:
The exploitation of interrupts generated by the computer system’s memory
management unit allows for a transparent protection of applications
against Single Event Upsets
Teza II w języku polskim:
Wykorzystanie przerwań generowanych przez jednostkę zarządzania
pamięcią w systemach komputerowych pozwala na przeźroczystą ochronę
aplikacji przed błędami pojedynczymi
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 14 / 34
15. System operacyjny sCore
Architektura wzorowana na
mikrojądrze
Zastosowanie języka C++ i
mechanizmów generycznych
Wielozadaniowość z
wywłaszczaniem
Planista typu Round–Robin
Dwie wersje: pamięć płaska i
pamięć wirtualna
Wsparcie dla architektury IA–32
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 15 / 34
16. Algorytm EDAC Task
Asynchroniczny wątek
systemowy
Ochrona danych tylko do
odczytu
Zaimplementowany w jądrze
systemu sCore
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 16 / 34
18. Wyniki eksperymentu
Eksperyment trwał 18
godzin
9 wykrytych i
skorygowanych błędów
SEU
1 błąd nie wykryty
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 18 / 34
19. Eksperyment w tunelu Linac II
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 19 / 34
20. Komputer w tunelu Linac II
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 20 / 34
21. Wyniki eksperymentu
Eksperyment trwał 23
godziny
4 wykrytych i
skorygowanych błędów
SEU
42 błędy nie wykryte
116585 nie obsłużonych
przerwań
5 restartów systemu (3
wykonane przez
watchdog)
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 21 / 34
22. Algorytmy skanujące aktywnie pamięć — podsumowanie
Zalety
Prosta zasada działania
Łatwa implementacja w systemie
Wady
Niska skuteczność
Ochrona danych tylko do odczytu
Asynchroniczny tryb pracy
Mała skalowalność
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 22 / 34
24. Komputer przemysłowy typu PC–104
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 24 / 34
25. Komputer przemysłowy w tunelu Linac II
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 25 / 34
26. Wyniki eksperymentu
Eksperyment trwał 14
dni i 8 godzin
12186 wykrytych i
skorygowanych błędów
SEU
0 błędów nie wykrytych
0 nie obsłużonych
przerwań
0 restartów systemu
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 26 / 34
28. Algorytm IDI — podsumowanie
Zalety
Przejrzysta zasada działania
Ochrona danych do odczytu i do zapisu
Synchroniczny tryb działania względem odwołań do pamięci
Wysoka skuteczność
Duża wydajność
Elastyczność i skalowalność
Wady
Skomplikowana implementacja w jądrze systemu operacyjnego
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 28 / 34
29. Wnioski wynikające z przeprowadzonych badań
Możliwa jest skuteczna ochrona przed błędami pojedynczymi powszechnie
dostępnych systemów komputerowych za pomocą programowych
algorytmów ochrony pamięci — dowód tezy I
Niestandardowa konfiguracja i wykorzystanie jednostki zarządzania
pamięcią (MMU) pozwoliło na przeźroczystą ochronę aplikacji przed
błędami pojedynczymi — dowód tezy II
Unikalne właściwości opracowanego algorytmu IDI pozwalają na jego
zastosowanie w urządzeniach narażonych na występowanie błędów
pojedynczych w pamięci (eksperymenty fizyczne, urządzenia lotnicze i
medyczne)
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 29 / 34
31. Możliwe zastosowania opracowanego algorytmu
Samoloty pasażerskie
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 31 / 34
32. Możliwe zastosowania opracowanego algorytmu
W 2000 roku magazyn Forbes pisze:
It’s ridiculous. I’ve got a $300,000
server that doesn’t work. The thing
should be bullet-proof.
A firma Cisco twierdzi, że:
All future designs that require
highest availability must counter
unavoidable SEUs.
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 32 / 34
33. Podsumowanie przeprowadzonych prac
Opracowanie jądra systemu operacyjnego sCore
Napisanie autorskiego symulatora IARadSim
Implementacja w jądrze sCore algorytmu EDAC Task
Opracowanie i implementacja w jądrze sCore autorskiego algorytmu
Interrupt Driven Immunity (IDI)
Przeprowadzenie szeregu symulacji i badań z wykorzystaniem
IARadSim, izotopu 241 AmBe oraz wewnątrz tunelu akceleratora
Linac II, wykonanie stanowiska badawczego
Autor lub współautor 18 artykułów z prezentowanej tematyki
Best Paper Award — Mixdes 2006
Distinguished Paper Award — OWD 2007
Przyznany został grant promotorski nr N515 011 31/0369
Bartłomiej Świercz (DMCS, PŁ) Publiczna obrona doktoratu Łódź, 27.10.2008 33 / 34