Next: Suorituskyky
Up: Järjestelmän testaus
Previous: Tulosten oikeellisuus
Järjestelmän tulee toipua mahdollisemman monesta virhetilanteesta, sillä järjestelmän suoritusaika on pitkä eikä sitä pitäisi kasvattaa turhan takia.
Joten järjestelmä pitää yllä lokitiedostoa, johon kirjataan kaikki tapahtumat ja järjestelmä voidaan käynnistää tämän tiedoston perusteella uudestaan, jolloin
laskentaa voidaan jatkaa siitä mihin jäätiin. Lokitiedoston toiminta testataan yksinkertaisesti sammuttamalla järjestelmä ja käynnistämällä uudestaan,
jolloin laskennan tulisi jatkua siitä mihin se ennen järjestelmän alasajoa jäi.
Järjestelmän ollessa suorituksessa poistetaan yksi laskentayksikkö klusterista. Poistettava laskentayksikkö ei voi olla Master. Järjestelmä ei saa seota
tässä tilanteessa vaan sen pitää toipua tapahtuneesta jajatkaa toimintaa normaalisti ja kirjata tapahtunut lokitiedostoon. Laskentayksikkö poistetaan
sammuttamalla se. Kun järjestelmän on todettu selvinneen tästä, poistetaan klusterista toinenkin laskentayksikkö ja tutkitaan selviääkö järjestelmä tästä.
Uuden laskentayksikön ottaminen mukaan järjestelmän toimintaa vaatii järjestelmän uudelleenkäynnistämisen, jolloin järjestelmä jatkaa laskentaa siitä
mihin se lokitiedoston mukaan jäi ennen sammuttamistaan, nyt järjestelmä ottaa mukaan myös lisätyn laskentayksikön.
T Valtteri Rahkonen
2000-04-02