next up previous contents
Next: Suorituskyky Up: Järjestelmän testaus Previous: Tulosten oikeellisuus

Vikasietoisuus

Järjestelmän tulee toipua mahdollisemman monesta virhetilanteesta, sillä järjestelmän suoritusaika on pitkä eikä sitä pitäisi kasvattaa turhan takia. Joten järjestelmä pitää yllä lokitiedostoa, johon kirjataan kaikki tapahtumat ja järjestelmä voidaan käynnistää tämän tiedoston perusteella uudestaan, jolloin laskentaa voidaan jatkaa siitä mihin jäätiin. Lokitiedoston toiminta testataan yksinkertaisesti sammuttamalla järjestelmä ja käynnistämällä uudestaan, jolloin laskennan tulisi jatkua siitä mihin se ennen järjestelmän alasajoa jäi. Järjestelmän ollessa suorituksessa poistetaan yksi laskentayksikkö klusterista. Poistettava laskentayksikkö ei voi olla Master. Järjestelmä ei saa seota tässä tilanteessa vaan sen pitää toipua tapahtuneesta jajatkaa toimintaa normaalisti ja kirjata tapahtunut lokitiedostoon. Laskentayksikkö poistetaan sammuttamalla se. Kun järjestelmän on todettu selvinneen tästä, poistetaan klusterista toinenkin laskentayksikkö ja tutkitaan selviääkö järjestelmä tästä. Uuden laskentayksikön ottaminen mukaan järjestelmän toimintaa vaatii järjestelmän uudelleenkäynnistämisen, jolloin järjestelmä jatkaa laskentaa siitä mihin se lokitiedoston mukaan jäi ennen sammuttamistaan, nyt järjestelmä ottaa mukaan myös lisätyn laskentayksikön.



T Valtteri Rahkonen
2000-04-02