next up previous contents
Next: Pullonkaulojen havaitseminen Up: Vikasietoisuus Previous: Vikasietoisuus

Virhetilanteiden havaitseminen

Koska orientointijärjestelmä on hajautettu useaan eri prosessiin usealle eri koneelle, liittyvät virhetilanteet usein hajautukseen. Prosesseja saattaa kuolla tai koneita kaatuilla kesken laskentaa. Johtuen käytössä olevan MPI-toteutuksesta (mpich), joka ei tue prosessien dynaamista luomista tai pysäyttämistä eikä ole säieturvallinen, virhetilanteet aiheuttavat järjestelmän suorituksen päättymisen. Eli käynnistyksen jälkeen konfiguraatiota ei pystytä muuttamaan, ennen suorituksen päättymistä ilman huomattavasti kehittyneenpää prosessien sisäistä kirjanpitoa. Sisäinen kirjanpito aihauttaa kuitenkin merkittäviä ongelmia ja järjestelmän käynnistys uudella konfiguraatiolla on kohtalaisen pieni operaatio. Mpich huolehtii järjestelmän alasajosta automaattisesti (tappaa kaikki prosessit). Järjestelmä on mahdollista konfiguroida uudestaan ja jatkaa suoritusta keskeytyneestä kohdasta. Lisää hajautusstrategiosta luvussa 8.1.2 ja MPI:istä luvussa 8.1.1.



T Valtteri Rahkonen
2000-04-02