Next: Pullonkaulojen havaitseminen
Up: Vikasietoisuus
Previous: Vikasietoisuus
Koska orientointijärjestelmä on hajautettu useaan eri prosessiin usealle
eri koneelle, liittyvät virhetilanteet usein hajautukseen. Prosesseja
saattaa kuolla tai koneita kaatuilla kesken laskentaa. Johtuen käytössä
olevan MPI-toteutuksesta (mpich), joka ei tue prosessien
dynaamista luomista tai pysäyttämistä eikä ole säieturvallinen,
virhetilanteet aiheuttavat järjestelmän suorituksen päättymisen.
Eli käynnistyksen jälkeen konfiguraatiota ei pystytä muuttamaan,
ennen suorituksen päättymistä ilman huomattavasti kehittyneenpää
prosessien sisäistä kirjanpitoa. Sisäinen kirjanpito aihauttaa
kuitenkin merkittäviä ongelmia
ja järjestelmän käynnistys uudella konfiguraatiolla on kohtalaisen
pieni operaatio.
Mpich huolehtii järjestelmän alasajosta automaattisesti (tappaa
kaikki prosessit). Järjestelmä on mahdollista konfiguroida uudestaan
ja jatkaa suoritusta keskeytyneestä kohdasta. Lisää hajautusstrategiosta
luvussa 8.1.2 ja MPI:istä luvussa 8.1.1.
T Valtteri Rahkonen
2000-04-02