H E L S I N G I N Y L I O P I S T O
T I E T O J E N K Ä S I T T E L Y T I E T E E N L A I T O S |
Päivä Keskiviikkona, 18. kesäkuuta 1997 Aika kello 10 Paikka Teollisuuskatu 23, Auditorio (1.krs)
[ Abstract in English , Abstrakt på svenska ]Väitöskirjassa esitetään kaksi menetelmää rakenteisten dokumenttien muunnoksiin.
Monet dokumentit ovat rakenteisia. Tyypillisiä esimerkkejä ovat sanakirjat, puhelinluettelot, kirjeet, käyttöohjeet, jne. Esim. sanakirja koostuu sana-artikkeleista jotka edelleen koostuvat mm. hakusanasta, taivutusmuotojen selityksistä ja esimerkeistä. Tätä usein hierarkkista tai puumuotoista rakennetta voidaan kuvata täsmällisesti rakennekuvauksilla, n.k. kontekstivapailla kieliopeilla.
Toisaalta, datamuunnokset ovat tietokonesovellusten tyypillinen osa. Esim. tekstinkäsittelyjärjestelmät ja taulukkolaskentaohjelmat käyttävät kaikki omaa esitystapaansa tietojen tallettamiseen. Jos dokumentti on kirjoitettu järjestelmällä X, sitä ei voi katsoa tekstinkäsittely- järjestelmässä Y tai taulukkolaskentaohjelmassa Z. Ratkaisu on tiedon konvertoinnissa eli muunnoksessa.
Muunnosohjelman toteuttaminen voi olla työläs tehtävä. Voimme kuitenkin formaalisti kuvata muunnosta ja esim. käyttää muunnosgenerattoria hyväksi. Muunnosgeneraattori tuottaa meille deklaratiivisen kuvauksen avulla valmiin muunnosohjelman.
Väitöskirjassa tarkastellaan ja kuvataan tällaista muunnosgeneraattoria. Muunnoksen toteuttaja, eli ohjelmoija, kuvaa muunnokseen liittyvät esitystavat n.k. kontekstivapailla kieliopeilla ja puumuunnostekniikalla. Generaattori tukee aikaisempien kuvausten uudelleenkäyttöä. Kun tiettyä esitystapaa on kerran määritetty, sitä voidaan käyttää uudelleen eri muunnosten kuvauksissa joissa se edustaa joko lähtö- tai tulosesitystapaa. Generaattori takaa myös että tuotettu dokumentti seuraa annettua kielioppia.
Rakenteisten dokumenttien muunnosongelma on osittain ratkaistu dokumenttien esitystapoja kuvailevalla standardilla SGML (Standard Generalized Markup Language). Tarvitsemme kuitenkin muunnoksia jos haluamme esittää dokumenttia eri välineissä, esim. paperilla, tietokannassa tai kuvaruudulla, tai jos haluamme esittää dokumentista vain osan, esim. johdannon tai kaikkien sisällysluettelon.
Väitöskirjan toisessa osassa kuvataan muunnoskieltä joka sopii tällaisten SGML-dokumenttien muunnosten toteuttamiseen. Kielen avulla ohjelmoija kuvaa muunnosta deklaratiivisella tavalla. Myös SGML-muunnoskieli perustuu puumuunnostekniikkaan.
Sekä muunnosgeneraattori että SGML-muunnoskieli on toteutettu UNIX- käyttöjärjestelmässä. Järjestelmien toteutus osoittaa että sopivat dokumenttimuunnokset saadaan aikaan tietojenkäsittelytieteen teorioiden perustekniikoilla.