me@tktl 05/07

Tietojenkäsittelytieteen laitoksen verkkolehti

Etusivu

Vaarako vaanisi meitä? Exactumin pelastussuunnitelma valmistuu

Teemu Roosin väitöskirjassa on monipuolisia sovelluksia

Pasi Sarolahden väitöskirjassa pyritään kohti nopeampaa Internetiä

Kuulumiset

Kasvot

Summary

Aiemmat numerot

Toimitus

Teemu Roosin väitöskirjassa on monipuolisia sovelluksia

Teemu Roos väittelee 9.6. kello otsikolla Statistical and Information-Theoretic Methods for Data-Analysis (Tilastollisia ja informaatioteoreettisia data-analyysimenetelmiä). Väitöskirja koostuu artikkeleista, ja siinä data-analyysin ongelmia lähestytään kolmesta näkökulmasta: tilastollisen oppimisen teoria (engl. statistical learning theory), Bayes-menetelmät sekä informaatioteoreettinen lyhimmän kuvauspituuden periaate (minimum description length (MDL) principle).

Kun oli edetty onnitteluihin, väittelijää jo hymyilytti.

Teemu tuli syksyllä 1995 opiskelemaan tietojenkäsittelytiedettä laitoksellemme.

-  Olin kiinnostunut tietokoneista ja ohjelmoinnista. Kotiin tuli Spectrum ZX ja sitä naputtelin kovasti.

Jatko-opintojen aloittaminen oli Teemulle selvä asia kun gradu valmistui.

-  Puolivälissä opintoja olin muutaman vuoden ns. oikeissa töissä ja ajattelin tekeväni niitä isona. Kuitenkin yliopiston meininki tuntui kivemmalta, ja sitä voi jatkaa ikuisesti, Teemu naurahtaa.

Silloin CoSCo-ryhmää johtanut professori Henry Tirri tarjosi töitä, ja Teemu alkoi tehdä paikannusmenetelmiä kännyköihin. Väitöskirjaan asti päätyi yksi artikkeli, joka on peräisin tästä projektista.

CoSCosta löytyivät myös väitöskirjan ohjaajat Henry Tirri, Petri Myllymäki ja Jorma Rissanen.

- Jorma on MDL:n keksijänä ollut suuri apu väitöskirjan tekemisessä. MDL:ää käsittelee väitöskirjasta noin puolet.

Artikkeleista koostuvassa väitöskirjassa on useampi osa. Ensimmäisessä käsitellään tilastollisen oppimisen teorian puitteissa mahdollisuutta tehdä induktiivisia päätelmiä, jotka koskevat toistaiseksi kokonaan havaitsemattomia tapauksia, sekä lineaarisen mallin oppimista vain osittain havaitusta datasta. Jälkimmäinen mahdollistaa tehokkaan radioaaltojen etenemisen mallintamisen, mikä helpottaa mm. mobiililaitteiden paikannusta. Väitöksen toisessa osassa osoitetaan läheinen yhteys ns. Bayes-verkkoluokittelijoiden ja logistisen regression välillä, ja näiden kahden parhaita puolia yhdistelemällä johdetaan uusi tehokkaiden luokittelualgoritmien perhe.

Viimeisessä osassa sovelletaan MDL-periaatetta kahteen erityyppiseen ongelmaan: Ensiksi pyritään rekonstruoimaan useina erilaisina kappaleina esiintyvän tekstin syntyhistoria, missä aineistona on Pyhän Henrikin latinankielisen pyhimyslegendan n. 50 erilaista tekstiversiota. Toisena ongelmana tutkitaan digitaalisten signaalien, kuten digikuvien, laadun parantamista kohinaa vähentämällä. Mahdollisuus käyttää alun perin huonolaatuista signaalia on hyödyllinen mm. lääketieteellisissä kuvantamissovelluksissa.

Miten käpistelijä päätyi tutkimaan Pyhän Henrikin legendan versioiden leviämistä?

- Olen aina ollut huono sanomaan, että ei minulla ole aikaa miettiä tätä asiaa, vaan innostun uusista jutuista. Pyhää Henrikiä olen tehnyt, koska se tuntui kiinnostavalta.

Teemu tekee yhteistyötä historian dosentti Tuomas Heikkilän kanssa. Heikkilä tarvitsi taannoin apua tietojenkäsittelyyn liittyvissä kysymyksissä, ja otti yhteyttä Teemun kustokseen Petri Myllymäkeen. Nyt Teemu toimii ainoana tietojenkäsittelytieteen edustajana humanistien joukossa – ja tuntee itsensä joskus hieman ulkopuoliseksi.

Pyhän Henrikin tutkiminen jatkuu ensi syksynä projektirahoituksella, ja samalla kartoitetaan Kansalliskirjastossa muita soveltuvia tekstejä. Toisen puolen työajastaan Teemu toimii yliopistonlehtorina vetäen kurssia Kolme käsitettä: informaatio.

Teemu Roos väitteli 9.6.2007 aiheesta "Statistical and Information-Theoretic Methods for Data-Analysis" (Tilastollisia ja informaatioteoreettisia data-analyysimenetelmiä). Vastaväittäjänä oli professori Alon Orlitsky, University of California, San Diego, ja kustoksena professori Petri Myllymäki.

Sanna Kettunen