Tutkimusprojektit
Tiedonhallinta
Riippumattomien komponenttien analyysi ja sen laajennukset - Independent component analysis and its extensions
Ajankohta: 4/2003-12/2005
Tutkijat: Aapo Hyvärinen, Patrik Hoyer, Shohei Shimizu, Antti Kerminen, Urs Köster, Jukka Perkiö
Rahoitus: HIIT/BRU, Suomen Akatemia, ulkomaiset säätiöt
Riippumattomien komponenttien analyysi on data-analyysimalli, jossa moniulotteinen mittausdata esitetään kätkettyjen, tilastollisesti riippumattomien komponenttien lineaarisena yhdistelmänä.
Kehitämme menetelmästä uusia, tehokkaampia variantteja esim. signaalien aikakäyttäytymistä ja riippuvuuksia hyödyntäen, sekä sovellamme sitä kausaaliseen analyysiin. Tutkimme myös menetelmän yhteyksiä muihin moniulotteisen data-analyysin malleihin, kuten esim. positiivinen matriisifaktorisaatio ja rakenneyhtälömallit.
Edistynyt data-analyysi näkötutkimukessa - Advanced data analysis in vision research
Ajankohta: 1/2004 - 12/2006
Tutkijat: Ilmari Kurki, Aapo Hyvärinen
Rahoitus: Suomen Akatemia
Kehitämme uusia tapoja analysoida ihmisen näköjärjestelmän suorituskyvystä mitattua dataa. Lähestymistapamme perustuu äskettäin kehitettyyn kokeelliseen paradigmaan, nk. luokittelukuviin. Tämä on yhteistyöprojekti Helsingin yliopiston psykologian laitoksen kanssa.
Kuva- ja videodatan tilastollinen mallintaminen - Statistical modelling of image and video data
Ajankohta: 4/2003- 12/2007
Tutkijat: Aapo Hyvärinen, Jarmo Hurri, Urs Köster, Jussi Lindgren
Rahoitus: HIIT BRU, Suomen Akatemia, HeCSE, ulkomainen säätiö
Kehittämme uusia tilastollisia malleja kuva- ja videodatasta. Mallit ovat hyödyllisiä sekä ihmisen näköjärjestelmän tutkimuksen että tietokonenäön ja kuvankäsittelyn kannalta. Vuonna 2005 kehitimme malleja ennen kaikkea epälineaaristen piirteiden tilastollisista ominaisuuksista.
Probabilistisen induktiivisen logiikkaohjelmoinnin sovellukset - Application of Probabilistic Inductive Logic Programming II (APrIL II)
Ajankohta: Tammikuu 2004 - joulukuu 2006
Tutkijat: Aristides Gionis, Heikki Mannila, Taneli Mielikäinen, Evimaria
Terzi, Panayiotis Tsaparas
Rahoitus: EU
Probabilistinen induktiivinen logiikkaohjelmointi yhdistää probabilistisen mallinnuksen ja induktiivisen logiikkaohjelmoinnin tarjoten yhtenäisen kehikon probabilistis-loogisten mallien
oppimiseksi rakenteisesta datasta.
APrIL II -projektin tavoitteena on tutkia probabilistisen induktiivisen logiikkaohjelmoinnin teoreettista perustaa, kehittää tehokkaita laskennallisia menetelmiä probabilistis-loogisten mallien rakenteiden ja parametrien estimointiin sekä soveltaa kehitettyjä menetelmiä käytännön mallinnusongelmiin, erityisesti bioinformatiikassa. Hankkeeseen osallistuu tutkijoita Freiburgin Albert-Ludwigin yliopistosta, Imperial College of Science, Technology and Medicine:stä, INRIA Rocquencourt:ista, Tietotekniikan tutkimuslaitos HIIT:istä ja Firenzen yliopistosta. Tutkimus Helsingissä keskittyy probabilistisen induktiivisen logiikkaohjelmoinnin algoritmisiin kysymyksiin, erityisesti segmentointiongelmien algoritmiikkaan.
Kontekstin tunnistaminen käyttäjän tilannetiedon louhinnan avulla - Context recognition by user situation data analysis (Context)
Ajankohta: 1/2003-12/2005
Tutkijat: Mika Raento, Kari Laasonen, Renaud Petit, Hannu Toivonen
Rahoitus: Suomen Akatemia
Hankkeessa tutkittiin käyttäjän kontekstin karakterisointia ja analysointia sekä kontekstitiedon soveltamista proaktiivisessa tietojenkäsittelyssä. Projektin tutkimusaiheita ovat mm. kuinka käyttäjä itse mieltää kontekstinsa, kontekstitietoon liittyvä automaattinen päätteleminen sekä kontekstitiedon esittäminen käyttäjälle. Projekti toteutettiin yhteistyössä HIITin tavoitetutkimusyksikön käyttäjäkokemusryhmän kanssa.
Projektissa tuotettiin ContextPhone-ohjelmisto, joka kerää, tallettaa ja välittää kontekstitietoa tavallisissa S60-matkapuhelimissa. Se osaa myös automaattisesti annotoida kamerapuhelimella otetut kuvat kontekstitiedoilla ja siirtää ne esimerkiksi www-sivulle. Ohjelmiston avulla projektissa on tutkittu kontekstitiedon välittämisen vaikutusta käyttäjien kommunikointiin sekä kehitetty menetelmiä käyttäjän solupohjaisen sijaintitiedon jalostamiseksi havainnollisempaan muotoon. ContextPhone-ohjelmistoa on käytetty tutkimustyökaluna mm. Berkeleyssä, MIT:ssa ja Taideteollisessa korkeakoulussa.
Laskennallisia menetelmiä paleontologisen datan analysointiin - Computational methods for the analysis of palaentological data
Ajankohta: 1/2005- 12/2008
Tutkijat: Heikki Mannila, Ella Bingham, Hannes Heikinheimo, Kai Puolamäki, Antti Ukkonen
Rahoitus: Suomen Akatemia, HIIT/BRU
Projektissa kehitetään laskennallisia menetelmiä paleontologisten ja muiden ekologisten aineistojen analyyseja varten. Hankkeessa on kehitetty uusia ajoitusmenetelmiä, jotka perustuvat spektraalijärjestämiseen ja MCMC-menetelmien käyttöön. Aineistoissa olevien virheiden etsintään sovellettiin MCMC:tä käyttävän menetelmän lisäksi ns. aspect Bernoulli -mallia.
Nykynisäkäsaineiston hierarkkista rakennetta tutkittiin levinneisyyteen perustuvilla etäisyysmitoilla, ja hierarkian automaattista oppimista arvioitiin. Projekti on yhteinen Helsingin yliopiston geologian laitoksen kanssa.
Liikkuvan huoltomiehen monikielinen tietämystuki - Mobile and multilingual maintenance man (4M)
Ajankohta: 8/2003-7/2007
Tutkijat: Reeta Kuuskoski, Helena Ahonen-Myka, Damien Beaudrey, Antoine Doucet.
Yhteistyöprojekti, muut tahot: HY/kieliteknologia, HY/käännöstieteiden laitos, TKK/BIT-tutkimuslaitos, TKK/SoberIT/käytettävyysryhmä, TKK Tietämystekniikka, VTT Tietotekniikka Tekes, Fujitsu Services, Nokia Research Center, Nokia Business Infrastructure, Pasanet/Lingsoft, Raha-automaattiyhdistys, Wärtsilä
Projekti kehittää tietämystukijärjestelmää, joka avustaa laitteiden korjauksessa. Järjestelmässä on luonnollista kieltä käyttävä keskustelukomponentti. Tietämys laitteistosta ja ongelmista on talletettu ontologioihin. Ohjeita etsitään myös laitteistodokumentaatiosta, jos vastausta ei ontologioista löydy.
Ensimmäinen kaikki komponentit integroiva prototyyppi valmistui syyskuussa. Vastuullamme oli ontologioita hyödyntävä tiedonhakukomponentti. Lisäksi kehitimme dokumenttien rakenteistamismenetelmiä, esim. menetelmiä dokumentissa olevien toimintaohjeiden tunnistamiseksi. Dokumenttien rakenteistaminen tehostaa reaaliaikaista ongelmanratkaisua.
Laskennallisia menetelmiä nisäkkäiden genomin rakenteen ja funktion analysointiin - New computational techniques for analysing the structural and functional landscape of the mammalian genomes (CompGenome)
Ajankohta: 1/2004- 12/2007
Tutkijat : Heikki Mannila, Aristides Gionis, Niina Haiminen, Jaana Wessman, Mikko Koivisto, Jussi Kollin, Kimmo Palin, Panayiotis Tsaparas
Rahoitus : Suomen Akatemia
Projektissa tutkitaan lajien sisäistä ja välistä geneettistä ja funktionaalista variaatiota. Pyrkimyksenä on mm. monitekijäisten tautien ymmärtäminen. Biologisia teemoja ovat haplotyyppien rakenne, suuren skaalan geneettiset muutokset, fenotyyppien klusterointi ja geeniekpressio. Pääasiallisia laskennallisia teemoja ovat todennäköisyysmallintaminen ja Markovin ketju Monte Carlo -menetelmät, tiedon louhinta ja hahmojen etsintä (engl. pattern discovery) sekä kombinatoriset algoritmit. Hanke on yhteinen Suomen genomikeskuksen, Kansanterveyslaitoksen ja Tukholman Karoliinisen Instituutin kanssa ja kuuluu Suomen Akatemian SYSBIO-ohjelmaan.
Toisena vuonnaan 2005 projektissa jatkettiin genomin segmentointia ja moniulotteisen fenotyyppidatan mallintamista sekä laadittiin uusi populaatioperustainen, laskennallinen haplotyypittämismenetelmä. Näillä tutkimusalueilla saavutettiin etenkin laskennallisessa mielessä kiinnostavia tuloksia.
Induktiiviset kyselyt hahmojen ja mallien louhintaan - Inductive Queries for Mining Patterns and Models (IQ)
Ajankohta: 9/2005 – 8/2008
Tutkijat: Aristides Gionis, Heikki Mannila, Taneli Mielikäinen, Pauli Miettinen, Panayiotis Tsaparas
Rahoitus: EU
Eräs tiedon louhinnan keskeisiä haasteita on yhtenäisen teoreettisen kehikon kehittäminen. Lupaavan lähestymistavan tähän ongelmaan tarjoavat induktiiviset tietokannat, jotka ovat tietokantoja tiedon louhintaan tarjoten deklaratiivisen lähestymistavan data-analyysiin.
IQ -projektissa tutkitaan induktiivisten tietokantojen teoreettista perustaa ja kehitetään induktiivisia tietokantoja erilaisiin data-analyysitehtäviin. Sovelluskohteena ovat biologiset kysymykset.
Projektiin osallistuu tutkijoita Belgiasta (Universiteit Antwerpen), Ranskasta (Institut National des Sciences Appliquées de Lyon), Saksasta (Albert-Ludwigs-Universität Freiburg), Sloveniasta (Institute Josef Stefan) ja Suomesta (Tietotekniikan tutkimuslaitos HIIT).
Skitsofreniaan ja kaksisuuntaiseen mielialahäiriöön liittyvien fenotyyppien klusterointi - Clustering of phenotypic features in schizophrenia and bipolar disorder samples (PhenoClusters)
Ajankohta: 8/2004 - 9/2005
Tutkijat: Heikki Mannila, Jaana Wessman, Mikko Koivisto, Laura Ruotsalainen
Rahoitus: Orion Oyj
Monitekijäisten tautien geneettisen perustan selvittäminen on tärkeää. Kun tautiin liittyviä fenotyyppejä on paljon, datan analysointi on haastavaa. Hankkeessa kehitetään moniulotteisen fenotyyppidatan todennäköisyysmalleja ja klusterointiohjelmia. Menetelmiä sovelletaan skitsofreniaan ja kaksisuuntaiseen mielialahäiriöön liittyvään fenotyyppi- ja genotyyppidataan. Projekti on yhteinen Kansanterveyslaitoksen kanssa.
Vuonna 2005 projektissa valikoitiin joukko kiinnostavimpia klusterointeja, joiden piirteitä tarkasteltiin yksityiskohtaisesti Kansanterveyslaitoksen asiantuntijoiden kanssa. Projektin todettiin onnistuneen: klusterointilähestymistapa aukaisi uusia näkökulmia moniulotteiseen dataan ja paljasti eräitä ennalta tuntemattomia piirteitä, jotka antavat aihetta lisätutkimuksiin.