Tilastollista bioinformatiikkatiedon louhintaa
Ryhmä kehittää koneoppimismenetelmiä tiedon louhintaan, informaation visualisointiin ja tilastolliseen mallitukseen. Koneoppimisella tarkoitetaan tässä joustavia malleja, joita voidaan käyttää useissa sovelluksissa.
Menetelmiä kehitetään bioinformatiikan ja tiedonhaun projekteissa, joissa ryhmä tekee yhteistyötä sovellusalan tutkimusryhmien kanssa. Sovellukset toimivat uusien menetelmien testitapauksina, ja menetelmät puolestaan ratkovat sovellusalan ongelmia.
Ryhmän tutkimuksen tämänhetkisiä painopisteitä ovat diskriminatiivinen generatiivinen mallitus, tiedonlähteiden yhdistäminen mallittamalla niiden riippuvuuksia, ohjattu ohjaamaton oppiminen, ja mallit jotka määrittelevät ja erottavat "relevantteja" signaaleja aineistoista.
Tutkimusryhmä toimii sekä Helsingin yliopiston että Teknillisen korkeakoulun tietojenkäsittelytieteen laitoksilla.
Yhteyshenkilö : professori Samuel Kaski
Kotisivu : http://www.cis.hut.fi/projects/mi/
Valittuja julkaisuja
A. Klami, S. Kaski: Local Dependent Components. In Zoubin Ghahramani (Ed.), Proceedings of the 24th International Conference on Machine Learning (ICML 2007), pp. 425-433. Omni Press, 2007.
M. Oja, J. Peltonen, J. Blomberg, S. Kaski: Methods for estimating human endogenous retrovirus activities from EST databases. BMC Bioinformatics, 8(Suppl 2):S11, 2007.
J. Venna. S. Kaski: Comparison of visualization methods for an atlas of gene expression data sets. Information Visualization, 6:139-154, 2007.