Discovery-tutkimusryhmä: tiedon ja linkkien louhinta
Tutkimusryhmä kehittää uusia menetelmiä tiedon louhintaan ja uusien hahmojen ja yhteyksien havaitsemiseen. Painopiste on rakenteisissa ja heterogeenisissä aineistoissa, esimerkiksi verkoissa ja sekvensseissä. Ryhmä soveltaa menetelmiä bioinformatiikan, genetiikan ja kontekstitietoisen laskennan ajankohtaisiin ongelmiin yhdessä sovellusalueitten tutkijoiden ja yritysten kanssa.
Tärkein tutkimuskohde on painotettujen (biologisten) verkkojen analysointi ja yhteyksien löytäminen (Biomine-projekti).Sekvensseihin liittyvänä tuloksena esiteltiin (vaihtuva-asteisten) Markovin ketjujen käytön haplotyyppausongelmassa. Kehitettiin myös uusia käsitteitä ja menetelmiä geenikartoitukseen, esimerkiksi geneettisesti motivoituihin puuhahmoihin perustuva TreeDT-menetelmä. Näitä menetelmiä sovelletaan käytäntöön, ja ne ovat osoittautuneet erittäin hyödyllisiksi nykyaikaisten suurten aineistojen käsittelyssä. Kontekstitietoista laskentaa varten ryhmässä on kehitetty ContextPhone-ohjelmisto, joka on maailmanlaajuisessa käytössä tutkimuslaitoksissa.
Tutkimusryhmä toimii sekä tietojenkäsittelytieteen laitoksen että HIITin alaisuudessa. Ryhmä kuuluu FDK-huippuyksikköön.
Kontaktihenkilö: Professor Hannu Toivonen
Kotisivu: http://www.cs.helsinki.fi/research/discovery
Projektit
Biomine
Context
Julkaisuja
Eronen, L. & Geerts, F. & Toivonen, H.: HaploRec: efficient and accurate large-scale reconstruction of haplotypes. BMC bioinformatics.London: BioMed Central. 7 (2006) : 542, 38 p..
Hintsanen, P. & Sevon, P. & Onkamo, P. & Eronen, L. & Toivonen, H.: An empirical comparison of case-control and trio based study designs in high throughput association. Journal of medical genetics. London : British Medical Association. 43 (2006), 617-624.
Muhonen, J. & Toivonen, H.: Closed non-derivable itemsets PKDD 2006 : European Conference on Principles and Practice of Knowledge Discovery in Databases: Knowledge discovery in databases. - Berlin : Springer 2006. p. 601-608.
Sevon, P. & Eronen, L. & Hintsanen, P. & Kulovesi, K. & Toivonen, H.: Link discovery in graphs derived from biological databases. DILS 2006: Data integration in the life sciences. - Berlin : Springer 2006. p. 35-49.
Sevon, P. & Toivonen, H. & Ollikainen, V.: TreeDT : tree pattern mining for gene mapping. IEEE/ACM transactions on computational biology and bioinformatics. New York (NY) : IEEE. 3 (2006) : 2, p. 174-185.