Suomeksi På svenska In English
Helsingin yliopisto Institutionen för datavetenskap
 

Årsberättelse 2006

Forskningsgruppen Discovery: utvinning av data och länkar

Forskningsgruppen utvecklar nya metoder för datautvinning samt upptäckt av nya mönster och samband. Tyngpunkten ligger på strukturer och heterogena data, som t.ex. grafer och sekvenser. Gruppen tillämpar metoderna på aktuella problem inom bioinformatik, genetik och kontextbaserad beräkning (ubiquitous computing) i samarbete med forskare och företag inom tillämpningsområdena.

Det viktigaste forskningsobjektet är analysen av vägda (biologiska) grafer och sökandet efter samband (projektet Biomine). Som ett resultat av forskningen i sekvenser presenterades användningen av Markov-kedjor (av variabel längd) för haplotypbestämningsproblemet. Gruppen utvecklade också nya begrepp och metoder för genkartläggning, t.ex. TreeDT-metoden som baserar sig på genetiskt motiverade trädstrukturer. Dessa metoder tillämpas i praktiken och de har visat sig vara mycket användbara i samband med hantering av dagens stora datasamlingar. För kontextbaserad beräkning has gruppen utvecklat mjukvaran ContextPhone, som används i forskningsinstitut i hela världen.

Gruppen arbetar både som del av institutionen för datavetenskap och HIIT. Gruppen hör till FDK-enheten.

Kontakperson: Professor Hannu Toivonen

Webbsida: http://www.cs.helsinki.fi/research/discovery

Projekt

Biomine
Context

Publikationer

Eronen, L. & Geerts, F. & Toivonen, H.: HaploRec: efficient and accurate large-scale reconstruction of haplotypes. BMC bioinformatics.London: BioMed Central. 7 (2006) : 542, 38 p. .

Hintsanen, P. & Sevon, P. & Onkamo, P. & Eronen, L. & Toivonen, H.: An empirical comparison of case-control and trio based study designs in high throughput association. Journal of medical genetics. London : British Medical Association. 43 (2006), 617-624.

Muhonen, J. & Toivonen, H.: Closed non-derivable itemsets PKDD 2006 : European Conference on Principles and Practice of Knowledge Discovery in Databases: Knowledge discovery in databases. - Berlin : Springer 2006. p. 601-608.

Sevon, P. & Eronen, L. & Hintsanen, P. & Kulovesi, K. & Toivonen, H.: Link discovery in graphs derived from biological databases. DILS 2006: Data integration in the life sciences. - Berlin: Springer 2006. p. 35-49.

Sevon, P. & Toivonen, H. & Ollikainen, V.: TreeDT : tree pattern mining for gene mapping. IEEE/ACM transactions on computational biology and bioinformatics. New York (NY) : IEEE. 3 (2006) : 2, p. 174-185.