Yliopiston etusivulle Suomeksi På svenska In English
Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Vuosikertomus 2005

Complex Systems Computation Research Group - CoSCo

CoSCo-tutkimusryhmässä tarkastellaan kompleksisten järjestelmien laskennallisia ongelmia, erityisesti ennustusongelmia ja mallinvalintaan liittyviä kysymyksiä. Ryhmän tutkimusalueita ovat mm. stokastinen mallinnus ja data-analyysi, Bayes-verkot ja niihin liittyvät todennäköisyysmalliperheet kuten äärelliset sekajakaumamallit, Bayes-moniverkot ja diskreetti pääkomponenttianalyysi, informaatioteoreettiset lähestymistavat päättelyyn (MDL) ja stokastiset optimointialgoritmit kuten simuloitu jäähdytys ja geneettiset algoritmit.

Tutkimustyössä on vahva perustutkimuksellinen ulottuvuus, ja tutkimus on tietojenkäsittelytieteen, informaatioteorian ja matemaattisen tilastotieteen leikkauspisteessä. Lisäksi ryhmän tutkimustyöhön sisältyy vahvasti soveltava ulottuvuus. Menetelmiin liittyviä teoreettisia tuloksia sovelletaan monitieteisesti mm. sosiaalitieteissä, kriminologiassa, ekologiassa, lääketieteessä ja teollisissa sovelluksissa.

Ryhmän viimeaikaisia tutkimuskohteita ovat olleet Internet-personointi, avaruusluotainten vikadiagnostiikka, seuraavan sukupolven hakukoneteknologiat ja paikkasidonnaiset palvelut.
Tutkimusryhmän jäsenillä on laaja osaamisprofiili teoreettisesta tutkimuksesta huippuohjelmointiin. Konkreettisena esimerkkinä ryhmän laaja-alaisesta osaamisesta voidaan pitää ryhmän kehittämää ja ylläpitämää ainutlaatuista B-Course -data-analyysipalvelinta ( http://b-course.hiit.fi ), jossa on sovellettu viimeisimpiä tutkimustuloksia todennäköisyysmallintamisen alalta. Palvelimella on ollut kolmen vuoden aikana yli 15000 käyttäjää maailmanlaajuisesti, ja analyysipalvelun tuloksia on hyödynnetty mm. HIV-rokotteiden kehityksessä, lintujen laulun analysoimisessa ja geeniaineistojen tutkimuksessa.

Vuonna 2005 ryhmän tutkimuksen merkittävä painopistealue liittyi seuraavan sukupolven hakuteknologioihin (lisätietoja: http://cosco.hiit.fi/search ). CoSCo-ryhmä pyrkiikin kansainvälisesti merkittäväksi tekijäksi aihepiiriin liittyvän avoimen lähdekoodin kehityksessä, ja mm. toimii koordinaattorina laajassa aihetta tutkivassa EU-hankkeessa (Alvis, lisätietoja: http://cosco.hiit.fi/search/alvis.html ).

Tutkimusryhmän teoreettisempia aktiviteetteja edustaa portaali www.mdl-research.org , jonka ylläpitoa ryhmä jatkoi vuonna 2005. Tämä sivusto pyrkii kokoamaan yhteen Jorma Rissasen kehittämään Minimum Description Length (MDL) -teoriaan liittyvän tutkimuksen tärkeimmät tulokset. Rissanen työskentelee myös itse aktiivisesti yhdessä ryhmän jäsenten kanssa.

CoSCo toimii HIIT-tutkimuslaitoksessa, ja ryhmän tieteellisen työn todettiin tuoreessa HIITin tieteellisen neuvottelukunnan arvioinnissa olevan kansainvälistä huipputasoa. Ryhmällä on erinomaiset kansainväliset tutkimusyhteydet maailman johtaviin todennäköisyysmallintamisen ryhmiin, ja ryhmä tekee aktiivista yhteistyötä useiden ulkomaisten huippututkijoiden kanssa.

Yhteyshenkilö: professori Petri Myllymäki

Kotisivu: http://cosco.hiit.fi/

Julkaisuja

Roos T. & Wettig H. & Grünwald P. & Myllymäki P. & Tirri, H.
On Discriminative Bayesian Network Classifiers and Logistic Regression. Machine Learning 59:3, pp. 267-296.

Kontkanen P. & Myllymäki P. & Buntine W. & Rissanen J. & Tirri, H.
An MDL Framework for Data Clustering. In Advances in Minimum Description Length: Theory and Applications, edited by P. Grünwald, I.J. Myung and M. Pitt. The MIT Press, 2005.

Buntine W.
Open Source Search: A Data Mining Platform. SIGIR Forum, June 2005.

Perkiö J & Tuulos V. & Buntine W. & Tirri, H.
Multi-Faceted Information Retrieval System for Large Scale Email Archives. In Proceedings of the IEEE/WIC/ACM Conference on Web Intelligence (WI 2005).

Miettinen M & Nokelainen P. & Kurhila J. & Silander T. & Tirri, H.
EDUFORM - A Tool for Creating Adaptive Questionnaires. International Journal on E-Learning, Vol. 4 (2005), No. 3, 365-373.

Projektit

Probabilistiset menetelmät mikrosirudata-analyysissä (PMMA)

Proactive Information Retrieval by Adaptive Models of Users' Attention and Interests (Prima)

Minimum Description Length Modeling in Computer Science and Statistics (Minos)

Scalable Probabilistic Methods for the Next Generation Search Engine (Prose)

Superpeer Semantic Search Engine (Alvis)

Search-Ina-Box (SIB)

Cognitively Inspired Visual Interfaces for Representing Multidimensional Information (CIVI)

Probabilistiset menetelmät mikrosirudata-analyysissä (PMMA)

Kansainväliset vierailut

Vierailut ryhmään:

Guo Hang
Tsinghua University, Kiina, 1.11.04-30.4.05

Ramakrishna Thanniru
IIT Guwarati, Intia, 1.5.-31.7.05

Simon Lacoste-Julien
UC Berkeley, USA, 7.8.-27.8.05

Vierailut ryhmästä

Vladimir Poroshin
Tsinghua University, Kiina, 1.9.-4.10.05

Teemu Roos
CWI-instituutti, Alankomaat, 28.2.-26.4.2005