Complex Systems Computation Research Group - CoSCo
CoSCo-tutkimusryhmässä tarkastellaan kompleksisten järjestelmien laskennallisia ongelmia, erityisesti ennustusongelmia ja mallinvalintaan liittyviä kysymyksiä. Ryhmän tutkimusalueita ovat mm. stokastinen mallinnus ja data-analyysi, Bayes-verkot ja niihin liittyvät todennäköisyysmalliperheet kuten äärelliset sekajakaumamallit, Bayes-moniverkot ja diskreetti pääkomponenttianalyysi, informaatioteoreettiset lähestymistavat päättelyyn (MDL) ja stokastiset optimointialgoritmit, kuten simuloitu jäähdytys ja geneettiset algoritmit.
Tutkimustyössä on vahva perustutkimuksellinen ulottuvuus, ja tutkimus on tietojenkäsittelytieteen, informaatioteorian ja matemaattisen tilastotieteen leikkauspisteessä. Lisäksi ryhmän tutkimustyöhön sisältyy vahvasti soveltava ulottuvuus. Menetelmiin liittyviä teoreettisia tuloksia on hyödynnetty monitieteisesti mm. sosiaalitieteissä, kriminologiassa, ekologiassa, lääketieteessä, historiantutkimuksessa ja teollisissa sovelluksissa.
Ryhmän viimeaikaisia tutkimuskohteita ovat olleet mm. Internet-personointi, vaalikoneet, seuraavan sukupolven hakukoneteknologiat ja paikkasidonnaiset palvelut. Tutkimusryhmän jäsenillä on laaja osaamisprofiili teoreettisesta tutkimuksesta huippuohjelmointiin. Konkreettisena esimerkkinä ryhmän laaja-alaisesta osaamisesta voidaan pitää ryhmän kehittämää ja ylläpitämää ainutlaatuista B-Course -data-analyysipalvelinta ( http://b-course.hiit.fi ), jossa on sovellettu viimeisimpiä tutkimustuloksia todennäköisyysmallinnuksen alalta. Palvelimella on ollut kolmen vuoden aikana yli 15 000 käyttäjää maailmanlaajuisesti, ja analyysipalvelun tuloksia on hyödynnetty mm. HIV-rokotteiden kehityksessä, lintujen laulun analysoimisessa ja geeniaineistojen tutkimuksessa.
Vuonna 2006 ryhmän tutkimuksen merkittävänä painopistealueena jatkui seuraavan sukupolven hakuteknologioihin liittyvä työ (lisätietoja: http://cosco.hiit.fi/search ). CoSCo-ryhmä pyrkiikin kansainvälisesti merkittäväksi tekijäksi aihepiiriin liittyvän avoimen lähdekoodin kehityksessä, ja mm. toimii koordinaattorina laajassa aihetta tutkivassa EU-hankkeessa (Alvis, lisätietoja: http://cosco.hiit.fi/search/alvis.html ). Ryhmän jäsenet myös perustivat ja organisoivat aihepiiriin liittyvän kokouksen "International Workshop on Intelligent Information Access" (IIIA-2006), jonka ansiosta Helsinkiin saatiin heinäkuussa 2006 useita alan tutkimuksen huippunimiä ( http://cosco.hiit.fi/search/IIIA2006/ ).
Tutkimusryhmän teoreettisempia aktiviteetteja edustaa portaali www.mdl-research.org , jonka ylläpitoa ryhmä jatkoi vuonna 2006. Tämä sivusto pyrkii kokoamaan yhteen Jorma Rissasen kehittämään Minimum Description Length (MDL) -teoriaan liittyvän tutkimuksen tärkeimmät tulokset. Rissanen työskentelee myös itse aktiivisesti yhdessä ryhmän jäsenten kanssa. MDL-teoriaan liittyvästä työstä hänelle myönnettiin vuonna 2006 arvostettu tieteellinen kunnianosoitus, Kolmogorov-mitali.
Yhteyshenkilö: professori Petri Myllymäki
Kotisivu: http://cosco.hiit.fi/
Projektit
Probabilistiset menetelmät mikrosirudata-analyysissä (PMMA)
MDL-teoriaan perustuvat kuvasignaalien kohinanpoistomenetelmät (KUKOT)
Scalable Probabilistic Methods for the Next Generation Search Engine (Prose)
Superpeer Semantic Search Engine (Alvis)
Search-Ina-Box (SIB)
Cognitively Inspired Visual Interfaces for Representing Multidimensional Information (CIVI)
Roos, T. & Grünwald, P. & Myllymäki, P. & Tirri, H: Generalization to Unseen Cases. Pp. 1129-1136 in Advances in Neural Information Processing Systems 18 (NIPS 05), edited by Y. Weiss, B.Schölkopf and J. Platt. MIT Press, Cambridge , MA , 2006.
Silander, T. & Myllymäki, P: A Simple Approach for Finding the Globally Optimal Bayesian Network Structure. Pp. 445-452 in Proceedings of the 22nd Conference on Uncertainty in Artificial Intelligence (UAI-2006), edited by R. Dechter and T. Richardson. AUAI Press, 2006.
Buntine, W. & Jakulin, A: Discrete Components Analysis. Pp. 1-33 in Subspace, Latent Structure and Feature Selection Techniques, edited by C. Saunders, M. Grobelnik, S. Gunn and J. Shawe-Taylor. Springer-Verlag 2006.
Roos, T. & Heikkilä, T. & Myllymäki, P: A Compression-Based Method for Stemmatic Analysis. Pp. 805-806 in Proceedings of the 17th European Conference on Artificial Intelligence (ECAI 2006), edited by G. Brewka, S. Coradeschi, A. Perini and P. Traverso. IOS Press, 2006.
Jaeger, M. & Nielsen, J. & Silander, T: Learning probabilistic decision graphs. International Journal of Approximate Reasoning, 42 (2006), 84-100.