Suomeksi På svenska In English
Helsingin yliopisto Institutionen för datavetenskap
 

Årsberättelse 2005

Complex Systems Computation Research Group) – CoSCo

Forskningsgruppen CoSCo studerar beräkningsfrågor som rör komplexa system, särskilt förutsägelser och frågor som rör modellval. Gruppens forskningsområden inbegriper stokastisk modellering och dataanalys, Bayes-nätverk och diskret huvudkomponentanalys, informationsteoretiska infallsvinklar på inferens (MDL) och stokastiska optimeringsalgoritmer som t.ex. simulerad aducering (simulated annealing) och genetiska algoritmer.

Forskningsarbetet har en fast ankring i grundforskning, och kombinerar datavetenskap, informationsteori och matematisk statistik. Därtill är gruppen starkt inriktad på tillämpning av forskningen. De teoretiska resultaten inom metodiken tillämpas mångvetenskapligt inom t.ex. socialvetenskaper, kriminologi, ekologi, medicin samt industriella tillämpningar.

På senare tid har personaliserad service på Internet, diagnostik för rymdsonder, teknik för nästa generations sökmotorer och positionsmedvetna serviceformer varit föremål för forskning inom gruppen.
Forskningsgruppens medlemmar har en vid kunskapsprofil, från teoretisk forskning till utmärkta programmeringskunskaper. Som ett konkret exempel på det breda kunskapsunderlaget i gruppen kan man nämna den unika dataanalysservern B-Course ( http://b-course.hiit.fi ) som gruppen utvecklat och underhåller. Med servern kan man använda de senaste forskningsresultaten inom sannolikhetsmodellering. Under tre år har servern haft över 15 000 användare i hela världen, och resultaten av analystjänsten har använts till bl.a. utveckling av ett HIV-vaccin, analys av fågelsång och forskning i gendata.

År 2004 blev sökteknologier för nästa generation ett av de mest betydande forskningsområden för gruppen (se http://cosco.hiit.fi/search ). CoSCo-gruppen har som målsättning att bli en central operatör i utvecklingen av öppen källkod för detta område, och fungerar bl.a. som koordinator för ett brett EU-projekt på området som startades år 2004 (Alvis, se http://cosco.hiit.fi/search/alvis.html ).

De mera teoretiska aktiviteterna hos gruppen representeras av servern www.mdl-research.org , som gruppen fortsatte att underhålla år 2005. Denna webbsajt strävar efter att samla de viktigaste forskningsresultaten om teorin om Minimum Description Length (MDL), som Jorma Rissanen utvecklat. Rissanen själv arbetar också aktivt med medlemmar i forskningsgruppen.

CoSCo fungerar vid HIIT-forskningsinstitutet, och i den färska utvärderingen gjord av HIITs vetenskapliga råd kan gruppens vetenskapliga arbete klassificeras på en hög nivå internationellt sett. Gruppen har utmärkta internationella forskningskontakter till de ledande forskningsgrupperna inom probabilitetsmodellering, och gruppen samarbetar aktivt med många internationella toppnamn.

Kontaktperson: professor Petri Myllymäki

Websida: http://cosco.hiit.fi/

Publikationer

Roos T. & Wettig H. & Grünwald P. & Myllymäki P. & Tirri, H.
On Discriminative Bayesian Network Classifiers and Logistic Regression. Machine Learning 59:3, pp. 267-296.

Kontkanen P. & Myllymäki P. & Buntine W. & Rissanen J. & Tirri, H.
An MDL Framework for Data Clustering. In Advances in Minimum Description Length: Theory and Applications, edited by P. Grünwald, I.J. Myung and M. Pitt. The MIT Press, 2005.

Buntine W.
Open Source Search: A Data Mining Platform. SIGIR Forum, June 2005.

Perkiö J & Tuulos V. & Buntine W. & Tirri, H.
Multi-Faceted Information Retrieval System for Large Scale Email Archives. In Proceedings of the IEEE/WIC/ACM Conference on Web Intelligence (WI 2005).

Miettinen M & Nokelainen P. & Kurhila J. & Silander T. & Tirri, H.
EDUFORM - A Tool for Creating Adaptive Questionnaires. International Journal on E-Learning, Vol. 4 (2005), No. 3, 365-373.


Forskningsprojekt

  • Probabilistiska metoder inom dataanalys av mikrochips (PMMA)
  • Proactive Information Retrieval by Adaptive Models of Users' Attention and Interests (Prima)
  • Minimum Description Length Modeling in Computer Science and Statistics (Minos)
  • Scalable Probabilistic Methods for the Next Generation Search Engine (Prose)
  • Superpeer Semantic Search Engine (Alvis)
  • Search-Ina-Box (SIB)
  • Cognitively Inspired Visual Interfaces for Representing Multidimensional Information (CIVI)


Internationella besök

Besök till gruppen:

Guo Hang, Tsinghua University, Kina, 1.11 04-30.4 05

Ramakrishna Thanniru, IIT Guwarati, Indien, 1.5-31.7 05

Simon Lacoste-Julien, UC Berkeley, USA, 7.8-27.8 05


Besök från gruppen

Vladimir Poroshin: Tsinghua University, Kina, 1.9-4.10 05

Teemu Roos: CWI-institutet, Nederländerna, 28.2-26.4 2005