Tutkimusprojektit
Bioinformatiikka
Genomisia työkaluja ja menetelmiä geenien ilmentymätekijöiden sitoumaspesifiteetin määrittämiseen - Advanced genomics instruments, technology and methods fordetermination of transcription factor binding specificities; applications for identification of genes predisposing to colorectal cancer (REGULATORY GENOMICS)
Ajankohta: 9/2004-9/2008
Tutkijat: Kimmo Palin, Cinzia Pizzi, Esko Ukkonen (lisäksi 6 muuta ryhmää 4 Euroopan maasta)
Rahoitus: EU
Ihmisen genomin sekvensointi ja geneettisen koodin selvittäminen ovat mahdollistaneet nopean edistymisen nisäkkäiden geenien tunnistamisessa. Kuitenkin geenien ilmentymisestä ja sen vaihtelua säätelevistä molekyylisistä mekanismeista tiedetään vain vähän. Tämä johtuu suurelta osalta puutteellisesta käsityksestä 'toisesta geneettisestä koodista' - ilmentymätekijöiden sitoumaspesifiteeteistä. Projektissa pyritään kehittämään uusia genomisia työkaluja ja menetelmiä ilmentymätekijöiden sitoumaspesifiteetin määrittämiseen. Näitä työkaluja tullaan käyttämään peräsuolen syöpään altistavien geenisäätelyyn vaikuttavien yhden nukleotidin monimuotoisuuksien (SNP) ja useille onkogeenisille ilmentymätekijöille yhteisten geenien tunnistamiseen.
Projektissa on kehitetty Enhancer Element Locator (EEL) ohjelmisto, jota on käytetty ilmentymätekijöiden kohdegeenien tunnistamiseen koko genomissa. Ohjelman ennusteet on varmistettu laboratoriokokeilla ja julkaistu arvovaltaisessa biologian alan lehdessä (CELL 13.1.06)
Eurooppalainen genomiannotaatioverkosto - A European Network of Genome Annotation (BIOSAPIENS)
Ajankohta: 1/2004-12/2008
Tutkijat: Kimmo Palin, Juha Kärkkäinen, Esa Pitkänen, Pasi Rastas, Esko Ukkonen (yhteensä 21 instituuttia Euroopassa)
Rahoitus: EU
Eurooppalainen genomiannotaatioverkosto BIOSAPIENS pyrkii annotoimaan ihmisen genomista toiminnallisia paikkoja. Annotoitavat kohdat löydetään sekä kokeellisin että laskennallisin menetelmin. Tähän tutkimuksen huippuverkostoon kuuluu yhteensä 21 itsenäistä instituuttia eri Euroopan maista ja yhtenä verkoston tärkeimmistä tavoitteista on koordinoida eri laboratorioissa tehtävävää tutkimusta, jotta Euroopan tutkimusresurssit saataisiin tehokkaaseen käyttöön. Verkosto järjestää pieniä työkokokouksia sekä kursseja nimellä "Eurooppalainen Bioinformatiikkakoulu". Verkoston piirissä luodut genomiannotaatiot ovat julkisesti ja maksutta saatavilla hajautetun annotaatiojärjestelmän (DAS) kautta.
Projektissa julkaistiin ennustettuja geenien ilmentymistä vahvistavia elementtejä (Enhancer Elements) koko ihmisen genomin laajuudelta. Elementit jaetaan laitokselle asennetun annotaatiopalvelimen kautta. Laitoksen työpakettiin kuuluvat kumppanit tapasivat minikonferenssissa Berliinissä maaliskuussa.
Hiivan systeemibiologia - Yeast systems biology (YEASTSYS)
Ajankohta: 1/2004-12/2005
Tutkijat: Esa Pitkänen, Pekko Parikka, Markus Heinonen, Arto Åkerlund, Ari Rantanen, Esko Ukkonen
Rahoitus: Tekes
YEASTSYS on Helsingin yliopiston tietojenkäsittelytieteen laitoksen, Valtion teknillisen tutkimuskeskuksen sekä useiden yrityspartnereiden välinen yhteistyöprojekti. Tekes rahoittaa projektia osana NeoBio-tutkimusohjelmaa. YEASTSYS-projektissa tuotteistetaan tutkimusryhmässä aiemmin kehitettyjä laskennallisia solun metabolian mallinnusmenetelmiä www-sovelluksiksi.
Vuonna 2005 projektissa kehitettiin ohjelma, jolla voidaan etsiä haluttujen aineenvaihduntatuotteiden tuotantoa kasvattavia muunnoksia solun metaboliaan. Lisäksi kehitettiin ohjelma metaboliamallin laadinnassa käytetyn biokemiallisen sanaston ristiriitaisuuksien selvittämiseen. Molemmat ohjelmat toteutettiin osaksi www-portaalia, joka tarjoaa ohjelmiin yhtenäisen käyttöliittymän.
Fysiologian säätelyn systeemibiologinen analyysi - Experimental and computational analysis of physiological regulation (SYSFYS)
Ajankohta: 1/2004-12/2007
Tutkijat: Juho Rousu, Esko Ukkonen, Ari Rantanen, Esa Pitkänen, Markus Heinonen
Rahoitus: Suomen Akatemia, Systeemibiologian ja bioinformatiikan tutkimusohjelma (SYSBIO)
Helsingin yliopiston tietojenkäsittelytieteen laitoksen, biotekniikan instituutin sekä VTT:n muodostaman SYSFYS-tutkimuskonsortion tavoite on kehittää ja soveltaa edistyneitä kokeellisia ja laskennallisia menetelmiä.
Vuonna 2005 tietojenkäsittelytieteen laitoksella jatkettiin solun aineenvaihdunnan mallintamista. Aineenvaihduntareaktioiden nopeuksia estimoivaa laskennallista menetelmää kehitettiin hyödyntämään kallista ja vaikeasti tuotettavaa ns. isotooppileimausdataa aiempaa tehokkaammin [1]. Lisäksi kehitettiin automaattinen koesuunnittelumenetelmä, jonka avulla mittaukset voidaan kohdentaa laskennan kannalta informatiivisimpiin aineenvaihduntatuotteisiin [2]. Isotooppileimausdatan tuottamisen helpottamiseksi projektissa jatkettiin tandemmassaspektrometrin tuottamien metaboliittifragmenttien tunnistamis- ja analysointimenetelmien kehittämistä aiempaa automaattisemmiksi [3]. Aineenvaihduntaverkkojen rakenteiden analysointia projektissa kehitettyjen, aineenvaihdunnan erityispiirteet paremmin huomioonottavien etäisyysmittojen avulla jatkettiin [4]. Uutena avauksena projektissa aloitettiin tutkimus ydinfunktiopohjaisten samankaltaisuusmittojen kehittämiseksi entsyymeille. Jatkossa tavoitteena on hyödyntää mittoja aineenvaihduntaverkkojen rekonstruktiossa ja entsyymien toiminnan ennustamisessa.
Kehittyneitä genomiikkainstrumentteja, teknologiaa ja menetelmiä lmentymätekijöiden sitoumaspesifiteettien määrittämiseen; sovelluksia peräsuolen syöpään. - Advanced genomics instruments, technology and methods for determination of transcription factor binding specificities; applications for identification of genes
Ajankohta: 9/2004-9/2008
Tutkijat: Kimmo Palin, Cinzia Pizzi, Esko Ukkonen (lisäksi 6 muuta ryhmää 4 Euroopan maasta)
Rahoitus : EU
Ihmisen genomin sekvensointi ja geneettisen koodin selvittäminen ovat mahdollistaneet nopean edistymisen nisäkkäiden geenien tunnistamisessa. Kuitenkin geenien ilmentymisestä ja sen vaihtelua säätelevistä molekyylisistä mekanismeista tiedetään vain vähän. Tämä johtuu suurelta osalta puuttellisesta käsityksestä 'toisesta geneettisestä koodista' - ilmentymätekijöiden sitoumaspesifiteeteistä. Projektissa pyritään kehittämään uusia genomisia työkaluja ja menetelmiä ilmentymätekijöiden sitoumaspesifiteetin määrittämiseen. Näitä työkaluja tullaan käyttämään peräsuolen syöpään altistavien geenisäätelyyn vaikuttavien yhden nukleotidin monimuotoisuuksien (SNP) ja useille onkogeenisille ilmentymätekijöille yhteisten geenien tunnistamiseen.
Projektissa on kehitetty Enhancer Element Locator (EEL) ohjelmisto, jota on käytetty ilmentymätekijöiden kohdegeenien tunnistamiseen koko genomissa. Ohjelman ennusteet on varmistettu laboratoriokokeilla ja julkaistu arvovaltaisessa biologian alan lehdessä (CELL 13.1.06)
Infektiot ja ihmisen genomin alkuperä. Ihmisen endogeeniset retrovirukset, terveys ja sairaudet.
Ajankohta: 1/2003 – 12/2006
Tutkijat: Merja Oja, Samuel Kaski
Rahoitus : Suomen Akatemia
Projektissa tutkitaan vuorovaikutusta virusparasiittien, symbioottien ja ihmisisännän välillä. Eläinten ja kasvien genomeihin on tunkeutunut transposoneja, joista retrovirussekvenssejä on suuri osa. Projektista saatava tieto on tärkeää sekä pitemmällä aikavälillä, ihmisten tulevaisuuden ymmärtämiseksi, että myös lyhyemmällä aikavälillä sairausmekanismien ymmärtämiseksi ja mahdollisten geenihoitojen kehittämiseksi. Projektissa kehitetään bioinformatiikan menetelmiä, joilla voidaan löytää retrovirussekvenssejä ihmisgenomista ja luonnehtia niitä. Löydöksiä yhdistetään sekvenssien ilmenemisdataan. Ohjatuilla koneoppimistekniikoilla pyritään löytämään virussekvenssejä ja ohjaamattomilla data-analyysi- ja tiedon louhintatekniikoilla pyritään luonnehtimaan sekvenssien ominaisuuksia. Ihmisgenomin retrotransposonisisällöstä luodaan tietokanta ja se yhdistetään tietoon transposonien ilmenemisestä eri kudoksissa.
Yksi ensimmäisistä askelista ihmisen endogeenisten retrovirusten (Human Endogenous Retrovirus, HERV) toiminnan ymmärtämisessä on luokitella ne perheiksi. Olemme tutkineet HERV-perheiden suhteita ja etsineet uusia perheitä uudella itseorganisoivan kartan (Self- Organizing Map, SOM) tyypillä, joka sopii ei-vektoriarvioisille aineistoille. Luokittelimme ja visualisoimme 3661 HERV sekvenssiä.
SOM-perustaista analyysiä täydennettiin estimaateilla tulosten luotettavuudesta. Uutta luotettavuuden visualisointimenetelmää käytettiin näyttämään mitkä visualisoitujen HERV-karttojen osat ovat luotettavia ja mitkä eivät. Löytyneiden kiinnostavien HERV-ryhmien luotettavuus verifioitiin vielä SOM:lle soveltuvalla bootstrap- menetelmällä. Biologisina tuloksina löydettiin täysin uusi joukko nk. epsilonretroviruksia, ja kolmen aiemmin tunnetun retrovirusperheen suhteet saatiin selvitettyä. Kaksi niistä saattaa olla peräisin samasta esi-isästä.
Viitteet:
Merja Oja, Göran O. Sperber, Jonas Blomberg, and Samuel Kaski. Self- organizing map-based discovery and visualization of human endogenous retroviral sequence groups. International Journal of Neural Systems, 15(3):163--179, 2005.
Metaboliadynamiikan ja geeniekspression säätelyn systeemisiä malleja - Systemic models for metabolic dynamics and regulation of gene expression
Ajankohta: 1/2004 - 4/2006
Tutkijat: Janne Sinkkonen, Tapio Rinnet, Samuel Kaski
Rahoitus:
Projektissa kehitetään uusia laskennallisia menetelmiä geenien säätelyverkkojen mallitukseen, sovelletaan niitä hiivan systeemibiologiassa, ja integroidaan ne analyysityökaluihin. Erityisesti mallitetaan stressireaktion osuutta geeninpoistomutaatiokokeissa sekä hiivan säätelyproteiinien vaikutusta stressireaktiossa.
Projektissa on sovellettu uutta, tutkimusryhmässä kehitettyä laskennallisesti hyvin yksinkertaista menetelmää, jolla voidaan hakea useille tietoaineistoille yhteiset piirteet. Menetelmää on sovellettu erottamaan hiivan stressireaktio muusta hiivan toiminnasta, mikä on tärkeää mm. pyrittäessä ymmärtämään geeninpoistokokeiden vaikutusta hiivan metaboliaan. Kanoniseen korrelaatioanalyysiin perustuva menetelmä on yleiskäyttöinen, ja sille on odotettavissa myös muita sovelluskohteita. Projektissa on kehitetty ohjelmistototeutus, joka integroidaan yhteistyökumppanin ohjelmistoalustaan.
Lisäksi projektissa on mallitettu geenien säätelyä stressireaktiossa yhdistämällä säätelytekijöiden sitoutumisaineisto hiivan geenien ilmenemisaineistoihin, ja löydetty uusia hypoteeseja geenien säätelyvuorovaikutuksiksi. Myös näistä menetelmistä projektissa kehitetään ohjelmistototeutus.
Viitteet:
Nikkilä, Roos, Savia, Kaski: Exploratory Modeling of Yeast Stress Response and its Regulation with gCCA and Associative Clustering, International Journal of Neural Systems, vol. 15, No. 4, 2005.
Samuel Kaski and Janne Nikkilä. Of mice and men and yeast, and dependency exploration. CSC news, Information Technology for Science in Finland , 4,24--26, 2005.
Samuel Kaski, Janne Nikkilä, Eerika Savia, and Christophe Roos. Discriminative clustering of yeast stress response. In Udo Seiffert, Lakhmi Jain, and Patric Schweizer, editors, Bioinformatics using Computational Intelligence Paradigms, pages 75--92. Springer, Berlin , 2005.
Alttiusgeenien etsintä tapaus-verrokki-aineistoista - Gene mapping and diagnostics: computational tools for new high-throughput laboratory technologies (Altti)
Ajankohta: 3/2003-2/2005
Tutkijat: Hannu Toivonen, Petteri Sevon, Petteri Hintsanen, Lauri Eronen, Kimmo Kulovesi
Rahoitus: Tekes, GeneOS, Jurilab, Cyberell
Bioteknologian laboratoriomenetelmät kehittyvät nopeasti. Uusilla tekniikoilla voidaan tuottaa suuria määriä geneettistä aineistoa esimerkiksi epidemiologisiin tarkoituksiin kootuista tapaus-verrokki-asetelmista. Hankkeessa kehitettiin uusia laskennallisia menetelmiä, joilla laajojenkin aineistojen analysointi on mahdollista. Kehitetyt menetelmät helpottavat ja tehostavat laboratorioiden geneettistä analyysiä.
Projektissa tuotettiin menetelmiä, joilla pystytään haplotyypittämään laajoja tapaus-verrokki-aineistoja sekä paikantamaan sairausassosiaatioita (alttiusgeenejä) näistä aineistoista. Projektissa kehitettiin myös populaatiosimulointimenetelmiä ja -työkaluja, joiden avulla tehtiin monipuolisia vertailuja erilaisista geenikartoitusasetelmista ja -menetelmistä.
Biotietokantojen louhinta (Biomine)
Ajankohta: 3/2005-12/2007
Tutkijat: Hannu Toivonen, Petteri Sevon, Lauri Eronen, Petteri Hintsanen, Kimmo Kulovesi
Rahoitus: Tekes, Jurilab, Biocomputing Platforms, GeneOS (yhteistyökumppaneina lisäksi HY:n lääketieteellisen genetiikan laitos, Karolinska institutet, VTT biotekniikka ja CSC)
Projektissa kehitetään menetelmiä ja työkaluja julkisten biotietokantojen (sekvenssit, proteiinit, interaktiot, artikkelit, jne.) analysointiin. Niiden avulla biotieteilijät voivat rikastaa omia aineistojaan, löytää epäilmeisiä yhteyksiä ja analogioita julkisiin tietokantoihin, ja kohdentaa resurssejaan lupaavimpiin jatkotutkimuskohteisiin. Ensisijaisena sovelluskohteena on geenikartoituksessa löydettyjen kandidaattigeenien tarkempi analysointi.
Projektissa on tutkittu biologisen tiedon esittämistä verkkona, jonka solmut edustavat erityyppisiä käsitteitä (esim. geenejä, proteiineja, kudoksia, fenotyyppejä, solun osia) ja kaaret niiden välisiä yhteyksiä (esim. geenitietokannassa raportoitu yhteys geenin ja biologisen prosessin välillä). Projektissa on kehitetty menetelmiä tällaisten verkkojen analysointiin sekä käsitteiden välisten yhteyksien automaattiseen etsimiseen ja visualisointiin.