Tiedonhallinnan erikoistumislinja (2005–08)
Huom: Tätä sivua ei kevätlukukauden 2008 jälkeen enää päivitetä. Tiedonhallinnan opetusta annetaan syyslukukaudesta 2008 alkaen Ohjelmistojärjestelmien erikoistumislinjalla (tietokantajärjestelmät) sekä Algoritmien ja koneoppimisen erikoistumislinjalla (tiedon louhinta).
|
Linjan profiili
Tiedonhallinnan erikoistumislinja (entiseltä nimeltään informaatiojärjestelmien erikoistumislinja) on yksi uuden FM-tutkinnon kuudesta erikoistumislinjasta. Linjan opetuksen ja tutkimuksen keskeiset kohteet liittyvät suurten tietomäärien käsittelyyn. Tyypillisiä tiedon organisointimuotoja ovat perinteiset tietokannat sekä rakenteiset esitysmuodot kuten XML. Linjan opetus käsittelee tietokannan hallintaa, tekstien ja dokumenttien hallintaa sekä kieliteknologiaa, tiedonhakua ja tiedon louhintaa. Menetelmät ja tekemisen luonne vaihtelevat:
- tietokannan hallinnan erilaisten ongelmien ratkaisut: tietojen mallintaminen, kyselyiden ja transaktioiden käsittely
- dokumenttirakenteiden kehittäminen: rakenteiset dokumentit
- laajan tietoaineiston sisällön selvittäminen: tiedon louhinta eli tietämyksen muodostaminen aineistosta
Linjan kursseilla oppii luomaan käsitteellisiä ja fyysisiä tietomalleja, valitsemaan ongelmaan parhaiten sopivat tiedonhallintamenetelmät sekä toteuttamaan vaativia tietojärjestelmiä. Syventävissä opinnoissa (laudatur-kursseilla) oppii mm. analysoimaan suuria tietoaineistoja, suunnittelemaan tekstiaineistoja käsitteleviä järjestelmiä sekä suunnittelemaan ja ylläpitämään tietokantajärjestelmiä. Vuosittain vaihtuvat seminaariaiheet laajentavat ja syventävät huomattavasti käsiteltyjen asioiden valikoimaa.
Tutkimus
Linjan tutkimus on keskittynyt tiedon louhintaan sekä dokumenttien hallintaan ja kieliteknologiaan. Näillä alueilla on tehty menetelmäkehitystä ja sovellusprojekteja muun muassa geenitekniikkaan (alttiusgeenien etsintä tapaus-verrokki-aineistoista), bioinformatiikkaan (biotietokantojen louhinta), ekologiaan, proaktiiviseen tietojenkäsittelyyn (kontekstin tunnistaminen käyttäjän tilannetiedon louhinnan avulla) sekä tekstitiedon erilaisiin käyttöalueisiin liittyen (kysymysvastausjärjestelmät, tiedon eristäminen tekstistä, tietämystukijärjestelmät, uutistapahtumien tunnistaminen ja seuraaminen). Menetelmien yleisenä tavoitteena on automatisoida tiedon käsittelyä, suodatusta ja jalostusta sovellusalueen ongelmien ratkaisemiseen. Tietokantojen alueella on tutkittu tietokantarakenteiden ja transaktioiden hallinnan menetelmiä. Tietokantaopetukseen on kehitetty opetusympäristöä, viimeksi verkko-opetukseen perustuen.
Merkittävä osa tutkimusta tapahtuu osana From Data to Knowledge -huippuyksikköä sekä yhteistyössä HIITin perustutkimusyksikön kanssa.
Tutkimusprojektien ja -ryhmien sivuja:
- Data mining in FDK/HIIT
- Biomine: Knowledge discovery in biological databases
- Data mining in genetics
- Context: Context recognition by user situation data analysis
- do·re·mi: Document management, information retrieval, data and text mining
Tutkintovaatimukset
Uudet tutkintovaatimukset
Lukuvuonna 2005–06 opintonsa aloittaneet opiskelevat 1.8.2005 voimaan astuneiden uusien tutkintovaatimusten mukaan.
Luonnontieteiden kandidaatin (LuK) tutkintoon sisältyy kaksi pakollista tiedonhallinnan kurssia: Tietokantojen perusteet (4 op) ja Tietokantasovellus (4 op). Tiedonhallinnan linjalle aikoville suositellaan valinnaisiksi kursseiksi erityisesti seuraavia: XML-metakieli, Digitaalisen median tekniikat, Paikkatiedon käsittely, Kyselykielet
Filosofian maisterin (FM) tutkinnon syventävät opinnot muodostavat tiedonhallinnan erikoistumislinjalla seuraavan kokonaisuuden:
- Tiedon louhinnan menetelmät, 6 op (linjan pakollinen kurssi)
- Tietokannan suunnittelu, 4 op (linjan pakollinen kurssi)
- Valinnaisia tiedonhallinnan syventäviä opintoja 16 op, joiksi
sopivat mm. seuraavat erikoiskurssit:
- Tiedon louhinnan erikoiskurssi (Special course on data mining), 4–6 op
- Tiedonhakumenetelmät (Information retrieval methods), 4–6 op
- Transaktioiden hallinta, 4 op
- Hajautetut tietokannat, 4 op
- Rakenteisten dokumenttien käsittely, 4 op
- Laajojen dokumenttiaineistojen käsittely, 4 op
- Luonnollisen kielen käsittely (Natural language processing), 8 op
- Tietovarastot, 4 op
- XML-tietokannat, 4 op
- Seminaareja, 6 op
- Vapaasti valittavia tietojenkäsittelytieteen syventäviä opintoja (muita kuin seminaareja) 8 op
- Pro gradu -tutkielma, 40 op
- Kypsyysnäyte
Ennen 1.8.2005 opintonsa aloittanut, uusien tutkintovaatimuksien mukaan opiskeleva voi korvata kurssin Tietokannan suunnittelu (4 op) vanhalla kurssilla Tietokannan mallinnus (2 ov) sekä kurssit Transaktioiden hallinta (4 op) ja Hajautetut tietokannat (4 op) vanhalla kurssilla Tietokantarakenteet ja -algoritmit (4 ov).
Linjan syventävävien opintojen pakolliset kurssit on syytä suorittaa ajoissa, mielellään ennen muita syventäviä kursseja. Valinnaisten syventävien kurssien valikoimaa suunnitellessa kannattaa ottaa huomioon pro gradu -tutkielman tarpeet.
Vanhat tutkintovaatimukset
Ennen 1.8.2005 opintonsa aloittaneet voivat suorittaa opintonsa vanhojen (so. vuonna 2004 tai sitä ennen voimaan astuneiden) tutkintovaatimusten mukaisesti 31.7.2008 mennessä. Mikäli tutkinnon valmistuminen tähän määräaikaan mennessä on epätodennäköistä tai jos laudaturopintoja ei ole vielä aloitettu tai sivuaineopintoja puuttuu paljon, on syytä siirtyä opiskelemaan uusien tutkintovaatimusten mukaisesti.
Tietojenkäsittelytieteen cum laude approbatur -oppimäärään sisältyy pakollisina kolme tiedonhallinnan linjan kurssia: Tietokantojen perusteet (2 ov), Tietokannan hallinta (2 ov) ja Tietokantasovellus (2 ov). Kurssia Tietokannan hallinta ei enää luennoida; sen voi korvata uudella kurssilla Kyselykielet. Tiedonhallinnan linjalle aikoville suositellaan valinnaisiksi cum laude -kursseiksi erityisesti seuraavia: Käyttöliittymät, Digitaalisen median tekniikat, XML-metakieli.
Laudatur-oppimäärä muodostuu seuraavasti:
- Tietojenkäsittelytieteen cum laude -oppimäärä, vähintään 46 ov
- Laskennan teoria, 3 ov
- Tietokannan mallinnus, 2 ov (linjan pakollinen kurssi)
- Tietokantarakenteet ja -algoritmit, 4 ov (linjan pakollinen kurssi)
- Muita linjan aihepiiriin liittyviä laudatur-kursseja, vähintään 14 ov
- Seminaareja, vähintään 4 ov
- Pro gradu -tutkielma, 16 ov
- Yhteensä vähintään 95 ov
Kurssia Tietokannan mallinnus (2 ov) ei enää luennoida. Kurssin korvaa uusi kurssi Tietokannan suunnittelu (4 op, 2 ov). Myöskään kurssia Tietokantarakenteet ja -algoritmit ei enää luennoida. Kurssin korvaavat kaksi uutta kurssia: Transaktioiden hallinta (4 op, 2 ov) ja Hajautetut tietokannat (4 op, 2 ov), yhdessä. Pakolliset kurssit voidaan korvata myös aiempien tutkintovaatimusten mukaan suoritetuilla kursseilla Tiedonhallinta I (4 ov) ja Tiedonhallinta II (5 ov). Muista laudatur-kursseista 6 ov tulee olla linjan aihepiiriin liittyviä (14 ov syksystä 2003 lähtien).
Kurssit ja seminaarit
Pakolliset kurssit
Linjan järjestämät pakolliset aineopintokurssit (cum laude -kurssit)
- Tietokantojen perusteet (4 op, 2 ov), sekä vanhoissa että uusissa tutkintovaatimuksissa pakollinen kurssi, luennoidaan joka lukukauden 2. periodissa
- Tietokantasovellusten harjoitustyö (2 ov, 4 op), vanhoissa tutkintovaatimuksissa pakollinen kurssi, järjestetty joka lukukauden molemmissa periodeissa; järjestetään viimeisen kerran syyslukaudella 2005
- Tietokantasovellus (4 op, 2 ov), uusissa tutkintovaatimuksissa pakollinen kurssi, korvaa vanhan kurssin Tietokantasovellusten harjoitustyö; järjestetään kevätlukukaudesta 2006 lähtien joka lukukauden molemmissa periodeissa
- Tietokannan hallinta (2 ov, 4 op), vanhoissa tutkintovaatimuksissa pakollinen kurssi, luennoitu joka lukukausi, luennoidaan viimeisen kerran kevätlukukaudella 2006; kelpaa uusiin tutkintovaatimuksiin siirtyville valinnaiseksi aineopintokurssiksi
Linjan pakolliset syventävät kurssit (laudaturkurssit)
- Tietokannan mallinnus (2 ov), vanhoissa tutkintovaatimuksissa pakollinen kurssi; kurssia ei enää luennoida; kurssin voi korvata suorittamalla kurssin Tietokannan suunnittelu
- Tietokannan suunnittelu (4 op, 2 ov), uusissa tutkintovaatimuksissa pakollinen kurssi, luennoidaan joka syyslukukauden 1. periodissa.
- Tietokantarakenteet ja -algoritmit (4 ov, 8 op), vanhoissa tutkintovaatimuksissa pakollinen kurssi; kurssia ei enää luennoida; kurssin voi korvata suorittamalla kurssit Transaktioiden hallinta ja Hajautetut tietokannat
- Tiedon louhinnan menetelmät (6 op, 3 ov), uusissa tutkintovaatimuksissa pakollinen, vanhoissa valinnainen kurssi, luennoidaan joka syyslukukausi
Linjan valinnaisia kursseja
Kurssien luennointi ei ole aina täysin säännönmukaista, joten alla lueteltuihin luennoimisajankohtiin voi tulla poikkeuksia.
Aineopintokursseja (cum laude -kursseja)
- Digitaalisen median tekniikat (4 op, 2 ov), luennoidaan vuoden tai kahden välein
- XML-metakieli (4 op, 2 ov), luennoidaan vuoden tai kahden välein
- Paikkatiedon käsittely (5 op, 3 ov), luennoitaneen joka toinen vuosi
- Kyselykielet (4 op, 2 ov), luennoitu ensi kerran syksyllä 2006; luennoitaneen seuraavan kerran lukuvuonna 2008–09.
- Muita linjaan sopivia kursseja omasta suuntautumisesta riippuen:
- Käyttöliittymät (4 ov) (ohjelmistotekniikan linja)
- Bioinformatiikan perusteet (3 ov) (bioinformatiikan linja)
- Graafisten käyttöliittymien ohjelmointi (6–10 op, 3–5 ov) (ohjelmistotekniikan linja)
Valinnaisia syventäviä kursseja (laudaturkursseja)
- Special Course on Data Mining) (6 op, 3 ov), luennoidaan ainakin joka toinen vuosi, seuraavan kerran keväällä 2008
- Information Retrieval Methods (Tiedonhakumenetelmät) (6 op, 3 ov), luennoidaan ainakin joka toinen vuosi, luennoitu viimeksi keväällä 2007
- Transaktioiden hallinta (4 op, 2 ov), luennoidaan vuoden tai kahden välein, seuraavan kerran syksyllä 2007
- Hajautetut tietokannat (4 op, 2 ov), järjestetään vuoden tai kahden välein, seuraavan kerran keväällä 2008 harjoituskurssina
- Rakenteisten dokumenttien käsittely (4 op, 2 ov), luennoidaan joka toinen vuosi, seuraavan kerran syksyllä 2007
- Laajojen dokumenttiaineistojen käsittely (4 op, 2 ov), luennoidaan joka toinen vuosi, luennoitu viimeksi keväällä 2006
- Tietovarastot (4 op, 2 ov), luennoidaan joka toinen vuosi, luennoitu viimeksi syksyllä 2006
- Spatial Data Mining (4 op, 2 ov), geoinformatiikan englanninkielisen maisteriohjelman kurssi, luennoidaan toistaiseksi joka vuosi, luennoitu ensi kerran keväällä 2007
- XML-tietokannat (4 op, 2 ov), luennoidaan joka toinen vuosi, luennoitu ensi kerran syksyllä 2006
- Natural Language Processing (8 op, 4 ov), luennoitaneen ainakin joka toinen vuosi, seuraavan kerran keväällä 2008
- Linear Algebra Methods for Data Mining (4 op, 2 ov), luennoitu viimeksi keväällä 2007
- Sanojen merkitykset (4 op, 2 ov), ei enää luennoida
- Tekstiaineistojen tilastosuureita (4 op, 2 ov), ei enää luennoida
- Muita linjaan sopivia kursseja oman suuntautumisen mukaan:
- Algoritmien suunnittelu ja analyysi (5 ov) (algoritmilinja)
- Koneoppiminen (5 ov) (algoritmilinja)
- Tekoäly (4 ov) (älykkäiden järjestelmien linja)
- Kolme käsitettä: todennäköisyys (3 ov), informaatio (4 ov), päätöksenteko (3 ov) (älykkäiden järjestelmien linja)
- Käyttöliittymät II (3 ov), (ohjelmistotekniikan linja)
- Laskennallinen biologia (3 ov) (bioinformatiikan sv)
- Tietokoneavusteiset oppimisympäristöt (4 ov) (opettajan sv)
Esimerkkejä satunnaisemmista kursseista
- Paikkatiedon hallinta ja analyysi (3 ov, kevät 2005)
- Proaktiivisen tietotekniikan kollokvio: tietääkö kone, mitä haluat seuraavaksi? (1 ov, cum laude -kurssi, kevät 2005)
- Puukieliopit (3 ov, syksy 2004)
- Context-aware computing (3 ov, syksy 2003)
- Hajautettujen transaktioiden hallinta (3 ov, Oscu-etäopetuskurssi, syksy 2003)
Seminaareja
Seminaariaiheet vaihtelevat lukukausittain. Seuraavassa linjan kuluvana lukuvuonna tai viime vuosina järjestämiä seminaareja. (Lisäksi monet muutkin laitoksen seminaarit sopivat hyvin tiedonhallintaan.)
Kevät 2007
- Sähköisen liiketoiminnan standardit ja teknologiat
- Tietojenkäsittelytieteen jatko-opiskelijaseminaari
- Yksityisyyden säilyttävä tiedon louhinta
- Language Technology and Applications
Syksy 2006
- Information Retrieval Research Seminar
- Rakenteisten dokumenttien hallinta
- Tiedon louhinta verkkodatasta
- Tietokannat nyt
- WWW-sovellusten kehittäminen
Kevät 2006
- Klusterointimenetelmät
- Digitaalinen viestintä
- Seminar on temporal and spatial data analysis
Syksy 2005
- Information extraction from text
- Tiedonhallinta semanttisessa webissä
- Tietokannat nyt
- Tietokantojen kyselynoptimointi
Kevät 2005
- Luonnollisen kielen jäsentäminen
- Samanaikaisuudenhallinta
- Seminar on property testing
- Tietojenkäsittelytieteen tohtoriseminaari
- Verkko-opetusteknologiat
Syksy 2004
- Hypermediajärjestelmät
- Modernit tiedonhakumenetelmät
- Research seminar on computational data analysis
- Tiedon louhinta webissä
- Tekstianalyysimenetelmät
Kevät 2004
- Tietovirtajärjestelmät
- Kieliteknologia ja semantiikka
- Opetusteknologian tietokantasovellukset
- Toiminnanohjausjärjestelmät
- Laskennallisen data-analyysin seminaari
- Research themes in context-aware computing
Syksy 2003
- Tiedonhakumenetelmien klassikoita
- Tiedon louhinta biomolekyyliaineistoista
- Sähköinen hallinto
Pro gradu -tutkielmat
Usein aiheen lähtökohtana on tekijän oma kiinnostuksen kohde tai tekijän työpaikan ehdottama aihepiiri. Aiheen tukena tulisi olla linjan syventävissä opinnoissa (laudaturkursseilla tai seminaareissa) hankitut pohjatiedot aihepiiristä, mikä on syytä ottaa ajoissa huomioon syventävien opintojen suunnittelussa.
Linjan pro gradu -tutkielmia ohjaavat ensisijaisesti linjan väitelleet tai lisensiaattitutkimuksen tehneet opettajat ja tutkijat. Mahdollisten ohjaajien kanssa kannattaa keskustella aiheideastaan hyvissä ajoin. Aiheesta sovitaan alustavasti ohjaajan kanssa, ja gradun aihemäärittely hyväksytetään alustavasti hänellä. Jos omaa ideaa ei tunnu löytyvän, mutta gradu on tulossa ajankohtaiseksi, kannattaa käydä linjavastaavan kanssa keskustelemassa. Gradun aiheesta on ennen työn aloittamista käytävä joka tapauksessa sopimassa linjavastaavan kanssa.
Graduaiheen hyväksymistä haettaessa mukaan otetaan:
- aihemäärittely kahtena kappaleena
- gradulomake kahtena kappaleena
- opintorekisteriote kahtena kappaleena (epävirallinen riittää)
- työpaikan aiheen yhteydessä työnantajan lausunto (allekirjoitettuna, yksi kappale)
Tarkempia ohjeita annetaan mm. TKTL:n ohjeissa gradun aloittamiseen ja tekoon.
Sivuaineet
Vanhat tutkintovaatimukset
Vuonna 2003 tai sitä ennen voimaan astuneissa tutkintovaatimuksissa pakollisena sivuaineena on matematiikka (approbatur-oppimäärä, 15 ov). Lukuvuoden 2004–05 tutkintovaatimuksissa tämän vaihtoehtona on menetelmätieteiden approbatur-oppimäärä (20 ov).
Muut sivuaineet jakaantuvat laajaan valikoimaan ja ne kannattaa valita suunniteltua erikoistumista ja pro gradu -tutkielmaa tukeviksi. Tyypillisiä valintoja ovat esimerkiksi tilastotiede, kognitiotiede, kieliteknologia, tuotantotalous (TKK), kansantaloustiede tai kauppatieteelliset aineet (HKKK).
Uudet tutkintovaatimukset
Syksyllä 2005 voimaan astuneiden uusien tutkintovaatimusten mukaisen LuK-tutkinnon tulee sisältää joko (1) matematiikan tai menetelmätieteiden 50 op:n perusopintokokonaisuus tai (2) matematiikan tai menetelmätieteiden 30 op:n perusopintokokonaisuus sekä jonkin toisen sivuaineen 25 op:n perusopintokokonaisuus.
Menetelmätieteiden 30 op:n opintokokonaisuuden tulee sisältää vähintään 10 op:n verran matematiikan opintoja ja vähintään 10 op:n verran tilastotieteen opintoja; vastaavasti 50 op:n kokonaisuudessa vähimmäisvaatimus kummassakin aineessa on 20 op. Kaikissa tapauksissa sivuaineopintoihin tulee sisältyä kurssi Johdatus diskreettiin matematiikkaan.
Muut sivuaineet jakaantuvat laajaan valikoimaan ja ne kannattaa valita suunniteltua erikoistumista ja pro gradu -tutkielmaa tukeviksi. Tyypillisiä valintoja ovat esimerkiksi tilastotiede, kognitiotiede, kieliteknologia, tuotantotalous (TKK), kansantaloustiede tai kauppatieteelliset aineet (HKKK).
Laudatur-merkintä, muut opinnot -merkintä, valmistuminen
Opiskelija noudattaa oletusarvoisesti opintojensa aloitusvuonna määriteltyjä tutkintovaatimuksia. Halutessaan hän voi ottaa käyttöön jotkut myöhemmin voimaan tulleet tutkintovaatimukset. Tutkintovaatimukset löytyvät mm. verkossa olevista vanhoista opinto-oppaista.
Tutkintovaatimuksia sovelletaan siten, että niiden kaikki osat — niin pääaine, sivuaineet kuin muutkin opinnot — on suoritettava samojen tutkintovaatimusten eli saman opinto-oppaan mukaisina. Kurssien korvaavuuksia on koottu omalle sivulleen.
Laudatur-merkinnän antaa linjavastaava. Laudatur-merkintää haettaessa tarvitaan: (1) opintorekisteriote (verkko-ote riittää) sekä (2) laudatur-oppimäärän opintokokonaisuuslomake ja yleensä myös (3) muiden opintojen opintokokonaisuuslomake valmiiksi täytettyinä. Opintokokonaisuuslomakkeet löytyvät html-muotoisina laitoksen sivulta Opintojen ja opintokokonaisuuksien suoritusmerkinnät. Täytetyt lomakkeet ja opintorekisteriote (verkko-ote) riittää lähettää linjavastaavalle sähköpostitse.
Huom: Vanhan tutkintojärjestelmän mukaan valmistuvan on haettava merkinnät viimeistään 27.6.2008.
Huom: Pro gradu -tutkielma sisältyy laudaturiin, joten gradun tarkastuslausunnon on oltava valmiina ennen kuin laudaturmerkinnän voi saada. Laudaturmerkintä viedään rekisteriin sen jälkeen, kun laitoksen johtoryhmä on gradun hyväksynyt.
Valmistuminen: kun kaikki tutkintoon tulevat opintokokonaisuusmerkinnät on haettu (mukaan lukien muut opinnot, ks. yllä), riittää kun tiedekuntaan jättää FM:n tutkintotodistuspyynnön. Katso tiedekunnan ohjeita valmistumisesta.
Linjaväkeä
- Helena Ahonen-Myka, FT, professori (mvs).
- Ella Bingham, TkT, tutkija (HIIT BRU).
- Antoine Doucet, FT, tutkija.
- Satu Eloranta, FL, assistentti.
- Hannu Erkiö, FT, dosentti, lehtori.
- Aristides Gionis, PhD, lehtori (virasta vapaa lukuvuoden 2006–07), tutkija.
- Oskari Heinonen, FM, assistentti.
- Saara Hyvönen, TkT, tutkija (HIIT BRU).
- Teija Kujala, FM, amanuenssi, tutkija (HIIT BRU).
- Harri Laine, FL, lehtori.
- Miro Lehtonen, FT, tohtoriassistentti.
- Antti Leino, FT, assistentti.
- Greger Lindén, FT, ohjelmakoordinaattori (HIIT BRU).
- Jan Lindström, FT, tutkija.
- Heikki Mannila, FT, akatemiaprofessori (HIIT BRU), professori (TKK).
- Pirjo Moen, FT, yliopistonlehtori.
- Jussi Piitulainen, FM, tutkija.
- Juha Puustjärvi, FT, professori (LTKK), dosentti.
- Marko Salmenkivi, FT, TM, dosentti, yliopistonlehtori.
- Seppo Sippu, FT, ap.professori, linjavastaava.
- Reijo Sivén, FK, suunnittelija.
- Hannu Toivonen, FT, professori, laitoksen johtaja.
- Roman Yangarber, PhD, professori.
Linjavastaava:
Lukuvuonna 2007–08 tiedonhallinnan linjavastaavana toimii Seppo Sippu.