me@tktl 03/07

Tietojenkäsittelytieteen laitoksen verkkolehti

Etusivu

Tietotekniikan tutkimusta arvioidaan kiireellä

Peruskartasta kielioppiin ja tietojenkäsittelystä suomen kieleen - Antti Leino väitteli

Päiväkirja: Jouni Sirén

Kuulumiset

Summary

Aiemmat numerot

Toimitus

Peruskartasta kielioppiin ja tietojenkäsittelystä suomen kieleen

Antti Leino väitteli

Antti Leino väitteli 2.3. aiheesta "On Toponymic Constructions as an Alternative to Naming Patterns in Describing Finnish Lake Names", eli paikannimikonstruktioiden käyttäminen nimeämismallien sijasta Suomen järvinimistön kuvaamiseen. Väitöskirjassaan Antti käytti laskennallisia menetelmiä nimistöntutkimukseen. Väitöskirja on poikkitieteellinen: assistenttimme Antti aloitti sen tietojenkäsittelytieteen alaan kuuluvana, mutta lopulta se tarkastettiin suomenkielen laitoksella.

Antti valmistui maisteriksi laitokseltamme 1997, ja vaihtoi samoihin aikoihin työpaikkaa yliopiston atk-keskuksesta Kotimaisten kielten tutkimuskeskuksen (Kotus) atk-yksikköön. Siellä ei ollut aikaa tehdä väitöskirjaa, joten 2002 Antti pyysi tutkimusvapaata ja otti yhteyttä Heikki Mannilaan. Käynnistymässä olleesta HIITistä löytyi töitä jatko-opiskelijalle. Pari vuotta myöhemmin Antti vaihtoi pääaineekseen suomen kielen ja sai tktl:lta assistentuurin.

Karonkassa. Käpistelijät lahjoittivat Antille lisää karttoja.

Kuva Pekka Niklander

Tieteiden välissä

Väitöskirjatutkimus liikkuu kolmen alan rajamailla: tietojenkäsittelytieteellisen paikkatiedon louhinnan, nimistöntutkimuksen ja kognitiivisen kielentutkimuksen. Kartalla paikannimet esitetään pisteinä. Data-analyysillä etsittiin aineistosta spatiaalisten pistejoukkojen yhteisesiintymäsääntöjä - eli minkälaisia yhdenmukaisuuksia löytyy siitä, millaiset nimet hakeutuvat toistensa lähelle keskimääräistä useammin.

- Yhdistelin tiedon louhinnan ja spatiaalisen tilastotieteen työkaluista sellaisia, jotka purivat aineistoon. Paikkatietotyökalujen tekeminen nimistön vaihtelun tutkimukseen oli alkuperäinen suunnitelma, mutta työn alussa koetulokset olivat sen verran kiinnostavia, että alkuperäisestä koejärjestelystä tuli varsinainen työ, Antti kertoo.

- Aihe on vaatinut aika laajaa  metodiopiskelua ja aiheuttanut kroonista identiteettikriisiä. Ei tätä olisi saanut tehtyä suomen kielen eikä tietojenkäsittelytieteen putkitutkinnon pohjalta.

Antin väitös osaltaan laajentaa laitoksen tiedon louhinnan karttaa kielitieteisiin.

-Kotuksella alkaa olla niin paljon digitaalisia aineistoja, että ehkä täältäkin löytyy kiinnostusta niihin, Antti toteaa.

Murrealueita Antti, Marko Salmenkivi ja Saara Hyvönen ovatkin tutkineet tiedon louhinnan menetelmien avulla Suomen murteiden sanakirjan aineiston pohjalta. Suomen murteiden karttoja on digitoitu Kanadassa Sheila Embletonin tutkimusryhmässä, joka yhdistää soveltavaa matematiikkaa ja kielitiedettä. Ryhmä on tehnyt vastaavaa työtä myös romaniasta - murteentutkimuksen sovellukset eivät ole kieliriippuvaisia.

Mitä tohtori aikoo tehdä seuraavaksi?

- Minulla on assistentuuri laitoksella vielä yli kaksi vuotta, joten sen ajan voin oikeastaan tehdä ihan mitä huvittaa, Antti naurahtaa.

- Sen jälkeen suunnitelmissa olisi siirtyä takaisin Kotukseen taustavirkaan. Tarkoitus on seuraavan parin vuoden aikana koittaa jatkaa kieliaineistojen louhintaa niin pitkälle, että yhteistyö ei katkea, vaikka lähdenkin taas Kotukseen. Identiteettikriisi jatkuu sikäli, että kummastakaan laitoksesta en mielelläni päästäisi ihan lopullisesti irti.

-    Kotus on myös kieliaineistotalo, jonka yksi keskeinen osaamisalue suhteessa yliopistojen suomen laitoksiin on se, miten sähköisestä aineistosta saa jotain irti, tuore tohtori kertoo.

 

Sanna Kettunen